Documento Para Buenas Tareas

March 27, 2018 | Author: César Enrique Estrada Gútiérrez | Category: Sampling (Statistics), Random Variable, Variance, Probability, Statistics


Comments



Description

Estadística AplicadaM. I. César Enrique Estrada Gutiérrez Objetivo  Proporcionar las herramientas fundamentales para que sean capaz de organizar, analizar e interpretar adecuadamente los cuadros estadísticos y gráficos; establecer conclusiones a partir de la lectura de los mismos y puedan identificar e interpretar los principales estimadores estadísticos, así como aplicar las técnicas estadísticas adecuadas, establecer conclusiones a partir de resultados, cuya finalidad es la toma de decisiones en aquellas situaciones que se tiene incertidumbre de realidades desconocidas. 3 Temario (I)  Introducción al análisis estadístico  Representaciones estadísticas y análisis de gráficas  Descripción de datos económicos y administrativos (medidas de posición y de variabilidad)  Probabilidad  Introducción a SPSS  Distribución de probabilidades para variables aleatorias discretas 4 Temario (II)  Distribuciones de probabilidad para variables aleatorias continuas  Distribuciones de muestreo e intervalos de confianza para la media  Pruebas de hipótesis referentes al valor de la media de la población  La prueba Chi cuadrada  Análisis de varianza  Análisis de regresión y correlación lineal 5 Bibliografía  Estadística aplicada a la administración y a la economía. Leonard J. Kazmier. Ed. Mc Graw Hill  Estadística con SPSS para Windows. Juan Camacho Rosales. Ed. Alfaomega  SPSS 11 Guía para el análisis de datos. Pardo Merino Antonio y Ruíz Díaz Miguel Angel. Ed Mc Graw Hill  Estadística para la administración y la economía. Berenson y Levin. Ed. Prentice hall  Análisis estadístico con SPSS para windows. Visauta. Ed. Mc Graw Hill 6 Introducción al análisis estadístico  Estadística. Es el conjunto de técnicas que se emplean para la recolección, organización, análisis e interpretación de datos. Los datos pueden ser cuantitativos o cualitativos  Estadística aplicada. Sirve para tomar mejores decisiones a partir de la comprensión de las fuentes de variación y de la detección de patrones 7 Estadística descriptiva  Comprende las técnicas que se emplean para resumir y describir datos numéricos. (gráficas o análisis computacional)  Ejemplo 1  Volumen anual de ventas del año pasado, se puede graficar en barras o lineas 8 Estadística inferencial  Comprende las técnicas con las que con base únicamente en una muestra sometida a observación se toman decisiones sobre una población o proceso estadístico (requiere de probabilidad)  Censo. Procedimiento para la medición de las características de todos los miembros de la población  Estadísticas muestrales. Se refiere a las características medidas de una muestra.  Ejemplo 2  Muestra de focos y revisión de los mismos hasta poder estimarse la probabilidad de falla 9 Variables discretas y continuas  Una variable discreta puede tomar valores observados únicamente en puntos aislados (proceso de conteo).  Una variable continua puede adoptar un valor en cualquier punto fraccionario a lo largo de un intervalo especificado  Ejemplo 3  Discretos. Número de personas por hogar en una colonia  Continuas. Promedio de personas por hogar en una colonia 10 Obtención de datos  Observación directa. El investigador ejerce un control deliberado de algunos o todos los factores que pueden influir en la variable  Ejemplo 4  Una línea de ensamble para detectar elementos defectuosos con base en un criterio  Encuesta. Cuando la información se debe obtener de fuentes individuales mediante entrevistas personales, entrevistas telefónicas o cuestionarios  Ejemplo 5  Nivel de empleo en diferentes empresas mediante una encuesta a cada una de ellas 11 Muestreo aleatorio  Es un tipo de muestreo donde todos los elementos de la población de interés o población objetivo tienen una oportunidad conocida, usualmente igual de ser elegidos  Muestreo simple  Muestreo sistemático  Muestreo estratificado  Muestreo por conglomerados 12 Muestreo aleatorio simple  Es aquel cuyos elementos se seleccionan individualmente de la población objetivo entera con base en el azar  Ejemplo 6  Uso de la función aleatorio de Excel 13 Muestreo sistemático  Es una muestra aleatoria, cuyos elementos se seleccionan de la población de un intervalo uniforme en una lista ordenada  Ejemplo 7  Seleccionar al azar una cuenta bancaria y a partir de ahí elegir las siguientes nueve 14 Muestreo estratificado  Los elementos de la población son primeramente clasificados por el investigador en distintos subgrupos o estratos sobre la base de una o más características importantes  Ejemplo 8  Las elecciones pasadas antes de la votación 15 Muestreo por conglomerados  Es un tipo de muestreo aleatorio donde los elementos de la población ocurren naturalmente en subgrupos  Ejemplo 9  Un analista de un departamento estatal de seguridad económica desea estudiar los índices salariales por hora que se pagan en el área metropolitana, sería complicado hacerlo trabajador por trabajador, en cambio podría obtenerse una lista de las empresas en esa zona. El analista puede tomar una muestra simple de ese conglomerado 16 Problemas  En el área de las mediciones estadísticas, como las representadas por cuestionarios, la confiabilidad se refiere a la consistencia del instrumento de medición y la validez a su precisión. Si un cuestionario ofrece resultados similares tras ser contestado por dos grupos equivalentes de informantes, puede describírsele como confiable. ¿El hecho de que sea confiable garantiza por lo tanto que sea valido? 17 Problemas  En los siguientes tipos de valores, designe variables discretas y variables continuas a) El número de unidades de un artículo en existencia b) Razón de activos circulantes contra pasivos circulantes c) Tonelaje total embarcado d) Cantidad embarcada en unidades e) Volumen de tráfico en una carretera de paga f) Asistencia a la asamblea anual de una compañia 18 Problemas  ¿Cuáles son muestra y cuáles una población? a) El universo completo b) Aplicación de conceptos de probabilidad c) Inspección de cada artículo ensamblado d) Inspección de cada décimo artículo ensamblado 19 Trabajo de investigación  Un auditor desea tomar una muestra aleatoria simple de tamaño 50 de 9 600 cuentas por cobrar de una gran empresa. Las cuentas se enumeran secuencialmente de la 0001 a la 9600. Use la hoja de cálculo Excel para obtener una lista de los 50 números aleatorios requeridos y mándela por correo electrónico 20 Correo electrónico  [email protected][email protected]  Se creará un correo electrónico donde mandaré algunas prácticas y lecturas complementarias  [email protected]  Password essof  Para entrar: http://owa.vivetelmex.com 21 Representaciones estadísticas y análisis de gráficas  Distribución de frecuencias. Es una tabla en la cual se agrupan en clases valores posibles de una variable y donde se registra el número de valores observados correspondientes a cada clase 22 Datos agrupados Son los datos organizados en una distribución de frecuencias  Ejemplo 10 Salario Semanal Numero de trabajadores (f) $ 240-259 260-279 280-299 300-319 320-339 340-359 7 20 33 25 11 4 Total 100 23 Límites nominales  Son los valores incluidos en cada clase  Ejemplo 11 Salario Semanal Numero de trabajadores (f) $ 240-259 260-279 280-299 300-319 320-339 340-359 7 20 33 25 11 4 Total 100 24 Limites exactos de clase  Son los puntos específicos que sirven para separar clases adyacentes en una escala de medición de variables continuas  Ejemplo 12 Salario semanal (límites nominales) Limites exactos de clase $ 240-259 260-279 280-299 300-319 320-339 340-359 $ 239.50-259.50 259.50-279.50 279.50-299.50 299.50-319.50 319.50-339.50 339.50-359.50 25 Punto medio de clase  Se refiere a la suma del límite inferior de la clase con el límite superior dividido entre dos  Ejemplo 13 Salario semanal (límites nominales) Limites exactos de clase Punto medio $ 240-259 260-279 280-299 300-319 320-339 340-359 $ 239.50-259.50 259.50-279.50 279.50-299.50 299.50-319.50 319.50-339.50 339.50-359.50 $249.50 269.50 289.50 309.50 329.50 349.50 26 Intervalo de clase  Se identifica restando el límite exacto de clase inferior del límite exacto de la clase superior  Ejemplo 14  Intervalo de clase=259.50-239.50=20 27 Intervalo aproximado  Ejemplo 15  Intervalo aproximado=(360-240)/6=20 deseadas clases de número agrupados no datos en r menor valo agrupados no datos en r mayor valo aproximado Intervalo ( ¸ ( ¸ ÷ ( ¸ ( ¸ = 28 Histograma de frecuencias  Un histograma es una gráfica de barras de distribución de frecuencias, se acostumbra colocar los límites exactos  Ejemplo 16 0 5 10 15 20 25 30 35 239.50 259.50 279.50 299.50 319.50 339.50 359.50 29 Polígono de frecuencias  Es una gráfica de líneas de distribución de frecuencias, donde suele identificarse el punto medio de cada clase  Ejemplo 17 0 5 10 15 20 25 30 35 229.5 249.5 269.5 289.5 309.5 329.5 349.5 369.5 30 Curva de frecuencias  Es un polígono de frecuencias pero suavizado  Ejemplo 18 0 5 10 15 20 25 30 35 229.5 249.5 269.5 289.5 309.5 329.5 349.5 369.5 31 Curtosis  Platicurtica: plana, con las observaciones distribuidas en forma relativamente pareja  Leptocurtica: afilada, con las observaciones concentradas en un estrecho rango de valores  Mesocurtica: ni plana ni afilada 32 Asimetría  Asimétrica negativa  Simétrica  Asimétrica positiva 33 Frecuencias acumuladas  Identifica el número acumulado de observaciones incluidas bajo el límite exacto superior de cada clase de la distribución  Ejemplo 19 Salario semanal (límites nominales) Limites exactos de clase superior Número de trabajadores Frecuencias acumuladas $ 240-259 260-279 280-299 300-319 320-339 340-359 $ 259.50 279.50 299.50 319.50 339.50 359.50 7 20 33 25 11 4 7 20+7=27 33+27=60 25+60=85 85+11=96 96+4=100 34 Ojiva  Se le denomina a la gráfica de una distribución de frecuencias acumuladas 0 20 40 60 80 100 120 239.5 259.5 279.5 299.5 319.5 339.5 359.5 35 Diagramas circulares  Es una figura en forma de pastel cuyas piezas representan divisiones de una cantidad total, como podría ser la distribución de las ventas de una compañia 65% 5% 5% 25% Principal Nichos En Desarrollo En crecimiento 36 Problemas  En la siguiente tabla se enlistan los tiempos requeridos para la conclusión de una tarea de ensamble para una muestra de 30 empleados que presentaron su solicitud de ascenso a un puesto de ensamble de precisión 10 14 15 13 17 16 12 14 11 13 15 18 9 14 14 9 15 11 13 11 12 10 17 16 12 11 16 12 14 15 37 Problemas (2)  Determine el tamaño del intervalo correspondiente  Intervalo aproximado=(18-9)/5=1.80  Por lo que nuestro intervalo es conveniente cerrarlo a 2.0, así que nuestra distribución de frecuencias quedaría de la siguiente forma Tiempo en min. Número de empleados 9-10 11-12 13-14 15-16 17-18 4 8 8 7 3 Total 30 Emp. 38 Problemas (3)  La tabla con límites exactos y punto medio para cada clase quedaría de la siguiente forma Tiempo en min. Punto medio Número de empleados 8.5-10.5 10.5-12.5 12.5-14.5 14.5-16.5 16.5-18.5 9.5 11.5 13.5 15.5 17.5 4 8 8 7 3 Total 30 Emp. 39 Problemas (4)  Elaborar un histograma en Excel  Elaborar el polígono de frecuencias en Excel  Elaborar la curva de frecuencias en Excel  Describir la curva de frecuencias 40 Problemas (5)  Elaborar una distribución de frecuencias acumuladas y a) Trace la ojiva de porcentajes de esos datos b) ¿En que punto percentil se encontraría un tiempo de ensamble de 15.5 minutos? c) haga una grafica circular de los empleados con respecto a los tiempos 41 Problemas (6) Tiempo, en min. Frecuencia Frecuencia acumulada % acumulado 8.5-10.5 10.5-12.5 12.5-14.5 14.5-16.5 16.5-18.5 4 8 8 7 3 4 12 20 27 30 4*100/30=13.3 12*100/30=40 66.7 90 100  Elaborar una distribución de frecuencias acumuladas 42 Problemas (7)  Ojiva de la frecuencia acumulada y del porcentaje acumulado  El porcentaje percentil en 15.5 minutos es 80  La gráfica circular se muestra 0 20 40 60 80 100 120 8.5 10.5 12.5 14.5 16.5 18.5 13% 27% 27% 23% 10% 8.5 10.5 12.5 14.5 16.5 43 Trabajo de investigación 2  En la tabla siguiente se presentan las cantidades de 40 préstamos personales utilizados para financiar la compra de muebles y aparatos eléctricos. Ordene en una distribución de frecuencias con un total de siete clases a) ¿Cuál sería el intervalo de clase más conveniente? b) Elabore una distribución de frecuencias iniciando con un límite de clase inferior de 300 y aplicando el intervalo de clase del inciso A c) Elabore un histograma de distribución de frecuencias d) Elabore un polígono de frecuencias y una curva de frecuencias e) Describa la curva de frecuencias resultante f) Elabore una distribución de frecuencias acumuladas de la distribución de frecuencias y trace la ojiva con esos datos g) Genere una gráfica circular h) Entregue todos los resultados anteriores en Excel 44 Trabajo de investigación 2 $832 $1100 $456 $1227 615 654 1290 854 652 873 400 2012 1800 666 1616 446 1100 728 1524 780 1300 1388 1000 870 2300 850 1890 600 486 429 835 2000 1700 1423 700 380 1219 800 656 1490 45 Descripción de datos económicos y administrativos (Medidas de posición y de variabilidad)  Medida de posición. Es un valor calculado de un grupo de datos que sirve para describir a éstos de alguna manera 46 Media aritmética  Es la suma de los valores del grupo de datos dividida entre el número de valores muestra una de a descriptiv Media población una de a descriptiv Media n X N X ¿ = ¿ = X µ 47 Media aritmética  Ejemplo 20  Durante los meses del verano, ocho vendedores de una empresa de servicios de calefacción y aire acondicionado vendieron el siguiente número de unidades centrales de aire acondicionado: 8,11,5,14,8,11,16,11 unidades N X 5 . 10 8 84 = = ¿ = µ 48 Media ponderada  Es una media aritmética en donde cada uno de los valores se pondera de acuerdo con su importancia en el grupo general. Las fórmulas de la media ponderada poblacional y muestral son idénticas ¿ ¿ = w wX w w ) ( X ó µ 49 Media ponderada  Ejemplo 21  El margen de utilidad en el último año fiscal de las cuatro líneas de productos de una compañía fabricante de múltiples bienes fue: Línea A=4.2%; Línea B=5.5%; Línea C=7.4%; Línea D=10.1%  Si sacamos la media con la fórmula anterior quedaría  Sin embargo, como las ventas de los cuatro productos no son iguales, este promedio no ponderado es incorrecto % 8 . 6 4 27.2 = = ¿ = N X µ 50 Media ponderada  Así que debemos observar la tabla de ventas  Con respecto a la fórmula Línea de productos Margen de utilidad (X) Ventas (w) wX A B C D 4.2% 5.5% 7.4% 10.1% $30,000,000 20,000,000 5,000,000 3,000,000 1,260,000 1,100,000 370,000 303,000 % 2 . 5 000 , 000 , 58 $ 000 , 033 , 3 $ ) ( = = ¿ ¿ = w wX w µ 51 Mediana  La mediana de un grupo de elementos es el valor del elemento inmediato cuando todos los elementos de un grupo siguen, en términos de valor, un orden ascendente o descendente  De nuestro ejemplo 20, al ordenar en forma ascendente, quedaría 5,8,8,11,11,11,14,16, el valor de la mediana es: X(8/2+1/2)=X4.5=11 | | ) 2 / 1 ( ) 2 / ( + = n X Med 52 Moda  Es el valor que ocurre más frecuentemente en un conjunto de valores . Para nuestro ejemplo anterior, la moda es 11 53 Relación entre media, mediana y moda  Cuando la curva graficada es simétrica, la moda, mediana y media son iguales, cuando es asimétrica positiva, la media siempre es mayor que la mediana y la moda, viceversa en una asimétrica negativa  ¿Cómo sería la curva para nuestro ejemplo anterior? 54 Uso de media, mediana y moda  Con respecto a población  El valor de la moda indica la posición de la mayoría de los valores observados. Puede ser útil como medida descriptiva de un grupo de la población, aunque sólo si existe una moda claramente perceptible  La mediana siempre es una medida excelente para representar el nivel «típico» de los valores  La media también es un valor excelente siempre y cuando la población sea simétrica, por lo que para datos de población la mediana es más significativa 55 Uso de media, mediana y moda  Con respecto a muestras  El valor de la moda no es aceptable  La mediana es más aceptable  La media para éste caso es mejor ya que es más estable  Ejemplo 22  Índices salariales de los 650 empleados de una empresa  Una muestra aleatoria de 100 trabajadores 56 Cuartiles, deciles y percentiles  Es lo mismo que la mediana, sólo que los cuartiles dividen la muestra en cuartos, los deciles en décimos y los percentiles en 100 partes | | | | | | ) 2 / 1 ( ) 100 / 70 ( 70 ) 2 / 1 ( ) 10 / 3 ( 3 ) 2 / 1 ( ) 4 / ( 1 percentil) imo (septuagés decil) (tercer cuartil) (primer + + + = = = n n n X P X D X Q 57 Problemas  En una muestra de las compras de 15 estudiantes en la tienda de una escuela primaria se observan las siguientes cantidades de ventas, dispuestas en orden de magnitud ascendente: $ 1.00, 1.00,2.50, 2.50, 2.50, 3.50, 4.00, 5.30, 9.00, 12.50, 13.50, 24.50, 27.10, 30.90, 41.00 Determine la media, mediana y la moda  Media= $12.05  Mediana= X8= $5.30  Moda= $2.50  Dado que la media es sustancialmente mayor que la mediana, la distribución de valores es claramente asimétrica positiva 58 Problemas  Con base en la siguiente tabla, determine el porcentaje global de artículos defectuosos ensamblados durante la semana muestreada Turno Porcentaje de artículos defectuosos (X) Número de artículos en miles (w) wX 1 2 3 1.1% 1.5% 2.3% 210 120 50 2.31 1.80 1.15 % 4 . 1 380 $ 26 . 5 $ ) ( = = ¿ ¿ = w wX w X 59 Trabajo de investigación (3)  El número de accidentes ocurridos en un mes dado en los 13 departamentos de manufactura de una planta industrial fue: 1,2,2,3,3,10,1,0,8,1,0,5,10. Calcule la media, la mediana y la moda. Describa la distribución de índices de accidentes en términos de asimetría  Supongamos que los precios de menudeo de artículos seleccionados cambian como se indica en la tabla siguiente. Determine el cambio porcentual medio en precios al menudeo sin referencia a los gastos promedio incluidos en la tabla y posteriormente el cambio porcentual medio ponderado Artículo Incremento Porcentual Gastos promedio por mes Leche Carne de res Ropa Gasolina 8% -2 -4 8 $30 40 50 60 60 Medida de variabilidad en conjuntos de datos  Las medidas de posición son útiles para la identificación del valor representativo de un grupo de valores. Por su parte, las medidas de variabilidad o dispersión se ocupan de la descripción de la variabilidad entre los valores mediante diversas técnicas: rango, rangos modificados, desviación media, varianza, desviación estándar y el coeficiente de variación 61 Rango  El rango, o R, es la diferencia entre los valores más alto y más bajo incluidos en un conjunto de datos  Ejemplo 23  Durante un mes de verano, los ocho vendedores de una empresa de equipos de calefacción y aire acondicionado vendieron los siguientes números de unidades: 8, 11, 5, 14, 8, 11, 16, 11  Rango= My-Mn = 16-5 = 11 unidades 62 Rango modificado  Es un rango que se construye eliminando algunos de los valores extremos de cada una de las porciones finales de la distribución. El 50% central es el rango entre los valores en el 25º punto percentil y el 75º punto percentil de la distribución. De este modo, también es el rango entre el primer y tercer cuartiles de la distribución. Por este motivo, el rango del 50% central suele llamársele rango intercuartil (RIC)  RIC=Q 3 -Q 1 63 Rango modificado  Ejemplo 24  Los datos de ventas de unidades centrales presentados en el ejemplo anterior son en orden ascendente los siguientes: 5,8,8,11,11,11,14,16. En consecuencia, el número de observaciones es N=8  Q 3 = X [(75N/100)+(1/2)] = X [6+(1/2)] = X 6.5 = 12.5  Q 1 = X [(25N/100)+(1/2)] = X [2+(1/2)] = X 2.5 = 8  RIC= Q 3 -Q 1 = 12.5-8= 4.5 64 Desviación media  Se basa en el valor absoluto de la diferencia entre cada valor del conjunto de datos y la media del grupo n X X N X ¿ = ¿ = ÷ ÷ | | | | muestra la de DMA población la de DMA µ 65 DMA  Ejemplo 25  Durante un mes de verano, los ocho vendedores de una empresa de equipos de calefacción y aire acondicionado vendieron los siguientes números de unidades:8,11,5,14,8,11,16,11  Media aritmética o µ es 10.5 de acuerdo con el ejemplo anterior X X-µ |X-µ| 5 8 8 11 11 11 14 16 -5.5 -2.5 -2.5 0.5 0.5 0.5 3.5 5.5 5.5 2.5 2.5 0.5 0.5 0.5 3.5 5.5 21.0 21/8=2.6 unidades 66 DMA  Por lo tanto, podemos decir que en promedio, la venta de unidades de equipo de aire acondicionado de un vendedor difiere en 2.6 unidades respecto de la media grupal, en cualquier dirección 67 Varianza  La varianza se asemeja a la desviación media absoluta en que se basa la diferencia entre cada valor del conjunto de datos y la media del grupo, pero se distingue de ella en un muy importante aspecto, cada diferencia se eleva al cuadrado N x X V ¿ = = ÷ 2 ) ( 2 ) ( µ o 68 Varianza  A diferencia de lo que ocurre con las demás estadísticas muestrales, la varianza de una muestra no equivale exactamente, en términos de cálculo, a la varianza de una población. En esencia en esta fórmula se incluye un factor de corrección, a fin de que la varianza muestral sea un estimador insesgado 1 ) ( 2 2 ÷ ÷ = ¿ n X X s 69 Desviación estándar  En general es difícil interpretar el significado de la varianza, porque las unidades en las que se expresa son valores elevados al cuadrado. Debido en parte a esta razón, es más frecuente el uso de la raíz cuadrada de la varianza, representada por la letra griega σ o por «s» en el caso de una muestra. A esto se le llama desviación estándar 70 Desviación estándar  Las fórmulas son: 1 ) ( ) ( 2 2 muestra la De población la De ÷ ÷ ÷ ¿ = ¿ = n X x N x s µ o 71 Desviación estándar  Ejemplo 26  Durante un mes de verano, ocho vendedores de una empresa de equipos de calefacción y aire acondicionado vendieron los siguientes números de unidades: 8,11,5,14,8,11,16,11  La media aritmética o µ es 10.5 de acuerdo con el ejemplo anterior X X-µ (X-µ) 2 5 8 8 11 11 11 14 16 -5.5 -2.5 -2.5 0.5 0.5 0.5 3.5 5.5 30.25 6.25 6.25 0.25 0.25 0.25 12.25 30.25 86.00 72 Desviación estándar 3 . 3 75 . 10 8 86 2 ) ( = = = ¿ = ÷ N x µ o 73 Cálculos simplificados 1 2 2 2 2 2 2 2 2 2 2 muestra la de estandar Desviación 1 s muestra la de Varianza población la de estándar Desviación población la de Varianza ÷ ÷ ÷ ¿ = ÷ ÷ = ¿ = ÷ = ¿ ¿ n X n X N N X s n X n X N N x µ o µ o 74 Desviación estándar  Ejemplo 27  Durante un mes de verano, ocho vendedores de una empresa de equipos de calefacción y aire acondicionado vendieron los siguientes números de unidades: 8,11,5,14,8,11,16,11  Media aritmética o µ es 10.5 de acuerdo con el ejemplo anterior X X 2 5 8 8 11 11 11 14 16 25 64 64 121 121 121 196 256 968 3 . 3 75 . 10 8 ) 5 . 10 ( 8 968 2 2 2 = = ÷ = ¿ = ÷ N N X µ o 75 Uso de la desviación estándar  Cuando existe una distribución de valores, tanto simétrica como mesocúrtica, la curva de frecuencias de una distribución se le llama curva normal, siempre que ocurre una curva semejante a esto, 68% de los valores quedan dentro del margen de la desviación estándar y 95% quedan incluidos dentro de un margen de dos unidades de desviación estándar 68 % 95% 76 Descripción de datos  Ejemplo 28  Las cuentas de energía eléctrica de una zona residencial correspondientes al mes de junio tienen una distribución normal, si se calcula que la media de estas cuentas es de $84.00 con una desviación estándar de $24.00, de ello se desprende que 68% de las cantidades facturadas están entre $60.00 y $108.00, así como que 95% de los valores están entre $36.00 y $132.00 77 Coeficiente de variación  Indica la magnitud relativa de la desviación estándar en comparación con la media de la distribución de las medidas, expresada como porcentaje, es útil cuando se desea comparar la variabilidad de dos conjuntos de datos en relación con el nivel general de los valores (y por lo tanto con la media) 100 Muestra 100 Población × = × = X s CV CV µ o 78 Coeficiente de variación Ejemplo 29 Respecto a dos emisiones de acciones ordinarias de la industria electrónica, durante el periodo de un mes fue de $150 con una desviación estándar de $5 para las acciones A y de $50 con una desviación estándar de $3 para las acciones B. Con base en la comparación absoluta, la variabilidad del precio de las acciones A fue mayor a causa de una mayor desviación estándar. Pero en cuanto al nivel de los precios se deben comparar mediante el coeficiente de variación A acciones las que variables más veces dos casi fueron B acciones las que Concluimos % 0 . 6 100 50 3 100 ) ( % 3 . 3 100 150 5 100 ) ( = × = × = = × = × = µ o µ o B CV A CV 79 Coeficiente de asimetría de Pearson  Mide la desviación respecto de la simetría expresando la diferencia entre la media y la mediana en relación con la desviación estándar del grupo de medidas s Med X Med ) ( 3 muestra la de Asimetría ) ( 3 población la de Asimetría ÷ = ÷ = o µ 80 Pearson Ejemplo 30 Con respecto a los datos de ventas de equipos de aire acondicionado, la media es 10.5, la mediana 11 y la desviación estándar 3.3 por lo que el coeficiente de asimetría es Asimetría= 3(µ-Med)/σ= 3(10.5-11.0)/3.3= -0.45  Por lo que la distribución de cantidades de ventas es en cierto modo asimétrica negativa o sesgada a la izquierda 81 Problemas  Una muestra de 20 obreros obtuvo los siguientes salarios por una semana dada, redondeados al dólar más cercano y dispuestos en orden ascendente: $240, 240, 240, 240, 240, 240, 240, 240, 255, 255, 265, 265, 280, 280, 290, 300, 305, 325, 330, 340. Determine: a) El rango b) EL RIC c) DMA d) Varianza e) Desviación estándar f) Varianza y desviación estándar con la fórmula alternativa g) El Coeficiente de variación h) El coeficiente de asimetría de Pearson 82 Problemas a) Rango. R=My- Mn=$340-240=$100 b) RIC=Q3- Q1=X(3n/4+1/2)- X(n/4+1/2)= X(15.5)- X(5.5)=295-240=$55 c) Se debe obtener primero la media muestral=X=$5410/20 =$270.50 X X-X |X-X| (X-X)2 $ 240.00 -$ 30.50 $ 30.50 $ 930.25 $ 240.00 -$ 30.50 $ 30.50 $ 930.25 $ 240.00 -$ 30.50 $ 30.50 $ 930.25 $ 240.00 -$ 30.50 $ 30.50 $ 930.25 $ 240.00 -$ 30.50 $ 30.50 $ 930.25 $ 240.00 -$ 30.50 $ 30.50 $ 930.25 $ 240.00 -$ 30.50 $ 30.50 $ 930.25 $ 240.00 -$ 30.50 $ 30.50 $ 930.25 $ 255.00 -$ 15.50 $ 15.50 $ 240.25 $ 255.00 -$ 15.50 $ 15.50 $ 240.25 $ 265.00 -$ 5.50 $ 5.50 $ 30.25 $ 265.00 -$ 5.50 $ 5.50 $ 30.25 $ 280.00 $ 9.50 $ 9.50 $ 90.25 $ 280.00 $ 9.50 $ 9.50 $ 90.25 $ 290.00 $ 19.50 $ 19.50 $ 380.25 $ 300.00 $ 29.50 $ 29.50 $ 870.25 $ 305.00 $ 34.50 $ 34.50 $ 1,190.25 $ 325.00 $ 54.50 $ 54.50 $ 2,970.25 $ 330.00 $ 59.50 $ 59.50 $ 3,540.25 $ 340.00 $ 69.50 $ 69.50 $ 4,830.25 Total $ 572.00 $21,945.00 83 Problemas Por lo que el DMA de la muestra quedaría: d) La varianza sería e) La desviación estándar 60 . 28 $ 20 00 . 572 $ | | = = ¿ ÷ N X µ 00 . 1155 1 20 00 . 21945 1 ) ( 2 2 = ÷ = ÷ ÷ = ¿ n X X s 99 . 33 $ 00 . 1155 ~ = s 84 Problemas f) Ocupando las fórmulas obtenemos g) Dado que X=$270.50 y s=$33.99  CV=s/X*100=33.99/270.50=.1256*100=12.6% h) Asimetría=3(X-Med)/s=3(270.5-260)/33.99=0.93  Por lo que concluimos que la distribución de los datos salariales es ligeramente asimétrica positiva 9 . 33 1155 muestra la de estandar Desviación 1155 19 ) 5 . 270 ( 20 1485350 1 s muestra la de Varianza 1 2 2 2 2 2 2 = = ¿ = = ÷ = ÷ ÷ = ÷ ÷ ¿ n X n X s n X n X 85 Trabajo de investigación 4  Las siguientes calificaciones en examen dispuestas en orden ascendente fueron obtenidas por 20 estudiantes inscritos en un curso de análisis de decisión: 49,46,67,75,80,82,82,85,87,89,89,89,89,89,89,89,93,94,97,100. Determine a) El rango b) EL RIC c) DMA d) Varianza e) Desviación estándar f) Varianza y desviación estándar con la fórmula alternativa g) El coeficiente de variación h) El coeficiente de asimetría de Pearson 86 Probabilidad  Históricamente se han desarrollado tres enfoques conceptuales para definir la probabilidad: los enfoques clásico, de frecuencias relativas y subjetivo. De acuerdo con el enfoque clásico  Dado que este enfoque permite determinar valores de probabilidad antes de que sean observados cualesquiera eventos muestrales, también se le conoce como enfoque a priori ) ( ) ( ) ( S N A N A P = 87 Probabilidad Ejemplo 31  En un mazo de naipes debidamente barajado que contiene 4 ases y otros 48 naipes, la probabilidad de obtener un as en una sola extracción es de:  4/52=0.077 88 Expresión de probabilidad  La probabilidad de un evento se indica con el símbolo P. Así, P(A) denota la probabilidad de que ocurra el evento A en una sola observación o experimento. 89 Momios  La razón de momios a favor de la ocurrencia de un evento es la razón del número relativo de resultados, representados por «a», a favor de A respecto del número relativo de resultados, representados por b, que no están a favor de A:  Momios=a:b (léase «a a b») 90 Momios  Ejemplo 32  Supongamos que un éxito se define como la extracción de cualquier naipe con figura o de un as de un mazo debidamente barajado de 52 naipes. Dado que 16 de los 52 naipes son ya sea sota, reina, rey o as. Por lo tanto, los momios asociados al éxito son 16:36. Por lo tanto la probabilidad de éxito es  P(A)=N(A)/N(S)=a/(a+b)=16/(16+36)=16/52 91 Eventos mutuamente excluyentes y no excluyentes  Excluyentes. Son eventos que no pueden ocurrir al mismo tiempo, por ejemplo sacar un rey y un as al mismo tiempo  No excluyentes. Son eventos que pueden ocurrir al mismo tiempo, por ejemplo sacar un as y un trebol 92 Reglas de la adición  Excluyentes  P(A o B) =P(AυB)=P(A)+P(B)  No excluyentes  P(A o B) =P(A)+P(B)-P(A y B)  Ejemplo 33  ¿Cuál es la probabilidad de extraer un as o un rey? = 4/52+4/52=8/52  ¿Cuál es la probabilidad de sacar un as o un trébol o ambos en una sola extracción? = 4/52+13/52-1/52=16/52 93 Eventos independientes, eventos dependientes y probabilidad condicional  Dos eventos son independientes cuando la ocurrencia o no ocurrencia de un evento no tiene ningún efecto en la probabilidad de ocurrencia del otro evento. Dos eventos son dependientes cuando la ocurrencia o no ocurrencia de un evento afecta la probabilidad de ocurrencia del otro evento  Ejemplo 34.  Una moneda es independiente en cada lanzamiento  Obtener un as en una baraja es dependiente, puesto que para la siguiente extracción sólo se podrá sacar una probabilidad de 3/51  P(A)=P(A|B) 94 Reglas de la multiplicación  Se refieren a la determinación de la probabilidad de la ocurrencia conjunta de A y B. Existen dos variantes de la regla de la multiplicación si los eventos son independientes o dependientes  Para eventos independientes  P(A y B)=P(A ∩ B)=P(A)P(B)  Para eventos dependientes  P(A y B)=P(A)P(B|A)  P(B y A)=P(B)P(A|B) 95 Ejemplos de multiplicación  Ejemplo 35  Si una moneda equilibrada se lanza dos veces, la probabilidad de que ambos lanzamientos den por resultado «sol» es:  Ejemplo 36  Supongamos que se sabe que un conjunto de 10 partes de repuesto contiene ocho partes aceptables y dos partes defectuosas. ¿Cuál es la probabilidad de que las dos partes seleccionadas sean defectuosas?, ¿cuál es la probabilidad de que sean aceptables? 4 1 2 1 2 1 = × aceptables 90 56 9 7 10 8 = × 96 Teorema de Bayes  En su forma algebraica más simple, el teorema de Bayes consiste en la determinación de la probabilidad condicional del evento A dada la ocurrencia del Evento B. Sin embargo, la especial importancia del teorema de Bayes es que se aplica en el contexto de eventos secuenciales y, además, que la versión de cálculo de la fórmula es la base para determinar la probabilidad condicional de que un evento haya ocurrido en la primera posición secuencial una vez que un evento en particular ha sido observado en la segunda posición secuencial ) ' | ( ) ' ( ) | ( ) ( ) | ( ) ( ) | ( A B P A P A B P A P A B P A P B A P + = 97 Diagramas de árbol  Ejemplo 37  Supongamos que contamos con dos urnas U 1 y U 2 . La urna 1 contiene 8 pelotas rojas y 2 pelotas verdes, mientras que la urna 2 contiene 4 pelotas rojas y 6 pelotas verdes, si se selecciona aleatoriamente una urna y de ella se selecciona aleatoriamente una pelota, el proceso y las probabilidades secuenciales pueden representarse mediante un diagrama de árbol. .50 .50 U1 U2 R V R V .80 .20 .40 .60 98 Ejemplos del teorema  Ejemplo 38  Supongamos que observamos una pelota verde en el segundo paso, ¿cuál es la probabilidad de que la urna 1 haya sido seleccionada en el paso uno? 25 . 0 40 . 0 10 . 0 ) 60 . 0 )( 50 . 0 ( ) 20 . 0 )( 50 . 0 ( ) 20 . 0 )( 50 . 0 ( ) | ( ) ( ) | ( ) ( ) | ( ) ( ) | ( 2 2 1 1 1 1 1 = = + = + = U V P U P U V P U P U V P U P V U P 99 Permutaciones  Ejemplo 39  Tres miembros de una organización social se ofrecen como voluntarios para fungir como dirigentes el siguiente año en los puestos de presidente, tesorero y secretario. El número de maneras (permutaciones) en los que los tres pueden asumir los puestos es:  n!=3!=(3)(2)(1)=6 maneras  Cuando nos interesan las permutaciones de un subgrupo se ocupa la fórmula )! ( ! r n n P r n ÷ = 100 Combinaciones  En el caso de las permutaciones, el orden de acomodo de los objetos es importante. En el caso de las combinaciones, lo que nos interesa es el número de diferentes agrupaciones de los objetos que pueden ocurrir sin reparar en su orden (hacerlo en clase) )! ( ! ! r n r n P r n ÷ = 101 Problemas de probabilidad  Determine el valor de la probabilidad aplicable a cada una de las siguientes situaciones  La probabilidad de accidentes industriales en un año. Una muestra aleatoria de 10 empresas con 8 000 empleados, reportó la ocurrencia de 400 accidentes  La probabilidad de acertar a un número ganador en un juego de ruleta, los números son 0, 00 y del 1 al 36  Respuesta 1. P=400/8000=0.05  Respuesta 2. P=1/38 102 Problemas de adición  Determine la probabilidad de obtener un as (A), un rey (R) o un dos (D), al extraer un naipe de un mazo debidamente barajado de 52 naipes  De 300 estudiantes de administración, 100 están actualmente inscritos en contabilidad y 80 están actualmente inscritos en estadística aplicada. Estas cifras de inscripción incluyen a 30 estudiantes inscritos en ambos cursos. ¿Cuál es la probabilidad de que si se elige a un estudiante al azar esté inscrito en contabilidad o en estadística?  Respuesta 1. P=4/52+4/52+4/52=12/52  Respuesta 2. P=100/300+80/300-30/300=150/300=.5 103 Problemas de multiplicación  En general, la probabilidad de que un prospecto realice una compra después de haber sido contactado por un vendedor es P=0.40. Si un vendedor selecciona aleatoriamente tres prospectos de un expediente y establece contacto con ellos, ¿cuál es la probabilidad de que los tres realicen la compra?  De 12 cuentas contenidas en un expediente, cuatro contienen un error de procedimiento en su saldo. Si un auditor selecciona aleatoriamente dos de estas cuentas, ¿cuál es la probabilidad de que ninguna de ellas contenga un error de procedimiento? elabore un diagrama de árbol para representar este proceso de muestreo secuencial 104 Solución de problemas de multiplicación  Problema 1. Dado que los compradores son independientes entre sí P=.40x.40x.40=0.064  Problema 2. Los eventos de este ejemplo son dependientes, porque el resultado de la primera cuenta muestreada afecta las probabilidades para la segunda por lo que P=8/12x7/11=56/132=0.42 E1 E1 E2 E2 E2 E2 4/12 8/12 3/11 8/11 4/11 7/11 105 Problemas teorema de Bayes  Se sabe que la caja A contiene una moneda de un centavo y una moneda de 10 centavos. Mientras que la caja B contiene dos monedas de 10 centavos. Se elige aleatoriamente una de ellas, de la que después se selecciona aleatoriamente una moneda. a) Elabore un diagrama de árbol para describir esta situación de eventos secuenciales. b) Si en el primer paso se selecciona la caja A, ¿cuál es la probabilidad de que en el segundo se seleccione una moneda de 10 centavos? c) Si en el segundo paso se selecciona una moneda de 10 centavos, ¿cuál es la probabilidad de que provenga de la caja A? d) Si en el segundo paso se selecciona una moneda de un centavo, ¿cuál es la probabilidad de que provenga de la caja A? 106 Solución teorema de Bayes a) P(D|A)=1/2=0.50 b) A B C D C D 1/2 1/2 1/2 1/2 0 1 33 . 0 ) ( ) ( ) ( ) ( ) 1 )( ( ) )( ( ) )( ( ) | ( ) ( ) | ( ) ( ) | ( ) ( ) ( ) ( ) | ( 3 1 2 1 4 1 4 1 2 1 2 1 2 1 2 1 2 1 ~ = + = + = + = = B D P B P A D P A P A D P A P D P AyD P D A P 107 Solución teorema de Bayes c)  Los cinco individuos que componen la dirección de una pequeña empresa manufacturera serán sentados juntos en un banquete. a) Determine el número de diferentes disposiciones posibles de los asientos para los cinco individuos b) Supongamos que sólo tres de los cinco directivos se les pedirá representar a la compañía en el banquete. ¿Cuántas diferentes disposiciones serán posibles en la mesa considerando que pueden ser elegidos tres cualesquiera de los cinco individuos? 1 ) ( ) ( )() ( ) )( ( ) )( ( ) | ( ) ( ) | ( ) ( ) | ( ) ( ) ( ) ( ) | ( 4 1 4 1 2 1 2 1 2 1 2 1 2 1 = = + = + = = B C P B P A C P A P A C P A P C P AyC P C A P 108 Permutaciones y combinaciones  Solución al anterior  P=n!=5x4x3x2x1=120  P=n!/(n-r)!=5!/(5-3)!=60  En relación con el problema anterior, supongamos que no nos interesa el número de diferentes disposiciones de asientos posibles, sino el número de diferentes agrupaciones de los tres (de cinco) directivos que podrían asistir al banquete. ¿Cuántas diferentes agrupaciones hay?  C=n!/r!(n-r)!=5!/3!(5-3)!=10 109 Trabajo de investigación 5 Determine lo siguiente:  La probabilidad de que la suma de los puntos de dos dados una vez lanzados sea de siete  Obtenga la probabilidad equivalente de los momios siguientes:  2:4 de que un competidor consiga un avance tecnológico  8:3 de que un nuevo producto sea rentable  De un total de 800 empleados, 400 participan en el plan de reparto de utilidades de una empresa (P), 600 disponen de cobertura de seguro de gastos médicos mayores (M) y 200 participan en ambos programas. ¿Cuál es la probabilidad de que un empleado aleatoriamente seleccionado:  participe en al menos uno de los dos programas  no participe en ningún programa? 110 Trabajo de investigación 5  Durante un periodo específico, 70% de las emisiones de acciones ordinarias de una industria con sólo 8 compañías elevaron su valor en el mercado. Si un inversionista elige aleatoriamente dos de estas emisiones.  ¿Cuál es la probabilidad de que el valor de mercado de ambas haya aumentado durante este periodo?  Supongamos que un inversionista elige aleatoriamente cuatro de esas emisiones accionarias. Elabore un diagrama de árbol para describir los diversos resultados posibles de la secuencia de cuatro emisiones 111 Trabajo de investigación 5  Supongamos que contamos con dos urnas U1 y U2, y que U1 contiene tres pelotas rojas y dos pelotas verde, mientras que U2 contiene dos pelota roja y cuatro pelotas verdes. Si se selecciona aleatoriamente una urna y después de esa urna se obtiene una pelota roja. ¿Cuál es la probabilidad de que la urna seleccionada haya sido U1?  Supongamos que hay siete diferentes lugares de capacitación para asignar siete empleados en el programa preliminar de capacitación administrativa de una empresa.  ¿De cuantas maneras diferentes pueden ser asignados los siete individuos a los siete lugares distintos?  Si sólo se dispone de seis diferentes lugares para los siete candidatos. ¿De cuántas maneras diferentes pueden asignarse los siete lugares distintos a cuatro de los siete individuos? 112 Distribución de probabilidad para variables aleatorias discretas  ¿Qué es una variable aleatoria?  Es un evento numérico cuyo valor se determina por medio de un proceso aleatorio  Distribución de probabilidad. Es cuando se le asignan valores X a una variable aleatoria, ya sea mediante un listado o una función matemática.  La suma de las probabilidades de todos los resultados numéricos posibles debe ser igual a 1.0 113 Variable aleatoria discreta  Es cuando todos los posibles valores numéricos de la variable pueden enlistarse en una tabla junto con sus respectivas probabilidades. 114 Variable aleatoria continua  Todos los posibles valores fraccionarios de la variable no pueden enlistarse, motivo por el cual las probabilidades se determinan por medio de una función matemática. 115 Descripción de una variable aleatoria discreta  Lo mismo que en el caso de recolecciones de datos muestrales y poblacionales a menudo es útil describir una variable aleatoria en términos de su media, varianza y desviación estándar.  La media a largo plazo de una variable aleatoria X se le conoce como «valor esperado», se expresa por E(X) y se da por la fórmula:  E(X)=ΣXP(X) 116 Valor esperado  Ejemplo 40  El número de vagonetas solicitadas en renta en una agencia de alquiler de automóviles durante un periodo de 50 días, se identifica en la siguiente tabla. Obtenga el valor esperado de la variable discreta Demanda posible X Número de días Probabilidad P(X) Valor ponderado X[P(X)] 3 4 5 6 7 8 3 7 12 14 10 4 50 0.06 0.14 0.24 0.28 0.20 0.08 1.0 0.18 0.56 1.20 1.68 1.40 0.64 E(X)=5.66 117 Varianza de una variable aleatoria discreta  Se expresa como V(X), se calcula respecto a E(X) como la media de la distribución de probabilidad y se tienen dos fórmulas para sacarla: 2 Fórmula )] ( [ ) ( ) ( 1 Fórmula ) ( )] ( [ ) ( 2 2 2 X E X E X V X P X E X X V ÷ = ÷ = ¿ 118 Varianza y desviación estándar  Ejemplo 41  Obtener la varianza del ejemplo anterior con la fórmula dos  Por lo tanto la varianza es  V(X)=33.78-5.66 2 =33.78-32.04=1.74  Desviación estándar= raíz cuadrada de la varianza=1.32 Demanda posible X Probabilidad P(X) Valor ponderado X[P(X)] Demanda cuadrada (x 2 ) Cuadrado ponderado x 2 P(X) 3 4 5 6 7 8 0.06 0.14 0.24 0.28 0.20 0.08 1.0 0.18 0.56 1.20 1.68 1.40 0.64 E(X)=5.66 9 16 25 36 49 64 0.54 2.24 6.00 10.08 9.80 5.12 E(x 2 )=33.78 119 Distribución binomial  Es una distribución de probabilidad discreta aplicable como modelo para situaciones de toma de decisiones en las que puede suponerse que un proceso de muestreo responde a un proceso de Bernoulli, que es:  Cada observación tiene dos resultados «éxito y fracaso»  Las observaciones constituyen eventos independientes  La probabilidad de una observación a otra es constante 120 Distribución binomial  Para esta formula se requiere de los siguientes elementos:  El número establecido de éxitos «X»  El número de ensayos u observaciones «y»  La probabilidad de éxito de cada ensayo «p» p) - (1 q donde )! ( ! ! ) , | ( = ÷ = ÷x n x q p X n X n p n X P 121 Distribución binomial  Ejemplo 42  La probabilidad de que un prospecto de venta aleatoriamente elegido realice una compra es de 0.20, si un representante de ventas visita a seis prospectos, la probabilidad de que realice exactamente cuatro ventas se determina de la siguiente forma: 01636 . 0 80 . 0 20 . 0 )! 4 6 ( ! 4 ! 6 ) 20 . 0 , 6 | 4 ( 2 4 = ÷ = = = = p n X P 122 Distribución binomial Ejemplo 43  Con respecto al ejemplo anterior, la probabilidad de realizar cuatro o más ventas se determina de la siguiente forma  P(X≥4|n=6,p=0.20)=P(X=4)+P(X=5)+P(X=6)  De acuerdo con el ejemplo anterior  =0.01636+0.001536+0.000064=0.016960 123 Distribución binomial  Para obtener el valor esperado, la varianza y la desviación estándar de una distribución binomial se ocupan las siguientes fórmulas:  Ejemplo 44  E(X)= np= 6(0.20)= 1.2 ventas  V(X)= npq= 6(.20)(.80)= 0.96  σ= raíz de la varianza= 0.98 124 Distribución hipergeométrica  Cuando el muestreo se realiza sin reemplazo de cada elemento muestreado tomado de una población finita de elementos, no se aplica el proceso de Bernoulli, porqué cuando se eliminan elementos de la población existe un cambio sistemático en la probabilidad de éxito por lo que para este tipo de casos se ocupa la fórmula de distribución hipergeométrica, con los siguientes elementos: N= número total de elementos de la población, T= número total de éxitos incluidos en la población, X= número establecido de éxitos y n=número de elementos de la muestra | | . | \ | | | . | \ | | | . | \ | ÷ ÷ = n N X T X n T N n T N X P ) , , | ( 125 Distribución hipergeométrica  Ejemplo 45  De seis empleados tres han permanecido en la compañía por cinco o más años. Si de este grupo de seis se elige aleatoriamente a cuatro empleados. La probabilidad de que exactamente dos de ellos tengan una antigüedad de cinco o más años es: 60 . 0 15 3 3 ! 2 ! 4 ! 6 ! 1 ! 2 ! 3 ! 1 ! 2 ! 3 4 6 2 3 2 3 4 6 2 3 2 4 3 6 ) 4 , 3 , 6 | 2 ( = = = | | . | \ | | | . | \ | | | . | \ | | | . | \ | | | . | \ | | | . | \ | ÷ ÷ = = = = = x n T N X P El 1! es el complemento para llegar a 3! El 2! es el complemento para llegar a 6! 126 Distribución de Poisson  Se ocupa para determinar la probabilidad de ocurrencia de un número establecido de eventos cuando éstos ocurren en un continuum temporal. Este proceso se llama proceso de Poisson, aunque es semejante al Bernoulli, se distingue de él en que los eventos ocurren a lo largo de un intervalo de tiempo temporal. En pocas palabras se define la distribución de Poisson cuando la probabilidad que se requiere sacar sucede de manera X en un lapso. 127 Distribución de Poisson  La fórmula para determinar la probabilidad de un número establecido de éxitos X en una distribución de Poisson es:  Por lo general esta media se representa como λ y significa el número medio de eventos a largo plazo en la dimensión temporal. El número «e» es la constante 2.7183, base de los logaritmos naturales. ! ) | ( X e X P x ì ì ì ÷ = 128 Distribución de Poisson  En un departamento de reparación de maquinaria se recibe un promedio de cinco llamadas de servicio por hora. La probabilidad de que en una hora aleatoriamente seleccionada se reciban exactamente tres llamadas de servicio es:  Ejemplo 46 1404 . 0 6 00674 . 0 125 ! 3 5 ) 0 . 5 | 3 ( 5 3 = = = = = ÷ x e X P ì 129 Problemas  Se ha determinado que el número de camiones de carga que arriban cada hora a una bodega sigue la siguiente distribución de probabilidad  Calcule a) Número esperado de arribos X por hora b) La varianza c) La desviación estándar Número de camiones (x) 0 1 2 3 4 5 6 Probabilidad 0.05 0.10 0.15 0.25 0.30 0.10 0.05 130 Problemas Demanda posible X Probabilidad P(X) Valor ponderado X[P(X)] Demanda cuadrada (x 2 ) Cuadrado ponderado x 2 P(X) 0 1 2 3 4 5 6 0.05 0.10 0.15 0.25 0.30 0.10 0.05 1.0 0 0.10 0.30 0.75 1.20 0.50 0.30 E(X)=3.15 0 1 4 9 16 25 36 0 0.10 0.60 2.25 4.80 2.50 1.80 E(x 2 )=12.05 a) (X)=3.15 camiones b) V(X)=E(X 2 )-[E(X)] 2 =12.05-3.15 2 =12.05-9.9225=2.1275 c) σ=raíz cuadrada de V(X)=1.46 camiones 131 Problemas distribución binomial  A causa de las condiciones económicas imperantes, una empresa informa que 30% de sus cuentas por cobrar a otras empresas comerciales están sobrevencidas. Si un contador toma una muestra aleatoria de cinco de esas cuentas, determine la probabilidad de cada uno de los siguientes eventos: a) Ninguna de las cuentas está sobrevencida b) Exactamente dos cuentas están sobre vencidas c) Tres o más están sobrevencidas 132 Problemas distribución binomial 00243 . 0 1 00243 . 0 1 ) 70 . 0 ( ) 30 . 0 ( ! 0 ! 5 ! 5 ) 5 ( 02835 . 0 70 . 0 0081 . 0 5 ) 70 . 0 ( ) 30 . 0 ( ! 1 ! 4 ! 5 ) 4 ( 1323 . 0 49 . 0 027 . 0 10 ) 70 . 0 ( ) 30 . 0 ( ! 2 ! 3 ! 5 ) 3 ( 16308 . 0 00243 . 0 02835 . 0 1323 . 0 ) 5 ( ) 4 ( ) 3 ( ) 30 . 0 , 5 | 3 ( ) 3087 . 0 343 . 0 09 . 0 10 ) 70 . 0 ( ) 30 . 0 ( ! 3 ! 2 ! 5 30 . 0 , 5 | 2 ( ) 16807 . 0 16807 . 0 1 1 ) 70 . 0 ( ) 30 . 0 ( ! 5 ! 0 ! 5 ) 30 . 0 , 5 | 0 ( ) 0 5 1 4 2 3 3 2 5 0 = = = = = = = = = = = = = + + = = + = + = = = = > = = = = = = = = = = = = x x x dondeP x x x dondeP x x X dondeP x P x P x P p n x P C x x p n x P B x x p n x P A 133 Problemas distribución hipergeométrica  Un gerente selecciona aleatoriamente a n=3 individuos de un grupo de 10 empleados para la formación de un equipo asignado a un proyecto. Suponiendo que cuatro de los empleados fueron asignados anteriormente a un proyecto similar, determine la probabilidad de que exactamente dos de los tres empleados hayan tenido experiencia previa en proyectos de este tipo 134 Solución hipergeométrica 30 . 0 120 6 6 ! 7 ! 3 ! 10 ! 2 ! 2 ! 4 ! 5 ! 1 ! 6 3 10 2 4 1 6 3 10 2 4 2 3 4 10 ) 3 , 4 , 10 | 2 ( = = = | | . | \ | | | . | \ | | | . | \ | | | . | \ | | | . | \ | | | . | \ | ÷ ÷ = = = = = x n T N X P 135 Problemas Poisson  Un promedio de cinco personas por hora realizan transacciones en una ventanilla de servicios especiales de un banco comercial, ¿cuál es la probabilidad de que entre 10 y 12 personas realicen transacciones en la ventanilla de servicios especiales durante una hora en particular? 00343 . 0 ! 12 5 ) 5 | 12 ( 00824 . 0 ! 11 5 ) 5 | 11 ( 01813 . 0 ! 10 5 ) 5 | 10 ( 0298 . 0 00343 . 0 00824 . 0 01813 . 0 ) 12 ( ) 11 ( ) 10 ( ) 0 . 5 | 12 10 ( 5 12 5 11 5 10 = = = = = = = = = = = = = + + = = + = + = = = s > ÷ ÷ ÷ e X P e X P e X P X P X P X P X X P ì ì ì ì 136 Trabajo de investigación 6  Un vendedor ha descubierto que la probabilidad de realizar varias ventas por día, dada la posibilidad de visitar a 10 prospectos de venta, es la que se representa en la tabla. Calcule el número esperado de ventas por día, la varianza y la desviación estándar Número de ventas (x) 1 2 3 4 5 6 7 8 Probabilidad 0.03|0.16| 0.3| 0.35| 0.19| 0.2| 0.05|0.07 137 Trabajo de investigación 6  Supongamos que 30% de los empleados de una gran empresa están a favor de la representación sindical, y que se contacta una muestra aleatoria de 20 empleados en solicitud de una respuesta anónima. ¿Cuál es la probabilidad de que cuatro estén a favor de la representación?  Diez de los 30 estudiantes de un grupo escolar están insatisfechos con el texto que se emplea. Si una muestra aleatoria de cuatro estudiantes es interrogada sobre el libro de texto, determine la probabilidad de que a) Exactamente tres de los cuatro estén insatisfechos b) Tres estudiantes o más se muestren insatisfechos con el libro 138 Trabajo de investigación 6  Un promedio de siete personas por hora hacen uso de una caja bancaria automática durante el horario pico de compras en una tienda departamental. ¿Cuál es la probabilidad de que a) Exactamente 4 personas usen la caja durante una hora aleatoriamente seleccionada. b) Menos de cinco personas usen la caja durante una hora aleatoriamente seleccionada. c) Ninguna persona la use durante un intervalo de 10 minutos. 139 Distribuciones de probabilidad para variables aleatorias continuas  A diferencia de una variable aleatoria discreta, una variable aleatoria continua puede adoptar cualquier valor fraccionario dentro de un rango definido de valores. Dado que existe un número infinito de medidas fraccionarias posibles, no se pueden enlistar todos los posibles valores con su probabilidad correspondiente 140 Variables aleatorias continuas  En la gráfica siguiente la probabilidad de que un embarque aleatoriamente seleccionado tenga un peso entre 6 000 y 8 000 es igual a la proporción del área total bajo la curva 0 20 40 60 80 100 120 0 2000 4000 6000 8000 10000 12000 0 141 Distribución normal de probabilidad  Se refiere a la curva normal, la cual es tanto simétrica como mesocúrtica y es importante por tres razones:  Se sabe que las medidas obtenidas en muchos procesos aleatorios siguen esta distribución  Suelen servir para aproximar otras distribuciones de probabilidad, como la binomial y de Poisson  Como veremos en el capítulo siguiente, las distribuciones de estadísticas como la media muestral y la proporción muestral tienen distribución normal cuando el tamaño de muestra es grande 142 Distribución normal de probabilidad  Como sucede en todas las distribuciones continuas de probabilidad, un valor de probabilidad de una variable aleatoria continua sólo puede determinarse para un intervalo de valores, la curva de probabilidad de una variable con distribución normal está dada por ] 2 / ) [( 2 2 2 2 1 ) ( o µ to ÷ ÷ = X e x f 143 Distribución normal estándar  Es la distribución normal de probabilidad con µ=0 y σ=1. Un valor z reformula el valor de X original en términos del número de unidades de la desviación estándar por las cuales el valor original difiere de la media de la distribución. Un valor negativo z, indicaría que el valor de X original estaba por debajo del valor de la media o µ ÷ = X z 144 Distribución normal de probabilidad  Ejemplo 47  Se sabe que el ciclo de vida de un componente eléctrico sigue una distribución normal con una media de µ=2000 y una desviación estándar de σ=200 horas, la probabilidad de que un componente aleatoriamente seleccionado dure entre 2 000 y 2 400 horas se determina de la siguiente manera: 0 5 10 15 20 25 30 35 40 45 1200 1400 1600 1800 2000 2200 2400 2600 2800 5 apendice al acuerdo de , 4772 . 0 ) 2400 2000 ( 0 . 2 200 2000 2400 = s s + = ÷ = ÷ = X p X z o µ -3 -2 -1 0 1 2 3 145 Distribución normal de probabilidad  Ejemplo 48  Con respecto al problema anterior, supongamos que nos interesa la probabilidad de que un componente aleatoriamente seleccionado dure más de 2 200 horas 0 5 10 15 20 25 30 35 40 45 1200 1400 1600 1800 2000 2200 2400 2600 2800 0.1587 0.3413 - .5000 0 2200) P(X 5 apéndice el con acuerdo de , 3413 . 0 ) 1 0 ( 0 . 1 200 2000 2200 = = > = s s + = ÷ = ÷ = Z p X z o µ -3 -2 -1 0 1 2 3 146 Puntos percentiles para variables con distribución normal  Un punto percentil en una curva normal estándar nos sirve para hacer el proceso inverso, es decir, encontrar el valor de X  Ejemplo 49  En una curva normal estándar, el 90º punto percentil se refiere al 50º punto de la izquierda de la curva + el 40º punto del lado derecho, así que con el apéndice sacamos el valor más cercano a 0.4000 y es 0.3997, por lo que el valor asociado a Z = +1.28, el signo es positivo porque el 90º punto percentil es mayor que la media 147 Puntos percentiles para variables con distribución normal  Para encontrar el valor de X, despejando la fórmula tenemos que X=µ+zσ  Ejemplo 50  Para el ejemplo anterior tenemos que X = 2 000 + (1.28)(200) = 2 256 hrs.  Ejemplo 51  Si sacamos el 10º percentil tenemos que X = 2 000 + (-1.28)(200) = 1 744 horas. 148 Aproximación normal de probabilidades binomiales  Cuando el número de observaciones o ensayos «n» es relativamente grande, la distribución de probabilidad normal puede servir para aproximar probabilidades binomiales. Una regla conveniente es que tal aproximación resulta aceptable cuando n≥30 y tanto np como nq≥5  Cuando la distribución de probabilidad normal se usa como base para aproximar un valor de probabilidad binomial, la media y desviación estándar se basan en el valor esperado y en la varianza del número de éxitos de la distribución binomial npq est Desv np media = = o µ . . 149 Aproximación normal de probabilidades binomiales  Para llevar a cabo una probabilidad binomial usando curvas normales, se debe considerar algo que se conoce como corrección por continuidad. Esta corrección se lleva a cabo usando los siguientes parámetros  Reste 0.5 de X cuando se requiera P(X≥X i )  Reste 0.5 de X cuando se requiera P(X<X i )  Sume 0.5 de X cuando se requiera P(X≤X i )  Sume 0.5 de X cuando se requiera P(X>X i ) 150 Aproximación normal de probabilidades binomiales  Ejemplo 52  En relación con un grupo extenso de prospectos de venta se ha observado que el 20% de contactados personalmente por un representante de ventas realizarán una compra. Si un representante de ventas contacta a 30 prospectos, podemos determinar la probabilidad de que 10 o más realicen una compra, en referencia a las probabilidades binomiales  Si sacamos la solución ocupando lo que se vio en las diapositivas 120-124 tenemos  P(X ≥ 10|n=30,p=0.20)=0.0355+0.0161+0.0064+ 0.0022+0.0007+0.0002+…=0.0611 151 Aproximación normal de probabilidades binomiales  Continuación ejemplo 52  Hagamos ahora lo mismo, pero ocupando la curva normal  ¿Es n≥30?, si n = 30  ¿Es np≥5?, si, np = 30(0.20) = 6  ¿Es nq ≥5?, si, nq = 30(0.80) = 24  Para la corrección por continuidad tenemos que tomar a X ≥10, por lo que se debe restar 0.5 y queda de la siguiente forma 0548 . 0 4452 . 0 5000 . 0 ) 19 . 2 , 0 . 6 | 5 . 9 ( 4452 . 0 60 . 1 19 . 2 0 . 6 5 . 9 19 . 2 8 . 4 80 . 20 . 30 0 . 6 20 . 30 = ÷ = = = > = + ~ ÷ = ÷ = ~ = = = = = = o µ o µ o µ X P x z x x npq x np 152 Aproximación normal de probabilidades de Poisson  Cuando la media λ de una distribución de Poisson es relativamente grande, la distribución normal de probabilidad puede servir para aproximar probabilidades de Poisson. Una regla conveniente es que esta aproximación es aceptable si λ≥10.0 ì o ì µ = = . .est Desv media 153 Aproximación normal de probabilidades Poisson  Ejemplo 53  El número promedio de llamadas recibidas en un departamento de reparación de maquinaria por turno de 8 horas es de 10.0. ¿Cuál es la probabilidad de que en el turno se reciban más de 15 llamadas?  Si sacamos la solución ocupando lo que se vio en las diapositivas 127-129 tenemos:  P(X>15|λ=10.0)=P(X=16)+P(X=17)+…  =0.0217+0.0128+0.0071+0.0037…=0.0488 154 Aproximación normal de probabilidades Poisson  Continuación ejemplo 53  Hagamos ahora lo mismo, pero ocupando la curva normal, ya que λ≥10 0409 . 0 4591 . 0 5000 . 0 ) 0 . 10 | 15 ( 4591 . 0 74 . 1 16 . 3 0 . 10 5 . 15 16 . 3 10 10 = ÷ = = > = + ~ ÷ = ÷ = ~ = = = = ì o µ ì o ì µ X P x z 155 Problemas  El proceso de empaque de una compañía productora de cereales para el desayuno ha sido ajustado para que cada empaque contenga un promedio de µ=13.0 onzas de cereal. Por supuesto que no todos los paquetes contienen 13.0 oz a causa de fuentes aleatorias de variabilidad. La desviación estándar del peso neto real es σ=0.1 oz y se sabe que la distribución de pesos sigue la distribución normal de probabilidad. Determine la probabilidad de que un paquete aleatoriamente elegido contenga entre 13 y 13.2 oz de cereal. 156 Problemas 5 apéndice el con acuerdo de , 4772 . 0 ) 2 0 ( 0 . 2 1 . 0 0 . 13 2 . 13 = s s + = ÷ = ÷ = Z p X z o µ Respecto al problema anterior, ¿cuál es la probabilidad de que el peso del cereal exceda 13.25 onzas? 0062 . 0 4938 . 0 5000 . 0 ) 5 . 2 ( 5 . 2 1 . 0 0 . 13 25 . 13 = ÷ = > + = ÷ = ÷ = Z p X z o µ 157 Problemas binomiales y de Poisson  Se sabe que 70% de las personas que acuden a un importante centro comercial realizan al menos una compra. En una muestra de n = 50 individuos, ¿cuál es la probabilidad de que al menos 40 personas realicen una o más compras cada una? 0823 . 0 4177 . 0 5000 . 0 ) 24 . 3 , 0 . 35 | 5 . 39 ( 4177 . 0 39 . 1 24 . 3 0 . 35 5 . 39 24 . 3 5 . 10 30 . 70 . 50 0 . 35 70 . 50 = ÷ = = = > = + ~ ÷ = ÷ = ~ = = = = = = o µ o µ o µ X P x z x x npq x np 158 Problemas binomiales y de Poisson  Se sabe que las llamadas de servicio llegan aleatoriamente y en calidad de proceso estacionario a un promedio de 5 por hora. ¿Cuál es la probabilidad de que en un turno de 8 horas se reciban al menos 50 llamadas de servicio?  Puesto que λ=5x8=40 y excede a 10, entonces podemos usar la distribución normal de probabilidad, para aproximar el valor de probabilidad de Poisson 0485 . 0 4515 . 0 5000 . 0 ) 0 . 40 | 5 . 50 ( 4515 . 0 66 . 1 32 . 6 40 5 . 50 32 . 6 40 40 = ÷ = = > = + ~ ÷ = ÷ = ~ = = = = ì o µ ì o ì µ X P x z 159 Trabajo de investigación 7  Las calificaciones reportadas en una prueba de aprovechamiento de vigencia nacional para graduados de preparatoria tiene una media de µ = 80 con la desviación estándar σ = 10. La distribución de calificaciones es aproximadamente normal. ¿Cuál es la probabilidad de que la calificación de un individuo aleatoriamente elegido se encuentre a) entre 80 y 95 b) entre 70 y 90 160 Trabajo de investigación 7  La media de una prueba de aprovechamiento de vigencia nacional es µ = 80 con σ = 10. Las calificaciones siguen una distribución normal. ¿Qué calificación se encuentra en el a) 50º punto percentil b) 30º punto percentil c) 90º punto percentil? 161 Trabajo de investigación 7  En relación con los varios miles de artículos almacenados por una empresa de pedidos por correo, existe una probabilidad global de 0.10 de que un artículo en particular (incluidos tamaño y color específicos, etc.), no esté en existencia. Si un embarque comprende pedidos de 200 artículos diferentes, ¿cuál es la probabilidad de que 20 o más artículos no estén en existencia? 162 Trabajo de investigación 7  Durante el periodo pico de 8 a 10 p.m. de una estación de servicio automovilístico llega un promedio de un auto cada 5 minutos. ¿Cuál es la probabilidad de que más de 25 autos arriben a la estación en demanda de servicio entre las 4 y 5 p.m.? 163 Distribuciones de muestreo e intervalos de confianza para la media  Un parámetro es un valor de resumen para una población o proceso  Una estadística muestral es un valor de resumen para una muestra  Para emplear una estadística muestral como estimador de un parámetro, debe ser aleatoria de una población  Distribución de muestreo. Se refiere a la distribución de los diferentes valores que una estadística muestral podría adoptar en muchas muestras del mismo tamaño 164 Distribuciones de muestreo e intervalos de confianza para la media  Un estimador puntual es el valor numérico de una estadística muestral empleado para estimar el valor de un parámetro, una de sus características más importantes de un estimador es que sea insesgado  Un estimador insesgado es una estadística muestral cuyo valor esperado es igual al parámetro por estimar  Ambos métodos de muestreo garantizan que la muestra sea insesgada, aunque no eliminan el error de muestreo  Así entonces, por lo general disponemos de una muestra aleatoria, por lo que se debe reconocer que el valor de la estadística muestral variará de una muestra a otra a causa de la variabilidad del muestreo aleatorio o error de muestreo 165 Distribuciones de muestreo e intervalos de confianza para la media  Ejemplo 54 (error de muestreo) Muestra 1 Muestra 2 Muestra 3 Muestra 4 Muestra 5 14.95 14.96 14.95 15.03 14.99 15.07 15.08 14.94 15.09 14.98 15.05 14.99 14.71 14.94 14.88 14.98 14.96 15.20 15.31 15.21 X Med S 14.97 14.96 0.039 15.02 15.03 0.067 15.03 15.02 0.052 14.88 14.91 0.119 15.17 15.08 0.149 166 Distribución de muestreo de la media  La distribución de muestreo de la media se describe determinando la media de dicha distribución, la cual es el valor esperado E(X) y la desviación estándar de la distribución de las medias muestrales, designada como σ x  Cuando los parámetros de la población o proceso son conocidos, el valor esperado, error estándar y la fórmula del error estándar de la media con el factor de corrección por finitud incluido de la distribución de muestreo de la media es: corrección de factor el con estándar Error 1 estándar Error esperado Valor ) ( ÷ ÷ = = = N n N n n X E x x o o o o µ 167 Distribución de muestreo de la media  Ejemplo 55  Supongamos que la media de una población muy grande µ = 50.0 y que la desviación estándar de las medidas es σ = 12.0. Determinamos la distribución de muestreo de las medias muestrales para un tamaño de muestra de n = 36 en términos del valor esperado y el error estándar de la distribución. Si la población fuera de 100, obtenga el error estándar 60 . 1 ) 80 . 0 ( 2 1 100 36 100 2.0 1 estándar Error 2.0 36 12 esperado Valor 0 . 50 ) ( = = ÷ ÷ = ÷ ÷ = = = = = = N n N n n X E x x o o o o µ 168 Distribución de muestreo de la media  El efecto de este factor de corrección es siempre reducir el valor que de otra forma se calcularía. Por regla general, la corrección es insignificante y puede omitirse cuando n<0.05N, esto es, cuando el tamaño de la muestra sea inferior al 5% del tamaño de la población 169 Teorema del límite central  Si la población o proceso del cual se toma una muestra tiene una distribución normal, también la distribución de muestreo de la media tendrá distribución normal, sin importar el tamaño de la muestra. No obstante, ¿qué ocurre cuando una población no tiene distribución normal? por increíble que parezca, el teorema del límite central permite la aplicación de la distribución normal a estas distribuciones de muestreo 170 Teorema del límite central  Cuando el tamaño de la muestra es mayor o igual a 30 resuelve muchas de las situaciones poblacionales adversas 171 Determinación de probabilidades para la media muestral  Dado que conocemos la media y desviación estándar de la población se puede hacer uso de la fórmula de distribución normal estándar, sólo que en la fórmula se hace uso del error estándar de la media, porque éste es la desviación estándar de la variable X o µ ÷ = X z X 172 Ejemplo 56  Un auditor toma una muestra aleatoria de tamaño n= 36 de una población de 1000 cuentas, el valor medio de las cuentas por cobrar para la población es µ= $260.00, con la desviación estándar de la población σ=$45.00. ¿Cuál es la probabilidad de que la media muestral sea inferior a $250.00? 0918 . 0 4082 . 0 5000 . 0 ) 0 33 . 1 ( 500 . 0 ) 33 . 1 ( 33 . 1 5 . 7 260 250 50 . 7 6 00 . 45 36 00 . 45 00 . 260 ) ( = ÷ = s s ÷ ÷ = < ÷ = ÷ = ÷ = = = = = = = z P Z p X z n X E x x o µ o o µ Ejemplo 57  El departamento de control de calidad de una empresa de refrescos lleva un registro de la cantidad del liquido con que se llena su botella gigante. La cantidad de refresco en cada botella es crítica, pero varia un poco de botella a botella. La empresa no quiere que las botellas se llenen con menor cantidad porque esto ocasionaría problema respecto a la exactitud de lo que se especifica en la etiqueta. Por otro lado, las botellas tampoco deben contener exceso de refresco porque la compañía estaría regalando su producto, con lo que se reducirían las ganancias Ejemplo 57 Continuación  De acuerdo con los registros la cantidad de refresco en las botellas sigue una distribución normal. La cantidad media por botella es 31.2 onzas y la desviación estándar poblacional es .4 onzas. Hoy a las 8 de la mañana el técnico de control tomo una muestra aleatoria de 16 botellas de la línea de llenado. La cantidad media de refresco en estas botellas fue de 31.38 onzas. ¿Es este resultado poco probable?, ¿Es probable que el proceso esté llenando con demasiado refresco las botellas?, dicho de otra manera ¿El error muestral de 0.18 onzas es poco probable? Ejemplo 57 Continuación 3.5% 0.0359 .4641 - .5000 31.38) P(x tablas las De 80 . 1 16 4 . 20 . 31 38 . 31 = = > = ÷ = ÷ = ÷ ÷ ÷ ÷ n Z X o µ Ejemplo 58  Una asociación de gasolineras estima que en una gasolinera se venden en promedio 20000 galones diarios, la forma de la distribución no se conoce. En una muestra que se tomo ayer de 70 gasolineras, la media fue de 19480 y la desviación estándar de 4250 galones ¿es razonable la aseveración de que la media poblacional sea de 20000 galones?, ¿Cuál es la probabilidad de tomar una muestra con el estadístico dado la población propuesta?, ¿Qué suposiciones hay que hacer? Ejemplo 58 Continuación  Como la muestra es suficientemente grande se puede sustituir la desviación estándar poblacional con la desviación estándar muestral 15.39% 0.1539 .3461 - .5000 ) 9480 1 P(x tablas las De 02 . 1 70 4250 20000 19480 = = < ÷ = ÷ = ÷ = ÷ ÷ ÷ ÷ n s Z X µ Trabajo de Investigación 8  El salario promedio por hora de los plomeros de una determinada región es de 28 dólares ¿Cuál es la probabilidad de tomar una muestra de 50 plomeros y encontrar un salario medio por hora de 28.50 o más?. La desviación estándar de la muestra es 2 dólares por hora Trabajo de Investigación 8  En estados unidos la edad promedio en la que los hombres se casan por primera vez es 24.8 años. No se conoce ni la forma ni la desviación estándar de la población ¿Cuál es la probabilidad de encontrar una muestra de 60 hombres que la edad promedio a la que se casaron sea de 25.1 años o más?. Supóngase que la desviación estándar muestral es de 2.5 años Trabajo de Investigación 8  En un estudio reciente realizado por una asociación de taxistas se encontró que la tarifa media entre dos puntos de una ciudad es de 18 dólares y la desviación estándar de 3.50. Si se toma una muestra de 15 tarifas ¿Cuál es la probabilidad de que la media muestral este entre 17 y 20 dolares?  Una empresa fabricante de camiones asegura que el peso medio de sus camiones cuando están totalmente cargados es 6000 libras y que la desviación estándar es 150 libras. Supongase que la población sigue una distribución normal. Se seleccionan aleatoriamente 40 camiones y se pesan. ¿Entre qué limites se encontrará el 95% de los pesos? 181 Intervalos de confianza para la media con el uso de la distribución normal  Los intervalos de confianza para la media se elaboran por lo general con el estimador insesgado X en el punto medio del intervalo. Cuando está garantizado el uso de la distribución normal de probabilidad, el intervalo de confianza para la media se determina mediante X X zs Z x ± ± X mediante desconoce, se población la de la cuando O o o 182 Intervalos de confianza para la media con el uso de la distribución normal  Los intervalos de confianza de uso más frecuente son los intervalos de confianza de 90, 95 y 99%. Los valores de z requeridos junto con estos intervalos se muestran en la siguiente tabla: Z (número de unidades de desviación estándar respecto de la media) Proporción de área en el intervalo 1.645 1.96 2.58 0.90 0.95 0.99 183 Ejemplo 59  Durante una semana dada, una muestra aleatoria de 30 empleados por hora seleccionada de un gran número de empleados de una empresa manufacturera tiene un salario medio muestral de X = $180, con una desviación estándar muestral de s = $14.00. Estimamos el salario medio de todos los empleados por hora de la empresa con una estimación por intervalo tal como para que podamos tener una confianza del 95% de que el intervalo incluye el valor de la media de la población de la siguiente manera: Ejemplo 59 continuación ] 02 . 185 , 98 . 174 [ ) 30 14 ( 96 . 1 180 X mediante desconoce, se población la de la cuando O = ± ± ± X X zs Z x o o Proceso de Toma de Decisiones ¿Es Normal la Población? ¿Es n igual o mayor que 30? ¿Se conoce la desviación estándar poblacional? Utilizar una prueba no paramétrica Utilizar una distribución z Utilizar una distribución t Utilizar una distribución z Si Si Si No No No Trabajo de investigación 9  De una población normal se toma una muestra de 81 observaciones. La media de la muestra tomada es 40 y la desviación estándar muestral es 5. Determine un intervalo de confianza de 95% para la media poblacional  De una población normal se toma una muestra de 49 observaciones. La media muestral es 55 y la desviación estándar muestral es 10. Determine un intervalo de confianza de 99% para la media poblacional Tamaño de la Muestra apropiado  El tamaño necesario de la muestra depende de tres factores  El nivel de confianza deseado  El margen de error que el investigador este dispuesto a tolerar  La variabilidad de la población que se estudia Nivel de confianza  Los niveles de confianza más comúnmente usados son del 95% y 99%, pero se puede usar cualquier nivel entre 0 y 100%  Nivel de confianza para 95% z=1.96  Nivel de confianza para 99% z=2.58  Entre mayor sea el nivel de la z mayor será el tamaño de la muestra Error permitido  El máximo error permitido se designa por E, es la cantidad que se suma o se resta a la media muestral para determinar los extremos de los intervalos de confianza.  Cantidad de error que las personas que realizan el estudio están dispuestas a tolerar, si el error permitido es pequeño se necesitara una muestra grande y viceversa si es grande Desviación Estándar Poblacional Si la población esta muy dispersa se requerirá una muestra muy grande. Por otro lado si la población esta concentrada el tamaño de la muestra será muy pequeño, será necesario usar una desviación estándar poblacional y existen tres sugerencias para poder obtenerla Uso de un estudio comparable  Se ocupa cuando existe una estimación de la dispersión, que se obtuvo en otro estudio Uso de un método basado en el intervalo  Se sabe que aproximadamente toda la curva normal se encuentra a 3 desviaciones estándar si observamos la derecha y la izquierda tendríamos que un porcentaje bastante grande de la curva es el de 6 desviaciones estándar así que tomamos el número menor de nuestra muestra y el número mayor para obtener el rango y lo dividimos entre 6, eso nos dará una aproximación a la desviación estándar poblacional Estudio piloto  Se utiliza con mayor frecuencia, se toma una muestra de entre 30 y 100 y se aplica la encuesta para identificar la desviación estándar muestral y ocuparla en la fórmula correspondiente. Tamaño de la muestra para estimar la media poblacional permitido error máximo E población la de estándar desviación la de estimación s muestra la de tamaño al e correspond que estándar normal valor el es z muestra la de tamaño el es n 2 | . | \ | = E zs n Ejemplo 60  Un estudiante de administración pública quiere determinar el ingreso medio mensual de los miembros del consejo ciudadano de una ciudad grande. El error al estimar la media debe ser inferior a 100 dólares con un nivel de confianza del 95%. El estudiante encontró un informe de la Secretaría del Trabajo en el que se estimó que la desviación estándar era de 1000. ¿De que tamaño debe ser la muestra? Ejemplo 60 ciones especifica las satisfacer para 666 de muestra una necesita se que lo Por 64 . 665 100 1000 58 . 2 99% a confianza de nivel el aumentara se que de caso el Para ciones especifica las satisfacer para 384 de muestra una necesita se que lo Por 16 . 384 100 1000 96 . 1 2 2 2 2 = | . | \ | = | . | \ | = = | . | \ | = | . | \ | = x E zs n x E zs n Hipótesis  Enunciado acerca de una población elaborado con el propósito de ponerla a prueba Prueba de Hipótesis  Procedimiento basado en la evidencia muestral y la teoría de probabilidad; se emplea para determinar si la hipótesis es una afirmación razonable Paso 1 para probar una hipótesis  Establecer las Hipótesis nula H 0 y la Alternativa H 1  La hipótesis nula es la hipótesis a ser probada  La hipótesis alternativa es el complemento de la nula, es una afirmación que se acepta si los datos muestrales proporcionan evidencia suficiente de que la hipótesis nula es falsa Paso 2 para probar una hipótesis  Seleccionar el nivel de significancia, el cual es la probabilidad de rechazar la hipótesis nula cuando es verdadera  No hay un nivel de significancia que se aplique a todas las pruebas, dependerá sobre todo de lo que se esta evaluando, sin embargo se ha estilado que para proyectos de investigación un nivel del 5% es correcto, para aseguramiento de calidad 1% y para encuestas políticas el 10% Paso 2 Continuación Hipótesis Nula Se Acepta Ho Se Rechaza Ho Ho es verdadera Decisión Correcta Error de tipo 1 Ho es Falsa Error de Tipo 2 Decisión correcta Investigador Paso 2 Ejemplo 61  Una muestra de 50 tarjetas de circuito impreso revelo que 4 de estas fallaron, si el cliente tolera solo el 6% de falla y la compra es de 1000 tarjetas de circuito, al identificar que 4 de ellas fallaron tendríamos que el 8% de nuestra muestra fallo, por lo que rechazamos el embarque, supongamos que de las 1000 solo esas 4 fallaron, entonces se cae en un error de tipo 1, lo contrario sería error de tipo 2 Paso 3 Calcular el valor estadístico de la prueba  Valor determinado a partir de la información muestral, que se utiliza para determinar si se rechaza la hipótesis nula Paso 3 Calcular el valor estadístico de la prueba ¿Es Normal la Población? ¿Es n igual o mayor que 30? ¿Se conoce la desviación estándar poblacional? Utilizar una prueba no paramétrica Utilizar una distribución z Utilizar una distribución t Utilizar una distribución z Si Si Si No No No Paso 4 Formular la regla de decisión  Una regla de decisión establece las condiciones específicas en las que se rechaza la hipótesis nula y las condiciones en las que no se rechaza la hipótesis nula  Valor Crítico  Punto de división entre la región en la que se rechaza la hipótesis nula y la región en la que no se rechaza la hipótesis nula Paso 5 Tomar una decisión  Se refiere a calcular el estadístico de prueba, compararlo con el valor crítico y tomar la decisión de rechazar o no la hipótesis nula  Identificar la probabilidad de que el evento suceda Pruebas de significancia de una o dos colas  Se ocupa una prueba de significancia de una cola cuando la hipótesis nula es menor o igual o mayor o igual  Se ocupa una prueba de significancia de dos colas cuando la hipótesis nula es igual u ocupa el signo igual Valor P  Es la probabilidad de observar un valor muestral tan extremo, o más extremo, que el valor observado, dado que la hipótesis nula es verdadera  Si el valor P es menor que  0.10 se tiene alguna evidencia de que Ho no es verdadera  0.05 se tiene una fuerte evidencia de que Ho no es verdadera  0.01 se tiene una muy fuerte evidencia de que Ho no es verdadera  0.001 se tiene una evidencia extremadamente fuerte de que Ho no es verdadera Problemas  Se dan las siguientes hipótesis  Ho: µ=200  H1: µ≠200  En una muestra de 50 observaciones se encuentra que µ x =203.5 ¿puede rechazarse la hipótesis nula al nivel de significancia de 0.01?  Establezca la regla de decisión  Calcule el valor del estadístico de Prueba  ¿Cuál es la decisión respecto a la hipótesis nula?  ¿Cuál es la probabilidad de que la hipótesis nula se rechace debido a situaciones del azar? Problemas  Como el nivel de significancia es de 0.01  Z=2.58, como la hipótesis nula es con el signo igual se tiene una curva con dos colas, por consiguiente la regla de decisión es rechazar la hipótesis nula y aceptar la hipótesis alternativa si el valor de z cae en la región menor a -2.58 y mayor a 2.58, se acepta la hipótesis nula si cae dentro de este intervalo Problemas 55 . 1 50 16 200 5 . 203 = ÷ = ÷ = n X Z o µ  Puesto que 1.55 no cae en la región de rechazo, se acepta la hipótesis nula  Para obtener la Probabilidad sería P(z>1.55)=0.500- 0.4394=0.0606  Debido a que son dos colas se multiplica por dos así que la probabilidad es 0.1212 por lo que Ho no se rechaza por cuestiones de probabilidad Trabajo de investigación 10  Una cadena de tiendas de descuento expide su propia tarjeta de crédito, el gerente del departamento de tarjetas de crédito desea averiguar si el saldo insoluto medio mensual es mayor que 400 dólares, el nivel de significancia se deja en 0.05. En una revisión aleatoria de 172 saldos, se encontró que la media muestral es de 407 y la desviación estándar es de 38. ¿Debería concluir el funcionario de crédito que la media poblacional es mayor que 400 o es razonable suponer que la diferencia de 7 dólares se debe al azar?.
Copyright © 2024 DOKUMEN.SITE Inc.