libro.pdf

March 31, 2018 | Author: Katia Rubit Benitez Castro | Category: Statistics, Microsoft Excel, Sampling (Statistics), Decision Making, Statistical Hypothesis Testing


Comments



Description

,. E/TflDIJTl~fl . · · . . ert 101 fl.E'GOCIOJ . ESTAbísTiCA EN LOS NEGOctqs ,¡ t. -~15 ~ r~. (CUARTAEDICÍÓN EN INGLÉS) Ken Black · . ·r PARA LA TOMA DE DECISIONES (PRIMERA EDICIÓN EN ESPÁÑOL) ~§ :i!' ~i er: H ·~i: 11 .·il . :t Universidad del lago claro Houston ~ ·¡ "\ PRIME~~ EDICIÓN ME~CO, 2005 ( .• ... -COMPAÑÍA EDITORIAL CONTINENTAL . .l f RESUMEN DEL CONTENIDO 1 Introducción a la Estadística 2 Tablas y gráficas 3 Estadística descriptiva 4 Probabilidad 5 Distribuciones discretas 2 18 46 96 140 6 Distribuciones continuas 7 Muestreo y distribuciones muestrales 220 8 Inferencia estadística: estimación para poblaciones individuales 252 9 Inferencia estadística: prueba de hipótesis para una población 182 1 O Inferencia estadística acerca de dos poblaciones 340 288 RESUMEN DE CONTENIDO v 11 Análisis de varianza y diseño de experimentos 12 Análisis de datos categóricos r 454 13 Análisis de regresión simple 480 14 Análisis de regresión múltiple . 522 15 Construcción de modelos de regresión múltiple 16 Pronóstico de series de tiempo y números índice 17 Estadísticas no paramétricas 18 Control estadístico de calidad 396 656 704 552 598 CONTENIDO Prefacio xxii Acerca del autor 1 xxviii Introducción a la estadística 2 Dilema de decisión: La estadísticadescribeel estado de los negociosen las zonas rurales de la India 3 1.1 LA ESTADISTICAEN LOS NEGOCIOS El mejor camino al mercado 4 Estrés en el trabajo 4 Decisiones financieras 5 ¡Cómo está la economía? 5 El impacto de la tecnología en el trabajo 1.2 1.3 4 5 CONCEPTOS ESTADlSTICOS BÁSICOS MEDICIÓN DE DATOS s 6 Nivel nominal 8 Nivel ordinal 9 Nivel de intervalo 9 Nivel de razón l O Comparación de los cuatro niveles de datos 10 Análisis estadístico usando la computadora: Excel y MINITAB 11 Resumen 13 Términosclave 14 Problemascomplementarios 14 Análisis de la base de datos 15 Caso: DiGiornoPizzas:Introducciónde una pizzacongeladapara competir con laspizzaspara llevar 17 2 Tablas y gráficas 18 Dilema de decisión: Estado de la manufactura de autos 19 2.1 20 DISTRIBUCIONES DE FRECUENCIA Marca de clase 20 Frecuencia relativa 21 Frecuencia acumulada 21 2.2 REPRESENTACIÓNGRÁFICA DE DATOS 24 Histogramas 24 Uso de histogramaspara obtener una visión general de los datos 25 Polígonos de frecuencia 26 varianza y desviación estándar S8 Desviación media absoluta S9 Varianza S9 Desviación estándar 60 Significado de desviación estándar 60 Regla empírica 61 Teorema de Chebyshev 62 Población contra varianza muestra/ y desviación estándar 63 Fórmulas de cálculo breve para varianza y desviación estándar 64 Valores z 66 Coeficiente de variación 66 3.3 DESCRIPCIÓN GRÁFICA DE DATOS NUMÉRICOS DE DOS VARIABLES: GRÁFICAS DE DISPERSIÓN 34 Resumen 38 Términos clave 39 Problemas complementarios 39 Análisis de la base de datos 42 Caso: Las jaboneras presentan batallas Uso de la computadora 44 3 Estadística descriptiva 42 46 Dilema de decisión: Estadísticas de lavanderfas 3. mediana y moda 77 Coeficientede sesgo 77 Curtosis 78 Gráficas de caja y bigote 78 ss 48 vii .2 MEDIDAS DE VARIABILIDAD: DATOS NO AGRUPADOS Rango S6 Rango intercuartil S6 Desviación media absoluta.CONTENIDO Ojivas 26 Gráficas de pastel 27 Gráficas de tallo y hoja 30 Gráficas de Pareto 31 2.4 7l MEDIDAS DE FORMA 76 Sesgo 76 Sesgo y relación de la media.3 MEDIDAS DE TENDENCIA CENTRAL Y VARIABILIDAD: DATOS AGRUPADOS 70 Medidas de tendencia central 70 Media 70 Moda 7l Medidas de variabilidad 3.1 47 MEDIDAS DE TENDENCIA CENTRAL: DATOS NO AGRUPADOS Moda 48 Mediana 48 Media 49 Percentiles S l Pasos para determinar la ubicación de un percentil SI Cuartiles S2 3. DE UNIÓN.5 PROBABILIDADESMARGINALES.6 108 111 112 LEYESDE LA MULTIPLICACIÓN Ley general de la multiplicación Ley especial de la multiplicación 4.3 84 ESTRUCTURADE LA PROBABILIDAD Experimento 100 · Evento 101 Eventos simples 101 Espacio muestral 101 Uniones e intersecciones 99 99 100 102 Eventos mutuamente excluyentes Eventos independientes 103 102 Eventos colectivamente exhaustivos Eventos complementarios 103 Conteo de posibilidades l 04 La regla de conteo mn 104 103 Muestreo de una población con reemplazo 104 Combinaciones: muestreo de una población sin reemplazo 105 4.8 115 115 ll8 121 124 REVISIÓN DE PROBABILIDADES:REGLADE BAYES Resumen 134 Términos clave 134 128 .5 MEDIDASDE ASOCIACIÓN Correlación 3.vili ESTADISTICA EN LOS NEGOCIOS 3.4 4.2 97 INTRODUCCIÓNA LA PROBABILIDAD 98 MÉTODOS PARAASIGNARPROBABILIDADES Método clásico de asignar probabilidades Frecuencia relativa 99 Probabilidad subjetiva 100 4.6 ESTADISTICADESCRIPTIVAEN LA COMPUTADORA Resumen 86 Términos clave 87 Fórmulas 88 Problemas complementarios 89 Análisis de la base de datos 93 Caso: Coca-Cola se hace pequeña en Rusia Uso de la computadora 94 4 80 80 Probabilidad 93 96 Dilema de decisión: Igualdad de género en el lugar de trabajo 4.1 4.CONJUNTAS Y CONDICIONALES 106 LEYESDELAADICIÓN 106 Matrices de probabilidad Complemento de una unión Ley especial de la adición 4.7 PROBABILIDADCONDICIONAL Eventos independientes 4. 3 DISTRIBUCIÓN BINOMIAL 147 Resolución de un problema binomial 148 Uso de la tabla binomial 151 Uso de computadora para producir una distribución binomial 152 Media y desviación estándar de una distribución binomial 153 Gráficación de distribuciones binomiales 154 5.1 DISTRIBUCIÓN UNIFORME 6.1 5.4 DISTRIBUCIÓN DE POISSON 158 Resolución de problemas de Poisson por fórmula 159 Uso de las tablas de Poisson 161 Media y desviación estándar de una distribución de Poisson Gráficas de distribuciones de Poisson 162 162 Uso de computadora para generar distribuciones de Poisson 162 Cálculo de problemas binomiales por la distribución de Poisson 163 5.CONTENIDO Fórmulas 134 Problemas complementarios 135 Análisis de la base de datos 138 Caso: Colgate-Pálmolive hace un esfuerzo "totsl" 5 138 140 Distribuciones discretas Dilema de decisión: El bueno y el malo de la imagen pública de la industria bancaria 5.2 DISTRIBUCIÓN NORMAL 183 184 Determinación de probabilidades en una distribución uniforme 185 Uso de la computadora para resolver probabilidades de distribución uniforme 188 Historia de la distribución normal 189 Función de densidad de probabilidad de la distribución normal Distribución normal estándar 190 190 187 170 ix .2 141 DISTRIBUCIONES DISCRETAS CqNTRA CONTINUAS 142 DESCRIPCIÓN DE UNA DISTRIBUCIÓN DISCRETA 143 Media. varianza y desviación estándar de distribuciones discretas 143 Valor medio o esperado 144 Varianza y desviación estándar de una distribución discreta 144 5.5 DISTRIBUCIÓN HIPERGEOMÉTRICA 168 Uso de la computadora para resolver probabilidades de distribución hipergeométrica Resumen 173 Términos clave Fórmulas 173 173 Problemas complementarios 174 Análisis de la base de datos 179 Caso: Fuji Film introduce el APS Uso de la computadora 6 179 180 Distribuciones continuas 182 Dilema de decisión: Los rostros cambiantes de la industria de seguros 6. x ESTADISTICA EN LOS NEGOCIOS Resolución de problemas de curva normal 191 Uso de la computadora para resolver probabilidades de distribución normal 199 6.3 223 239 DISTRIBUCIÓN MUESTRAL DE p Resumen 246 Términos clave 247 Fórmulas 247 Problemas complementarios 247 Análisis de la base de datos 250 Caso: Shell trata de regresar al primer lugar 250 Uso de la computadora 251 241 232 221 209 .2 MUESTREO 222 Razones para muestreo 222 Razones para tomar un censo 223 Marco 223 Muestreo aleatorio contra no aleatorio Técnicas de muestreo aleatorio 224 Muestreo aleatorio simple 224 Muestreo aleatorio estratificado 225 Muestreo sistemático 227 Muestreo de grupo (o área) 227 Muestro no aleatorio 228 Muestreo de conveniencia 229 Muestreo de juicio 229 Muestreo de cuota 230 Muestreo de bola de nieve 230 Error de muestreo 231 Errores no muestrales 231 DISTRIBUCIÓN DE MUESTREO DE LA MEDIA i Muestreo con una población finita 7.3 USO DE LA CURVA NORMAL PARA CALCULAR APROXIMADAMENTE PROBLEMAS DE DISTRIBUCIÓN BINOMIAL 201 6.4 DISTRIBUCIÓN EXPONENCIAL Corrección para continuidad 203 207 Probabilidades de la distribución exponencial 207 Uso de la computadora para determinar probabilidades de distribución exponencial Resumen 212 Términos clave 213 Fórmulas 213 Problemas complementarios 213 Análisis de la base de datos 217 Caso: Mercedes va tras compradores jóvenes 217 Uso de la computadora 218 7 Muestreo y distribuciones muestrales 220 Dilema de decisión: ¿Cuál es la actitud de los trabajadores de maqui/adoras? 7.1 7. 5 ESTIMACIÓN DEL TAMAÑO DE LA MUESTRA 268 Uso de la computadora para construir intervalos de confianza para la proporción poblacional 271 Tamaño de la muestra al estimar u 277 Determinación de tamaño de la muestra al estimar p Resumen 281 Términos eleve 282 Fórmulas 282 Problemas complementarios 283 Análisis de la bese de datos 286 Caso: Thermatrix 286 Uso de la computadora 287 9 273 276 278 Inferencia estadística: prueba de hipótesis para una población Dilema de decisión: Referencias de negocios 289 9.2 259 ESTIMACIÓN DE LA MEDIA POBLACIONAL CON EL USO DEL ESTADÍSTICO t/DISTRIBUCIÓN t 262 La distribución t 263 Solidez 263 Caracterlsticas de la distribución t 263 Lectura de la tabla de distribución t 264 Intervalos de confianza para estimar la media poblacional usando el estadlstico ti distribución t 265 Uso de la computadora para construir intervalos de confianza t para la media 266 8. compensación y prestaciones 8.1 INTRODUCCIÓN A LA PRUEBA DE HIPÓTESIS 290 Tipos de hipótesis 291 Hipótesis de investigación 291 Hipótesis estadlsticas 291 Hipótesis sustantivas 293 Uso del sistema HTAB para probar hipótesis 294 Regiones de rechazo y de aceptación 296 Errores tipo 1 y tipo 11 297 9.4 ESTIMACIÓN DE VARIANZA POBLACIONAL 8.CONTENlDO xi 8 Inferencia estadística: estimación para poblaciones individuales 252 Dilema de decisión: Un reporte de encuestas sobre productividad.1 ESTIMACIÓN DE LA MEDIA POBLACIONAL CON EL USO DEL ESTADÍSTICO z/DISTRIBUCIÓN z 254 Factor de corrección finita 257 Intervalo de confianza para calcular u cuando a se desconoce 258 Uso de la computadora para construir intervalos de confianza z para la media . 8.3 ESTIMACIÓN DE LA PROPORCIÓN POBLACIONAL 8.2 PRUEBA DE HIPÓTESIS PARA UNA MEDIA POBLACIONAL CON EL USO DEL ESTADÍSTICO z/DISTRIBUCIÓN z 298 Uso de una desviación estándar muestral 300 Prueba de la media con una población finita 301 288 253 .. 3 PRUEBA DE HIPÓTESIS PARA LA MEDIA POBLACIONAL CON EL USO DEL ESTADÍSTICO t/DISTRIBUCIÓN t 307 Uso de la computadora para probar hipótesis sobre una media poblacional con el uso de la prueba de t 310 9.6 PRUEBA DE HIPÓTESIS PARA LA VARIANZA SOLUCIÓN DE ERRORES TIPO 11 322 Algunas observaciones sobre errores tipo I1 326 Curvas características de operación y potencia 326 Efecto de aumentar el tamaño de la muestra en los limites de rechazo Resumen 332 Términos clave 332 Fórmulas 333 Problemas complementarios 333 Análisis de la base de datos 336 Caso: Frito-Lay apunta al mercado hispano 336 Uso de Ja computadora 339 1 O Inferencias estadísticas acerca de dos poblaciones 328 340 Dilema de decisión: Comparación de estadísticas internacionales de trabajo 10.3 INFERENCIAS ESTADlSTICAS PARA DOS POBLACIONES RELACIONADAS 361 Hipótesis 361 Uso de la computadora para hacer inferencias estadísticas en dos poblaciones relacionadas 363 Intervalos de confianza 366 .xii ESTADISTICA EN LOS NEGOCIOS Uso del método del valor p para probar hipótesis 301 Uso del método del valor critico para probar hipótesis 302 Uso de la computadora para probar hipótesis sobre una media poblacional que usa el estadístico z 305 9.5 9.4 PRUEBA DE HIPÓTESIS PARA UNA PROPORCIÓN 313 Uso de la computadora para probar hipótesis sobre una proporción poblacional 9.1 317 318 341 PRUEBA DE HIPÓTESIS E INTERVALOS DE CONFIANZA ACERCA DE LA DIFERENCIA ENTRE DOS MEDIAS CON USO DEL ESTADÍSTICO DE z 342 Hipótesis 344 Intervalos de confianza 347 Uso de la computadora para probar hipótesis acerca de la diferencia entre dos medias poblacionales usando la prueba de z 349 10.2 PRUEBA DE HIPÓTESIS E INTERVALOS DE CONFIANZA ACERCA DE LA DIFERENCIA ENTRE DOS MEDIAS: MUESTRAS PEQUEÑAS INDEPENDIENTES Y VARIANZAS POBLACIONALES DESCONOCIDAS 352 Hipótesis 352 Uso de la computadora para probar hipótesis y construir intervalos de confianza acerca de la diferencia entre dos medias poblacionales con el uso de la prueba de t 354 lntervalos de confianza 357 10. CONTENIDO 10. Clarkson Company 451 Uso de la computadora 453 429 xiii .. R.5 PRUEBA DE HIPÓTESIS SOBRE DOS VARIANZAS POBLACIONALES 377 Uso de la computadora para probar la hipótesis sobre dos varianzas poblacionales 379 Resumen 385 Términos clave 386 Fórmulas 386 Problemas complementarios 387 Análisis de la base de datos 392 Caso: Seitz Corporation: Fabricación de productos que se mueven mediante engranajes y de manera lineal 392 Uso de la computadora 394 .3 PRUEBAS DE COMPARACIÓN MúLTIPLE 411 Prueba de diferencia honestamente significativa (HSD) de Tukey: caso con tamaño de muestra iguales 412 Uso de la computadora para hacer comparaciones múltiples 414 Procedimiento de Tukey-Kramer: caso de tamaños muestrales desiguales 416 11.1 INTRODUCCIÓN AL DISEÑO DE EXPERIMENTOS 11.4 DISEÑO DE BLOQUE ALEATORIO 419 Uso de la computadora para analizar diseños de bloque aleatorios 423 11.5 DISEÑO FACTORIAL (ANOVA DE DOS DIRECCIONES) Ventajas del diseño factorial 429 Diseños factoriales con dos tratamientos 429 Aplicaciones 430 Prueba estadística de un diseño factorial 430 Interacción 432 Uso de la computadora para hacer una ANOVA de dos sentidos 437 Resumen 446 Términos clave 446 Fórmulas 447 Problemas complementarios 448 Análisis de la base de datos 451 Ceso: J.4 INFERENCIAS ESTADÍSTICAS PARA DOS PROPORCIONES POBLACIONALES.2 398 EL DISEÑO COMPLETAMENTE ALEATORIO (ANOVA DE UN SENTIDO) 400 Análisis de varianza de un sentido 401 Lectura de la tabla de distribución de F 404 Uso de la computadora para una ANOVAde un sentido Comparación de los valores de F y de t 406 405 11.pt . 11 Análisis de varianza y diseño de experimentos 396 Dilema de decisión: Analizar las diferencias en rentabilidad de compañfas en tres países 397 11.P2 370 Hipótesis 371 Intervalos de confianza 374 Uso de la computadora para analizar la diferencia entre dos proporciones 375 10. 3 ANÁLISIS RESIDUAL 490 Uso de residuales para probar las suposiciones del modelo de regresión Uso de la computadora para análisis de residuales 492 13.5 COEFICIENTEDEDETERMINACIÓN Relación entre el valor de r y de r2 496 499 501 13.2 DETERMINACIÓN DE LA ECUACIÓN DE LA RECTA DE REGRESIÓN 482 13.4 ERROR ESTÁNDAR DE LA ESTIMACIÓN 13.8 INTERPRETACIÓN DE LA SALIDA Resumen 514 Términos clave 514 Fórmulas 514 Problemas complementarios 515 Análisis de Ja base de datos 518 Caso: Delta Wire usa capacitación como arma Uso de la computadora 521 •• 519 510 507 491 483 .xiv ESTADISTICA EN LOS NEGOCIOS 12 Análisis de datos categóricos 454 Dilema de decisión: Selección de proveedores: comparación de pequeñas y grandes empresas en Ja industria electrónica 455 12.2 ANÁLISIS DE CONTINGENCIA: PRUEBA DE JI CUADRADA DE INDEPENDENCIA 466 Resumen 475 Términos clave 475 Fórmulas 476 Problemas complementarios 476 Análisis de la base de datos 478 Caso: Foot Locker en Ja mezcla de calzado Uso de la computadora 479 13 Análisis de regresión simple 478 480 Dilema de decisión: Predicción del volumen anual de ventas de empresas de corretaje o representación de bienes raíces por medio del precio promedio de venta 481 13.prueba de ji cuadrada de bondad de ajuste como técnica alternativa a la prueba de z 462 12.6 HIPÓTESIS PARA LA PENDIENTE DEL MODELO DE REGRESIÓN Y DEL MODELO GENERAL 502 Prueba de la pendiente 502 Prueba del modelo general 505 13.1 PRUEBA DE JI CUADRADA DE BONDAD DE AJUSTE 456 Prueba de una proporción poblacional con el uso de una.l INTRODUCCIÓN AL ANÁLISIS DE REGRESIÓN SIMPLE 13.7 ESTIMACIÓN 506 Intervalos de confianza para estimar la media condicional de y:µJ'lx Intervalos de predicción para estimar un solo valor de y 507 13. 4 MULTICOLINEALIDAD Resumen 589 Términos clave 590 583 554 XV .2 PRUEBAS DE SIGNIFICANCIA DEL MODELO DE REGRESIÓN Y SUS COEFICIENTES 532 Prueba del modelo general 532 Pruebas de significancia de los coeficientes de regresión 533 143 RESIDUALES.4 INTERPRETACIÓN DE UNA SALIDA COMPUTARIZADA DE REGRESIÓN MÜLTIPLE 541 Un nuevo examen de la salida de regresión múltiple Resumen 546 Términos clave 546 Fórmulas 546 Problemas complementarios 547 Análisis de la base de datos 549 Caso: Starbucks introduce tarjeta de débito 550 Uso de la computadora 551 15 Construcción de modelos de regresión múltiple 541 552 Dilema de decisión: Determinación de compensación para directores generales 15.2 VARIABLES INDICADORAS (FALSAS) 567 15.3 CONSTRUCCIÓN DE MODELOS: PROCEDIMIENTOS DE BÚSQUEDA 573 Procedimientos de búsqueda 575 Todas las regresiones posibles 575 Regresión por pasos 576 Selección de avance 579 Eliminación inversa 580 15. ERROR ESTÁNDAR DE LA ESTIMACIÓN Y R2 Residuales 536 SSE y error estándar de la estimación 537 Coeficiente de determinación múltiple (R2) R2 ajustada 539 536 538 14.CONTENIDO 14 Análisis de regresión múltiple 522 Dilema de decisión: ¿Va usted a odiar su nuevo trabajo? 523 14.1 553 MODELOS NO LINEALES: TRANSFORMACIÓN MATEMÁTICA Regresión polinomial 555 Escalera de transformaciones de Tukey 557 Modelos de regresión con interacción 559 Transformación de un modelo 561 15.1 EL MODELO DE REGRESIÓN MÜLTIPLE 524 Modelo de regresión múltiple con dos variables independientes (primer orden) Determinación de la ecuación de regresión múltiple 526 Modelo de regresión múltiple 527 525 14. xvi ESTADISTICAEN LOS NEGOCIOS Fórmulas 590 Problemas complementarios 590 Análisis de la base de datos 594 Caso: VirginiaSemiconductor 594 Uso de la computadora 597 16 Pronóstico de series de tiempo y números índice Dilema de decisión: Pronóstico de la contaminación del aire 16.600 La medida de error de pronóstico 601 Error 602 Desviación media absoluta (MAD) 602 Error medio cuadrático (MSE) 602 16.6 NÜMEROS DE ÍNDICE 636 Números Indice sencillos e Indices de precio agregados no ponderados 636 Números Indice de precios agregados y no ponderados 637 Números índice de preciosagregados ponderados 638 Indice de precios Laspeyres 638 Indice de precios Paasche 639 Resumen 645 Términosclave 646 Fórmulas 646 Problemascomplementarios 647 Análisis de la base de datos 652 .3 ANÁLISIS DE TENDENCIAS 616 Análisisde tendencia de regresión lineal 616 Análisis de tendencia de regresión usando modelos cuadráticos 618 Método de suavizamiento exponencialde dos parámetrosde Holt 621 16.2 T:eCNICAS DE SUAVIZAMIENTO 604 Modelos ingenuos de pronóstico 604 Modelos de promedio 605 Promedios simples 605 Promedios móviles 607 Promedios móviles ponderados 608 Suavizamientoexponencial 610 16.4 EFECTOS ESTACIONALES 623 Descomposición 623 Búsqueda de efectos estacionalescon la computadora 626 Método de suavizamiento exponencialde tres parámetros de \V"LDt<n 626 16.5 AUTOCORRELACIÚN Y AUTORREGRESIÓN 629 Autocorrelación 629 Formas de superar el problema de autocorrelación 632 Adición de variables independientes 632 Transformación de variables 632 Autorregresión 632 16.1 INTRODUCCIÓN AL PRONÓSTICO 598 599 600 Componentes de series de tiempo . 3 PRUEBADE RANGO CON SIGNO DE PARESRELACIONADOS DE WILCOXON 671 Caso de muestra pequeña (n $ 15) 672 Caso de muestra grande (n > 15) 673 17.2 ANÁLISISDE PROCESOS 709 709 712 Diagramas de flujo 713 Análisis de Pareto 715 Diagramas de causa y efecto (espinazo de pescado) Gráficas de control 716 715 706 .4 PRUEBADEKRUSKAL-WALLIS 679 17.2 PRUEBAUDEMANN-WHITNEY 663 Caso de muestra pequeña 664 Caso de muestra grande 666 17.1 PRUEBADECORRIDAS 657 659 Prueba de corridas de muestra pequeña 660 Prueba de corridas de muestra grande 661 17.Caso: Debourgh Manufacturing Company Uso de la computadora 652 654 17 Estadísticas no paramétricas 656 Dilema de decisión: ¿Cómo está el negocio de las donas? 17.5 PRUEBADEFRIEDMAN 685 17.1 INTRODUCCIÓN AL CONTROL DE CALIDAD ¿Qué es el control de calidad? 707 Administración de calidad total 708 Algunos conceptos importantes sobre la calidad Estándar de referencia 709 Sistemas de inventario justo a tiempo Reingenierfa 710 Six Sigma 711 Formación de equipos 712 18.6 CORRELACIÓNDE RANGO DE SPEARMAN/COEFICIENTE DE SPEARMAN 690 Resumen 695 Términos clave 696 Fórmulas 696 Problemas complementarios 697 Análisis de bases de datos 701 Caso: Schwinn 702 Uso de la computadora l8 703 Control estadístico de calidad 704 Dilema de decisión: Control de calidad en Xerox 705 18. imax Ci9-6 Criterio max.xviii ESTADISTICAEN LOS NEGOCIOS 18.irnin Ci9-7 Criterio de Hurwicz CI9-7 Pérdida minimax CI9-9 19.3 TOMA DE DECISIONES BAJO RIESGO Arboles de decisión Cl9-14 Valor monetario esperado (EMV) CI9-14 Valor esperado de información perfecta Ci9-18 Utilidad CI9-19 CI9-14 CI9-6 793 .3 GRÁFICAS DE CONTROL 718 Variación 718 Tipos de gráficas de control 718 Gráfica x 719 Gráficas R 722 Gráficas p 724 Gráficas e 726 Interpretación de gráficas de control 728 18.4 MUESTREO DE ACEPTACIÓN 733 Plan de una sola muestra 733 Plan de dos muestras 734 Plan de muestras múltiples 734 Determinación de curvas de error y características de operación 735 Resumen 740 Términos clave 741 Fórmulas 742 Problemas complementarios 743 Análisisde fa base de datos 746 Caso: Robotron 747 Uso de la computadora 749 Apéndice A: Tablas 751 Apéndice B: Respuestas a problemas cuantitativos nones seleccionados Glosario 803 Índice 815 En el CD adjunto 19 Análisis de decisión CI9-2 Dilema de decisión: Toma de decisiones a nivel del director Ci9-3 19.2 TOMA DE DECISIONES BAJO INCERTIDUMBRE Criterio max.1 LA MESA DE DECISIÓN Y LA TOMA DE DECISIONES BAJO INCERTIDUMBRE CI9-4 Mesa de decisión CI9-S Toma de decisiones bajo incertidumbre Cl9-6 19. COITTENIDO xix 19.4 REVISIÓN DE PROBABILIDADESEN VISTA DE LA INFORMACIÓN MUESTRAL Cl9-22 Valor esperado de información muestral Resumen Cl9-33 Términos clave CI9-33 Fórmula CI 9-34 Problemas complementarios Cl9-34 Análisis de las bases de datos Cl9-36 Caso: Fletcher-Terry: en riesgo Cl9-36 Suplemento1: notación de suma Cl9-25 Sl-1 Suplemento 2: Deducción de fórmulas de regresión simple para pendiente y punto de cruce con el eje y S2-1 Suplemento3: Suavizamientoexponencial avanzado S3-1 SUAVIZAMIENTO EXPONENCIAL CON EFECTOS DE TENDENCIA: MÉTODO DEHOLT 53-1 SUAVIZAMIENTOEXPONENCIAL CON TENDENCIAY ESTACIONALIDAD: MÉTODO DE WINTER 53-2 Algunos problemas de práctica 53-5 . El enfoque filosófico básico de este texto es que toda herramienta estadfstica presentada tiene alguna aplicación en negocios. Esta edición está escrita y diseñada para un curso de introducción de dos semestres para estudiantes de estadísticas de negocios o un curso de introducción al nivel de Master en administración de empresas. el texto contiene estadísticas de negocios como herramientas de "valor agregado" en el proceso de convertir datos en información útil. un problema podría ser la consistencia en el tamaño de las donas. y está creciendo internacionalmente en el siglo xxr. se agregaron siete nuevos Dilemas de decisión y En respuesta desde que el artículo apareció por última vez en la segunda edición. práctica. está escrito de modo que el estudiante pueda fácilmente entender que la correcta aplicación de la estadística en el mundo de los negocios va de la mano con la buena toma de decisiones. Carolina del Norte. El Dilema de decisión presenta una situación en la que el personal de administración de calidad en Krispy . 2)Pronóstico de Contaminación del Aire. que mejora la posición del texto como líder en la presentación de estadísticas de negocios en una situación de toma de decisiones. establecida en 1937 por Vernon Rudolph. En la cuarta edición. El dilema de decisión es una viñeta real de negocios con que se inicia cada uno de los capítulos. con 18 capítulos. si bien sigue reteniendo la pedagogía clara y directa de ediciones anteriores. el Dilema de decisión del capítulo 17. y se expandió rápidamente a localidades fuera del sureste en la década de 1990. 6) Predicción del volumen anual de ventas de empresas de corretaje de bienes rafees por el precio promedio de las ventas. No se emplea cálculo en la presentación de material en el texto. Mientras que el texto contiene rigor estadfstico. CAMBIOSPARA LA CUARTA EDICIÓN Dilema de decisión y en respuesta Los artículos de Dilema de decisión y En respuesta que gozaron de tanta preferencia en la segunda edición pero que se pasaron al CD-ROM en la tercera edición. En esta edición se presenta la estadística como medio para convertir datos en información útil para que Jos directores tomen las decisiones mejor pensadas y con base en información. ¡Cómo está el negocio de las donas? Presenta a Krispy Kreme como una compañia especializada en donas en rápido crecimiento. se adapta muy bien a un curso de un semestre de estadísticas de negocios. la solución de las cuales requiere el uso de técnicas presentadas en el capitulo. Con esta rápida expansión. 5) Comparación de estadísticas internacionales de trabajo. 4) Estado de manufactura de autos. La compañia. 3) ¿Cómo está el negocio de las donas? (participa Krispy Kreme). Uevando así al cierre del mismo. Establece el tono para el capitulo al presentar un dilema de negocios o industria y formular varias preguntas gerenciales o estadísticas. Por tanto. Los nuevos Dilemas de decisión incluyen: 1) Estadísticas de lavanderías. aparecen de nuevo en el texto de la cuarta edición. y prácticamente todos los otros artículos se actualizaron. el cual analiza y contesta preguntas gerenciales y estadísticas puestas en el Dilema de decisión con el uso de técnicas del capítulo. agrega nuevos artículos y un interés todavia más intenso a la estadística aplicada.PREFACIO La cuarta edición de Estadística en los negocios para la toma de decisiones. y 7} ¡Va a cambiar de trabajo? Como ejemplo. AJ finalizar cada capitulo se encuentra el artículo En respuesta. Crea una situación para que las estadísticas de negocios se presenten en el capítulo. Además. El texto está escrito con la suposición de que el estudiante ya ha cursado álgebra universitaria. empezó como un pequeño fabricante y proveedor de donas a tiendas de abarrotes de la localidad en Winston-Salem. Además.S. y gana por lo menos $40 000 por año. Estadistica descriptiva. Starbucks trató de poner en práctica un nuevo concepto al lanzar su tarjeta Starbuck prepagada (de débito). En este caso. es hombre. y 3) Schwinn. capítulo 13. capítulo 12 (Análisis de datos categóricos). capitulo 17 (Estadísticas no paramétricas). En la actualidad. la compañia tiene un gran éxito en el mercado de bicicletas para montaña como primer productor de bicicletas. Casos Prácticamente todos los casos se han actualizado para esta edición y se han escrito tres nuevos casos para la cuarta edición. El teletrabajador típico vive en el oeste o el noroeste. La tarjeta fue tan bien aceptada cuando fue anunciada que a muchas tiendas se les agotó la existencia. usando para ello compañías contemporáneas: 1) Foot Locker en la fabricación de calzado. compañia de venta de bicicletas de estilo antiguo que con una larga historia de innovación. Cinco capitulos de la cuarta edición tienen nuevos artículos a cerca de estadísticas en negocios: l) Crece el uso del U. Los análisis de tabulación cruzada se llevan a cabo para estudiar la relación entre el sexo de compradores y la geografia y para examinar su parte del mercado por localidad. Además. Wireless. El articulo En respuesta.PREFAOO Di Kreme ha realizado un experimento para comparar los tamaños de donas. en donas producidas por cuatro máquinas diferentes. Se estima que para finales de 2004 habrá casi 30 millones de teletrabajadores regulares en Estados Unidos. El ingreso medio de teletrabajadores es de . de Estadísticas de trabajo por computadora. muestra al estudiante la forma en que el dilema se puede resolver mediante el uso de una prueba de Kruskal-Wallis. capitulo 3. capitulo l . la cuarta edición incluye un articulo acerca de la estadística en cada capitulo. tiene entre 35 y 44 años de edad. 3) Pronóstico del precio de un SUV. Construcción de modelos de regresión múltiple. se utiliza regresión múltiple para crear nuevos modelos para pronosticar los ingresos de ventas de una tienda. Europa y Australia. Este articulo presenta un ejemplo real de la manera en que las estadísticas presentadas en ese capítulo se aplican en el mundo actual de los negocios. Como ejemplo. tiene educación universitaria. Análisis de regresión simple. Se piensa que la tarjeta constituye una gran parte del aumento de 7% en ventas en la misma tienda a principios de 2002 y que es la razón por la que se atrajeron numerosos nuevos dientes a la tienda. En noviembre de 2001. capítulo 14 {Introducción a la regresión múltiple). las suposiciones subyacentes al uso de una ANOVA unidireccional no se pueden satisfacer. Estadística en los negocios de hoy Al igual que en ediciones anteriores. Las donas producidas por cada máquina se seleccionan al azar y se prueban para determinar si hay una diferencia de importancia en el tamaño de las donas hecbas a máquina. y 5) Perfilar usuarios en linea. Estadisticas no paramétricas. En este caso. En el segundo nuevo caso participa Foot Locker. Introducción a la estadística. En el tercer nuevo caso participa Schwinn. al final del capítulo. las distribuciones de ventas en varios niveles de precios se comparan de un año al siguiente en un esfuerzo por determinar si cambian los modelos de compras. Una de estas pruebas se ocupa de analizar datos de ventas antes y después de una campaña de ventas y la otra trata de determinar la fuerza de relación entre las ventas de una rienda y su tamaño con el uso de datos de rango. contenido en el capitulo no paramétrico. 2) Estadísticas de trabajo por computadora. Los otros dos dilemas se presentan en este Dilema de decisión y se responden en el articulo En respuesta con el uso de la prueba t de rango con signo pareado de Wilcoxon y la correlación de rango de Spearman. presentado en el nuevo capitulo de análisis categórico (ji cuadrada). El dilema es cómo analizar los datos en estas condiciones. el caso incluye un estudio entre las diferencias de edad de las compradoras en dos ciudades. En este caso. casado. El capítulo 17 trata de estadísticas no pararnétricas. unos estudiantes exploran formas de pronosticar la cantidad gastada en las tarjetas de débito mediante el uso de metodología de regresión y variables demográficas. capitulo 15. capítulo 17. un estudio realizado por Telework America mostró que 28 millones de estadounidenses trabajan por computadora. 4) Pronóstico de intensidad de exportación de empresas manufactureras chinas con el uso de análisis de regresión múltiple. el distribuidor número uno del mundo de calzado y ropa deportivos. Starbucks había activado más de 5 millones de estas tarjetas. El caso de Starbucks presenta uno de los relatos de éxito contemporáneo de un negocio ya que la compañia ha crecido de una cafeterfa en 1971 a más de 5 000 en la actualidad. con aproximadamente 3600 tiendas de ventas al menudeo ubicadas en 14 diferentes compañías en Estados Unidos. se pide a estudiantes aplicar técnicas estadísticas no paramétricas para analizar preguntas de control de calidad acerca de la diferencia en proveedores y la aleatoriedad de fallas de pintura. 2) Starbucks introduce la tarjeta de débito. Desafortunadamente. Para mediados del año 2002. Se incluyen numerosos problemas adicionales en la sección de Problemascomplementarios. Otras modificaciones en esta edición incluyen cambiar las gráficas de Pareto y gráficas de dispersión al capitulo 2 (Tablas y gráficas). Pronóstico de series de tiempo y números indice). Análisis de datos categóricos.e introducir el sistema HTABen el capítulo 9 (Prueba de hipótesis).un capítulo de la tercera edición. y se les considera independientesdesde el principio de la cuarta edición (capitulo 12) por su uso más amplio en campos como el mercadeo. Las pruebas de ji cuadrada se han extraido del capítulo de estadísticasno paramétricas (17). Al examinar hipótesis sustantivas. Todos los problemas de demostración. Se elaboraron diferentes problemas nuevos en un esfuerzo por maximizarel aprendizajede los estudiantes. Separar la presentación de regresión múltiple en dos capítulos permite al instructor la opción de limitar la exposición del estudiante a regresión múltiple. mientrasque el número total de problemas del texto es todavfa alrededor de 950. estos teletrabajadores viajan en auto unos 30 km para trabajar y se ahorran casi 53 minutos de tiempo de viaje diarios. Problemasnuevos Todos los problemas de la tercera edición se examinaron respecto a si son oportunos. se ha hecho un esfuerzo concertado para incluir sólo problemas que hacen una aportación importante al proceso de enseñanza. Para recalcar más el interés en la toma de decisiones.cambiar las medidas de asociación (coeficiente de correlación) al Capítulo 3 (Estadística descriptiva). Al igual que con la edición anterior. se ha reducido a una sección en la cuarta edición (capítulo 16. resultan de la prueba de hipótesis. Por lo general.se revisaron en su totalidad y se editaron para mayor eficiencia. .están relativamentesatisfechos con su trabajo.XXÜ ESTADISTICA EN LOS NEGOCIOS $44 000. un segundo capítulo sobre regresión múltiple y 2) el capítulo 12. por primera vez. por sus siglas en inglés). Sistema HTAB y prueba de hipótesis Para adelantar la noción de estadísticade negocios en un escenario de toma de decisiones.dando especial interés en la toma de decisiones en negocios. para dar más tiempo para temas clave. la cuarta edición contiene dos nuevos capítulos: 1) el capitulo 15. Cambiosde temas Para dar mayor claridad y destacar temas más importantes. Además.al usar sólo una introducción (capítulo 14) o explorar más a fondo y con mayor detalle el análisis de regresión múltiple mediante el uso de técnicas de modelación como es la regresión por pasos y modelos curvilíneos (capitulo 15). Setenta y cinco por ciento de quienes trabajan en casa reportaron un aumento cuantificable en productividad y calidad de trabajo cuando cambiaron de trabajos tradicionales a ser teletrabajadores. Casi todos trabajan en impuestos (IT). si las hay. claros y lógicos antes de incluirlosen la cuarta edición. Números índice. bienes raíces o administración de empresas. apropiados.Dos tercios de teletrabajadores expresaron mayor satisfacción en su trabajo y dicen que trabajan más horas que los no teletrabajadores pero que su trabajosinterfieren menos con sus vidas personales. aparecen problemas al final de casi todas las secciones de los capítulos.capitulo sobre pruebas de ji cuadrada de datos categóricos. la cuarta edición contiene una presentación de hipótesis sustantivas dentro de un contexto de hipótesis de investigación y estadisticas.el estudiante aprende a diferenciar entre significancia estadísticae importancia en negocios. el sistema HTAB. Las Implicaciones en negocios por acción de prueba de hipótesis (HTAB.así como los problemas de ejemplo.la cuarta edición introduce. Prácticamente todos los problemas de ejemplo y demostración de la cuarta edición están orientados a los negocios y contienen la información disponiblemás actualizada de que se dispone. Los que no cumplieron estos requisitos fueron sustituidos o presentadosde otra forma. Un problema de demostraciónes un ejemplo extra que contiene algún problema y su solución y se utiliza como herramientapedagógica adicional para complementar explicaciones y ejemplos de los capítulos.Mientras que la mayor parte de textos se limitan a presentar el importante proceso de prueba de hipótesis como un método de ocho pasos. Se actualizó la mayor parte de problemas que tienen valores con base en el tiempo. Uevanal estudiante por cuatro distintas fases que culminan en una decisión de negocios. el sistema HTABreorganiza el procedimiento de prueba de hipótesis en cuatro trabajos principales. Construcción de modelos de regresión múltiple. El sistema HTABpone interés en determinar qué implicacionesde negocios. Cada capítulo de la cuarta edición contiene un articulo de Estadísticas en los negocios de hoy. 20% de todos los pequeños propietarios de negocios dicen que el consejo más importante para iniciar un negocio es prepararse para largas horas y trabajo duro. Veinticinco por ciento dicen que el consejo más importante es tener listo un buen financiamiento. Los términos importantes se escriben en negritas y sus definiciones en cursivas en todo el texto. • Problemas de demostración. problemas de sección. y un Resumen del capítulo. Al inicio de cada capítulo. Consideraciones éticas. con lo cual se cierra. • En respuesta. un Dilema de decisión. el artículo En respuesta dirige las preguntas gerenciales y estadísticas que aparecen en el Dilema de decisión. Un problema de demostración contiene cierto problema de ejemplo y su solución. estudios o investigación publicada. Fórmulas. CARACTERÍSTICAS Y BENEFICIOS Cada capítulo de la cuarta edición contiene: Objetivos de aprendizaje. Cada capítulo inicia con un enunciado de los principales objetivos de aprendizaje del mismo. un caso breve describe una situación real de alguna compañía o negocio en la que surgen preguntas gerenciales y estadísticas.PREFAOO xxili Los Problemas complementarios son ejercicios "revueltos" que utilizan las diversas técnicas descritas en el capítulo. En la mayor parte de Dilemas de decisión. éstos aparecen con sus definiciones en un glosario incluido al final del libro. • Problemas de sección. • Objetivos de aprendizaje. un caso. Hart Research Associates para el Nasdaq Stock Market. Suelen estar basadas en compañías reales. Se llega a las respuestas de las preguntas gerenciales y estadísticas del Dilema de decisión al aplicar conceptos del capítulo. . • Términos clave. De acuerdo con Padgett Business Services. Situado al final del capítulo. • Dilema de decisión. y se utiliza como herramienta pedagógica adicional para complementar explicaciones y ejemplos. Se incluyen aquí algunos extractos de problemas reales en el texto: "El Wall Street [ournal reportó que 40% de todos los trabajadores dicen que cambiarían de trabajo por un 'sueldo ligeramente más alto'. ideas y técnicas importantes del mismo. 40% de los adultos en Estados Unidos han invertido en fondos mutuos" "Un estudio dirigido por la Northwestern Nacional Life lnsurance Company deja ver que 70% de trabajadores estadounidenses dicen que el estrés les causa frecuentes problemas de salud". Uso de la computadora y Salida de computadora de Excel 2000 y MlNITAB versión 13. Estadísticas en los negocios de hoy. Este artículo puede servir como vista previa del capítulo así como de repaso. Éstos se concentran en cajas que contienen una interesante aplicación con respecto a la manera en que las técnicas de ese capítulo en particular se emplean en el mundo de los negocios de hoy. Además." "De acuerdo con un estudio realizado por Gateway Computers. Además. 88% de las compañlas dicen que escasean de candidatos calificados para el trabajo" "En un estudio realizado por Peter D. Prácticamente toda sección de cada capítulo de la cuarta edición contiene problemas de demostración. • Estadísticas en los negocios de hoy. Al final de cada capítulo se presenta una lista de los términos clave. Los datos dados en el Dilema de decisión son analizados por computadora con el uso de técnicas presentadas en el capítulo. se determinó que 20% de todos los inversionistas en acciones son personas jubiladas. Problemas complementarios. Se encuentran problemas de práctica al final de casi cada sección del texto. La mayor parte de problemas utilizan datos reales reunidos de gran variedad de fuentes. cuando se citan. Además. Problemas de demostración. Cada capitulo concluye con un resumen de los conceptos. Hay más de 950 problemas en el texto. • Resumen del capítulo. una sección En respuesta. de modo que el estudiante pueda probarse a st mismo su capacidad para discriminar y distinguir ideas y conceptos. Términos clave. Análisis de bases de datos. 59% de hombres y 70% de mujeres dicen que el peso es un factor extremadamente/(muy) importante en la compra de una computadora portátil". se proporcionan datos reales y se pide al estudiante que considere la forma en que los datos pueden analizarse para contestar las preguntas. Éste enunciado provee al lector de una lista de temas clave que se estudiarán y las metas establecidas por el estudio del capítulo. Robotron o DeBourgh. es mejor usar cualesquiera medidas estadísticasque sean necesarias para presentar una imagen 'completa' de los datos. • Presentaciónde la salida del programa Microsoft"Excel y MJNITAB. Con la abundancia de datos estadísticos y análisis. e Interpretación de la salida. Coca-Cola o Colgate-Palmolive. y al final de cada capítulo la mayor parte de ellas se ponen en lista como práctica consulta. Las instrucciones incluyen notas especificasacerca de las barras de menú. Estos casos dan al estudiante una oportunidadde usar conceptos y técnicas estadísticos presentados en el capítulo para resolver un dilema de negocios.La cuarta edición tiene un fuerte enfoque en los paquetes de software Excely M!NITAB. Cada capitulo contiene un articulo de Consideraciones éticas que es oportuno dada la gran brecha existente entre ética y falta de liderazgo moral de algunos ejecutivos de negocios en meses recientes. Exceltiene considerable capacidad estadfstica. la intención es dar suficiente información para que el estudiante produzca la misma salida estadística analizada y estudiada en el capítulo. pero como el estudio es dirigido durante diferentes periodos. Casi todos Jos estudiantestienen acceso a Excel en su casa. el valor de lambda está cambiando en realidad.Se presentan más de 250 salidas de Excel 2000 y M1NITABversión 13. no incluir información pertinente para quienes toman decisiones. el estudiante debe analizar las respuestas y software de computadora para llegar a conclusiones o tomar decisiones. En la medida que esto se realice."El investigadorde negocios necesita dirigir el experimento en un entorno tal que muchas variables concomitantes sean controladas cuanto sea posible. el investigador tiene una responsabilidad ética de reportar ese hecho en sus hallazgos. En algunos casos aparecen compañías muy grandes. • Uso de la computadora. que aparece al final de capítulo. • Consideracioneséticas. Hay siete bases de datos principales en el CD-ROM que acompaña a la cuarta edición. Este articulo recalca el potencial mal uso al analizar temas como mentir con estadísticas. Se da por hecho que los estudiantes tienen una comprensión general de un entorno Microsoft• Windows. que se presenta en el capítulo. • Análisisde la base de datos. Por la gran capacidad de la herramienta de Análisisde datos y la función Paste (pegar). existe considerable potencial para el mal uso de estadísticas en tratos de negocios. las cuales han superado obstáculos para continuar en operación y desarrollo.Pruebe su comprensión. problemas para aplicación y comprensión.se ha instalado en millones de computadorasen todo el mundo. No se estudian todos los detalles de cada caja de diálogo. . escuela o trabajo. La mayor parte de casos incluyen datos brutos (que también se encuentran en el CD-ROM) para análisis y preguntas que estimulan al estudiante a usar diversas técnicas presentadas en el capitulo. En muchos casos.debido a que es parte de Microsoft Office. no satisfacer suposiciones estadísticas.xx:iv ESTADISTICAEN LOS NEGOCIOS • Fórmulas. He aquí algunos cuantos extractos de artículos de Consideraciones éticas:"No es profesional ni ético sacar conclusiones de causa y efecto sólo porque dos variables están correlacionadas". MINITAB también es importante porque ha realizado un excelente trabajo para mantener el paso con los continuos cambios y demandas de la estadística en negocios.como Thermatrix. Los investigadoresde negocios pueden producir resultados falsossi el valor de lambda se usa en todo un estudio.Al final de cada capítulo está un extenso conjunto de problemas adicionales.""Se advierte al lector que el valor de lambda se supone constanteen un experimento de distribución de Poisson.La sección Uso de la computadoracontiene instrucciones para producir la salida de software de Excel2000 y MlNITABversión 13.Otros se refieren a pequeños negocios." "Al describir un cuerpo de datos a una audiencia.problemas estrictamente de computación. generadas por computadora. • Caso. Mediante este artículo. Excel. Se supone que Ja mayor parte de estas preguntas/problemas se resuelven con el uso de una computadora. los maestros pueden iniciar por integrar el tema de ética con aplicacionesde estadísticas en negocios. Esta sección. el investigador de negocios puede dar a la audiencia sólo parte de la imagen y sesgar la forma en que el receptor comprenda los datos. que son problemas que requieren la interpretación y análisis de las respuestas del software de computadora. Al limitar las medidas descriptivas empleadas. menús descendentesy cajas de diálogo. Cada caso de fin de capítulo está basado en una compañia real. por ejemplo: la Shell Oil. Las fórmulas importantes del texto se resaltan para facilitar su lectura." • Problemascomplementarios. los cuales están divididos en tres grupos: Cálculo de estadísticas. y otros temas de principios. contiene varias preguntas/ problemas que requieren la aplicación de técnicasdel capitulo a datos en las variablesde las bases de datos. RECONOCIMIENTOS /ohn Wiley & Sons. junto con teoría didáctica sobre sumas. que aparece en este texto. la American Hospital Association. cuenta con técnicas para analizar XD' proporcio- y archivos que incluyen hojas de cálculo múltiples. la Casa de Bolsa de Nueva York. • Bases de datos. el U.S. University of California-Berkeley Tade O. compendios de capítulo. Además. si así lo desea. al mismo tiempo que mantiene el texto manejable en tamaño y duración. El CD-ROM contiene una versión completa y actualizada del capitulo 19. Material de recursospara el maestro Todo el material de apoyo para el maestro se incluye en un CD-ROM. Las transparencias PowerPoint 2000 se pueden adaptar con el uso del programa PowerPoint para facilitar su uso en clase. Leyh Publishing. y la U. las cuales están en formato Excel y MlNlTAB listas para usarse. el CD-ROM contiene una sección a cerca de Técnicas avanzadas de suavizamiento exponencial (del capitulo 16) que ofrece al maestro una oportunidad para ahondar en el suavizamiento exponencial. Bureau of Labor Statistics. • Banco de pruebas: preparado por Aarón Brown de la Arkansas State University. la U. Además. la capacidad de ejecutar regresión de polinomios. El CD-ROM contiene todas las bases de datos en formatos Excel y MTNITAB para fácil acceso y uso. Todos los datos son reales y de fuentes confiables que los usuarios reconocerán. Univesity of Hartford . El CD-ROM también contiene archivos de datos Excel y MINITAB de todos los problemas del texto y todos los casos. Análisis de decisión.S. una base de datos financiera. una contiene 168 meses de datos de series de tiempo para demostración y análisis de técnicas de pronóstico de descomposición. Moody's Handbook of Common Stocks.S. este manual contiene objetivos de capítulo. La deducción de las fórmulas de pendiente e intersección del capitulo 13 también se incluyen en el CD-ROM. En este práctico formato está incluido: • Manual del maestro: preparado por Ken Black. Estos colegas incluyen a.PREFAOO MINlTAB versión 13. mayores capacidades de administración de datos reforzada de herramientas de calidad. Cuatro de las siete bases de datos incluyen datos de series de tiempo. una base de datos de mercado accionario. Una base de datos de manufactura. una base de datos de energía. Okediji. una base de datos de salud pública y una base de datos de negocios agrícolas dan más de 8350 observaciones y 56 variables. el Banco de Pruebas incluye preguntas de opción múltiple para cada capítulo. estrategias de enseñanza de capítulo y soluciones a los casos. MATERIALES AUXILIARES PARA ENSEÑANZA Y APRENDIZAJE CD-ROM para estudiantes Cada ejemplar de la cuarta edición viene con un CD-ROM para estudiantes. una base de datos de empleo internacional. University of Oklahoma Michael Panik. así como presentación más clara y nes. Bureau of the Census. es más fácil usar la hoja de cálculo MINITAB. El Banco de pruebas se presenta en formato Microsoft" Word. • Transparencias de presentación PowerPoint™: las transparencias de presentación contienen gráficas para ayudar al maestro a crear clases interesantes. Los maestros y estudiantes ahora tienen la opción de analizar cualquiera de los conjuntos de datos utilizando la computadora. Además. en formato pdf Esto permite al maestro abarcar el material de este capitulo de la manera acostumbrada. y yo agradecemos a los revisores y asesores que se ocuparon en darnos su excelente consejo e ideas. Esta edición contiene siete bases de datos. que empleamos para dar forma y moldear el texto en la cuarta edición. este manual contiene las soluciones a prácticamente todos los problemas del texto. Department of Agriculrure. Thomas McCullough. deseo dar mi reconocimiento a mis colegas en la University of Houston-Clear Lake por su continuo interés y apoyo en este proyecto. Tres miembros de facultad de la School of Business and Public Administration en la UHCL que me han dado especialmente su ayuda y estímulo en este proyecto son Mike Hanna. editora ejecutiva. amor y apoyo. decano de la School of Business and Public Administration. director de Leyh Publishing. Como siempre. Wendi y Caycee. Ellos son: Gitti Lindner. En particular. Beth Golub. University of Massachusetts-Boston Abbas A. También me gustaría dar gracias a Rick Leyh. Carolyn. gerente de mercadotecnia. por su paciencia. Vanee Etnyre y Lee Revere. Gracias también a mis hijas. Benjamin Reece por su diaria ayuda en asuntos detallados. Hay varias personas dentro del grupo John Wiley & Sonsa quienes me gustarla dar gracias por su invaluable ayuda en este proyecto. y Susan Elbe. Faulkner University Nuestro agradecimiento especial a Aaron Brown. director. Taheri. Russell. Ken Black . También de Leyh Publishing. por su particular interés en el libro y su apoyo administrativo. quien de nuevo preparó el Banco de pruebas para la cuarta edición. me gustarla agradecer a Lari Bishop por su sostenido esfuerzo a nombre de este libro. quien es el amor de mi vida y sigue dándome su apoyo profesional y personal en mi escrito. Arkansas State University.xxvi ESTADÍSTICA EN LOS NEGOCIOS Randall K. University of Wisconsin. Deseo expresar especial agradecimiento a mi esposa de 34 años. director y Ted Cumrnings. Fox Valley Michael Walcott. quien visualizó el potencial para este proyecto y ha dado continuo apoyo y motivación. Jim Hays. desea agradecer a William Staples. Yavapai College Daniel Shimshak. editora de publicaciones. y Michele Chancellor y Jennifer Fisher por su fuerte trabajo de producción. Southwest lnformation Resources. ciencia administrativa. Ken Black y su esposa Carolyn tienen dos hijas. Connect Corporation y Eagle Engineering. obtuvo su titulo de licenciatura en matemáticas del Graceland College. NYLCare. pronósticos. AT&T.D en investigación educacional de la University of North Texas. City of Houston. investigación de mercado y administración de producción/operaciones. leer. un Ph.ACERCA DEL AUTOR Ken Black es actualmente maestro en Ciencias de decisión en la Escuela de Negocios y Administración Pública de la University of Houston-Clear Lake.Ha publicado quince artículos y más de veinte ensayos profesionales. El Profesor Black ha sido asesor para numerosas empresas. titulo de Master en matemáticasde la University ofTexas en El Paso. viajar y participaren competencias atléticas de pista y campo para maestrosasí como salto de longitud. Nació en Cambridge.D.y un Ph. el Profesor Black ha dado clases en todos los niveles de cursos de estadística. Cayceey Wendi. Massachussets y fue criado en Missouri. .asi como dos textos: Estadistica en Negocios: Curso de Introducción y Estadistica de Negocios: Toma de Decisiones Contemporánea. en administraciónde negocios y ciencia administrativa. incluyendo Atenía. Sus pasatiempos favoritos incluyen tocar guitarra. Johnson Space Center. Desde que se unió a la facultad en 1979. 2. Definir la estadística. 4. '~ OBJETIVOS DE APRENDIZAJE El objetivo fundamenta] del capítulo 1 es introducir al lector al mundo de la estadística. 3. con lo cual podrá: · l. 2 . Clasificar números por nivel de datos y comprender por qué es importante hacerlo así.CAPÍTULO 1 Introducción a la estadística ~ ·~~ --~ . Distinguir entre estadística descriptiva e inferencial. Estar consciente de Ja amplia gama de aplicaciones que tiene la estadística en los negocios. tiéa de~~Hb~·. La meta de esta compañia es que más de la mitad de sus ingresos para el año 2003 provenga de la zona rural de la India. Hindustan Lever Ltd.----~~- ·i . la India rural se puede describir como pobre y con alto índice de analfabetismo. Colgate-Palmolive planeó aumentar su presupuesto de mercadeo rural a cinco veces más que en 1991. - La India es el segundo país más grande del mundo._~-~" . pero el mercado rural para productos de cuidado personal está creciendo tres veces más rápido que en mercados urbanos. si es así.~¡. Tres cuartas partes de la población vive en zonas rurales. Uno de estos métodos es el uso de camionetas tipo Combi. Aun cuando el mercado urbano de la lndia parece estar saturado.. Algunas evidencias indican que los consumidores de estas regiones de la India están comprando productos en números crecientes. debido a las reformas de mercado libre que ocurrieron en la década de 1990 y a Ja fuerte producción agrícola. un vendedor abre la puerta y presenta en una pantalla. El dilema al que se enfrentan las empresas es entrar a este mercado y. Además. Por tanto. por ejemplo Microsoft. La India rural es un enorme mercado que los negocios no han explotado. Con todo.zona· rural. las condiciones están cambiando y están entrando empresas en este mercado en apariencia no explotado. y otras. pero las estadísticas de ingresos muestran una limitada capacidad de compra. Kellogg's. un video con escenas que describen la necesidad de un determinado producto. ~:§áili':2. han entrado al mercado de la India. numerosas empresas estadounidenses. En la actualidad. Después de terminar el video. Las estadísticas de que se dispone de la primera mitad de la década de 1990 arrojaron alguna luz sobre el mercado potencial de la India rural. ei ·estado de los negocios ): ~--. y 23% gana entre $574 y $1 146. en comparación con los 160 gramos en zonas urbanas de la India y 400 gramos en Estados Unidos. Más de 65% de la población de las zonas rurales gana menos de $574 dólares al año. 3 . en qué medida y en qué forma. Debido a estos factores. 39% tienen electricidad.~: ~en la'.~: és~t. No obstante lo anterior.4í. Cuando los pobladores se acercan al vehículo.... se distribuyen muestras gratis. El jabón de tocador aumentó de 158 919 toneladas métricas en 1990 a 231 084 toneladas métricas en 1994. el potencial para un crecimiento mucho mayor ya está ahí. Las ventas en la India rural son un desafio y se requiere de métodos no tradicionales porque los porcentajes de analfabetismo son altos y sólo alrededor de un tercio de los hogares tiene televisión. Una de estas camionetas entra en un pequeño poblado con altavoces que reproducen una popular melodía de cine. ~ ta' India . 18% tienen agua potable y 7% tienen retretes con agua de descarga. pero aun asi el mercado rural representa sólo alrededor de un tercio de las ventas totales de productos nacionales. con lo cual ofrecen enorme potencial. lo cual hace más viable estos esfuerzos de mercadeo..i~. El consumo anual per cápita en pasta dentífrica es todavía de 30 gramos por persona en la India rural.dé - . los mercados en las zonas urbanas están relativamente sin explotar.e:-__ -. Setenta y siete por ciento de hogares de zonas rurales usan madera como combustible para cocinar. la principal empresa de la India de productos de consumo. el mercado rural de la India ha estado más abierto al comercio en artículos de consumo.. con más de mil millones de habitantes. al igual que 38% de los hombres. Por ejemplo. que en la actualidad constituye sólo 30% del negocio. El consumo de pasta dentífrica en la India rural se duplicó de 8 825 toneladas métricas en 1990 a 17 023 en 1994. '. de 497 mil litros a dos millones 116 mil litros en 1994. General Electric. Las ventas de champú aumentaron a casi cuatro veces. Sesenta y seis por ciento de las mujeres son analfabetas. Las ventas de detergente para lavanderia aumentaron de 272 540 toneladas métricas en 1990 a 422 741 toneladas métricas en 1994. Otras empresas utilizan campañas de venta de puerta en puerta para promover productos en zonas rurales de la India. estima que el costo por contacto de este mercadeo es alrededor de cuatro veces más que el costo a quienes viven en ciudades. . a finales de la década de 1990.. con-sistemas de video en los cuales se presentan anuncios que en zonas rurales duran media hora. el advenimiento de televisión por satélite a casas y poblaciones rurales en la India abre algunos medios nuevos para hacer publicidad y mercadeo a este segmento de la población.. Las ventas para otros productos se han incrementado rápidamente en este mercado en desarrollo. Estos porcentajes son casi el doble de los de zonas urbanas. rhe·. Las estadísticasde negociosson la herramienta mediante la cual estos datos se recolectan."Understanding the Market Envircnment oí lndia". enero 2000. ¡qué otros niveles de medición de datos podrían estar representados? 6. En todo momento en días hábiles. obesidad o hábito de fumar..en empresas estadounidenses medianas y grandes. ¡Son exactos estos datos o estimaciones? 3.Esta informaciónsuele llegar en forma de datos o está acompañada de ellos..t. El estudio demostró que los trabajadoresdeprimidos tenían gastos médicos 70% más altos que los no deprimidos. RinlruPegu. las estadísticas de negociosdesempeñan un importante papel en el presenteconjunto de hechos de toma de decisión dentro del dinámico mundo de los negocios. junto con otras estadísticas reportadas en este estudio. ¡Cómo saldrían los investigadoresa recabar estos datos? 4. hrrp:/lwww. "Maya Buar". 1..La mayor parte de estas decisionesse toman con la asistencia de información reunida acerca del mercado. Al medir la India rural como mercado.Jc.dejó ver que casi 35% dijeron que el correo directo y catálogos eran la forma más eficiente en costo para llegar a sus clientes.. Dicha información.la fuerza laboral. Once por ciento dijeron que Internet era el de costo más eficiente. 30 de mayo. resumen y presentan para facilitar el proceso de toma de decisiones. Por otra parte. ¡Qué clases de estadísticasse presentan en este reporte? 2. El mejor camino al mercado Un estudio dirigido por Pitney Bowesde 302 directores y vicepresidentesde mercadeo y comunicaciones de mercado. El estudio también mostró que más de 25% dijeron que la mejor forma de aumentar la identidad de marcas era por correo directo o catálogos. los gastos médicos para personas que sufren de alta presión sanguínea eran sólo 11 % mayores que los que no tenian esta enfermedad.1 LA ESTADÍSTICA EN LOS NEGOCIOS Prácticamente todos los aspectos de los negocios utilizan estadísticasen la toma de decisiones. Video VansSell Toothpaste and Shampoo~W1dlStrttt /ournal. 1999.Por tanto. entonces harían bien en enterarse de un estudio hecho a unos 46 mil empleadosy dirigido por la Health Enhancement Research Organization.~tas y otras estadísticasreunidas y resumidas en dicho estudio pueden ayudar a quienes toman decisionesa resolver el dilema de encontrar vehiculos eficientes en costo para sus productos.¡qué otras estadísticaspodrlan reunirse! 5. puede ayudar a quienes toman decisiones para diseñar una estrategia y reducir gastos médicos entre trabajadores.com/99may301bizHtm. el entorno económicoy financiero.4 ESTADISTICA EN LOS NEGOCIOS Preguntas gerenciales y estadísticas l. se toman decisiones en empresas en todo el mundo que determinan si las empresas serán rentables y en crecimiento o si estarán estáticas y desaparecerán.. M1riam Jordán. ¡Qué niveles de medición están representados en estos datos?Si se reunieran otras estadísticas.Business Horuons.10 de enero de 1996. ¡Cómo podrían los gerentes usar estas estadísticas para tomar mejores decisiones acerca de entrar a este mercado? Futnttt adaptado de Raja Ramachandran.He aquí algunos ejemplosdel uso de la estadística en diversos camposde negocios. "ln Rural India. en el siglo XXI.y quienes los que decían estar bajo constante estrés tenían gastos 46% más altos que sus semejantes libres de él. . Estrés en el trabajo Si quienes toman decisiones buscan maneras de reducir gastos de servicio médico entre sus trabajadores. la competencia y otros factores.analizan. los investigadores descubrieron que la depresión y el estrés parecen tener mayor impacto en gastos médicos más altos que el alto contenido de azúcar en la sangre.En éste. Th< l\'. CAPtruLo 1 INTRODUCCIÓN A LA ESTAD!ST!CA 5 Decisiones financieras En un estudio reportado por RHI Management Resources. 2) fusión o adquisición.1 es una gráfica producida en Excel. comparada con sólo 42% en 1998.. También vamos a explorar diversas maneras de pronosticar valores futuros y examinar técnicas para pronosticar tendencias. Ochenta por ciento en 2001 respondió que la tecnología mejora la comunicación con clientes..s 20 o ~c. mejora de tecnología (18%). Estas estadísticas. y 6) otro.. Empecemos. en comparación con 54% en 1998. o 1960 1965 1970 1975 1980 Año 1985 1990 1995 2000 . 5) ninguno de estos factores.. ¿Cómo está la economía? Un informe del Wal/ Street loumal. La figura 1. El impacto de la tecnología en el trabajo Greenfield Online dirigió por Internet un estudio de 1 403 encuestados. y el porcentaje de desempleo. Cincuenta y cuatro por ciento en 2001 dijo que la tecnología alivia el estrés del trabajo. Ochenta por ciento en 2001 estuvo de acuerdo con que la tecnología aumenta la productividad durante las horas normales de trabajo. así como sus técnicas estadísticas nos esperan en nuestro viaje por la estadJstica para negocios. lanzamiento de un nuevo producto o servicio (10%). para determinar si los usuarios de tecnología aprecian los beneficios de la tecnología más en 2001 que en 1998. 80 ·¡:¡ 60 .. para la Society of Financia! Service Professionals. Ochenta y siete por ciento de los encuestados en 2001 dijo que la tecnología expande el conocimiento relacionado con el trabajo. En este texto examinaremos diferentes tipos de gráficas para representar datos cuando estudiemos diversas maneras de ordenar o estructurar datos que sean útiles y tengan sentido para quienes toman decisiones. ce de precios msurnidor 1todoslos nes urbanos i0-2000) ~ o :s E ae 140 120 100 o V -¡. Los datos fueron publicados por el Federal Reserve Bank en St. a los principales oficiales financieros se les preguntó cuál de las siguientes iniciativas pondrían en espera en una economía incierta: 1) expansión. Este texto también incluye numerosas herramientas estadísticas para probar hipótesis y para estimar valores de poblaciones. 40 . el aumento en porcentaje en el producto interno bruto. el número de solicitudes iniciales de personas sin trabajo. del Indice de precios al consumidor para todos los consumidores urbanos cada cinco años por los últimos 40 años. ninguno (9%) y otro (8%).. pueden servir como indicadores de estados económicos y financieros por venir y quienes hacen pronósticos pueden usarlas cuando tratan de pronosticar futuros climas de negocios. publicado para ayudar a inversionistas y otras personas que toman decisiones para averiguar el estado de Ja economía. un Indice de confianza del consumidor. Aprenderemos las técnicas para que el muestreo de una población permita realizar estudios a menor costo y en forma más oportuna en el mundo de los negocios. Treinta y dos por ciento de los encuestados indicaron que pondrían en espera sus planes de expansión en una economía incierta. Éstas y otras estadísticas interesantes. Louis. seguida por una fusión o adquisición (23%). comparado con sólo 26% en 1998. y otras. 4) mejora de tecnología. 3) lanzamiento de un nuevo producto o servicio. en comparación con 66% en 1998.. V :¡. incluyó estadlsticas de negocios como son el número de ventas de casas nuevas. si un maestro . analiza. Pueden decir. al realizar experimentos de control de calidad para determinar el promedio de vida útil de bombillas eléctricas. al igual que muchos otros campos de estudio. Tipo de distribución empleada para analizar datos. 4. un fabricante de bombillas podría muestrearal azar sólo 75 bombillas durante un lote de producción. Una población puede ser un grupo de personas. Si un investigador está interesado en averiguar las calificaciones de la Scholastic AptitudeTest (SAT) de todos los estudiantes de la Universityof Arizona. 3. puede ser un conjunto de medidas descriptivas calculadas de una muestra y empleadas para hacer determinaciones acerca de una población. Por varias razones (que se explican en el capítulo 7). Los siguientes son algunos de los usos comunes de la palabra estadística. un investigador que utiliza la distribución t para analizar datos puede referirse al empleo del estadístico tal analizar los datos.la estadísticaincluye todos los temas presentados en este texto. El Webster's Third New Intemational Dicrionary define población como 1111 conjunto de personas. l. como "todos los autos Ford Mustang producidos de 1998 a 2002". Por ejemplo.sin embargo.es representativa del conjunto. Este uso se estudia más adelante en este libro. 7. La población puede ser una categoría ampliamente definida. el gobierno trata de medir toda la población que vive en este país. 6. segunda. Es importante empezar nuestro estudio con una introducción de algunosconceptos básicos para comprender el tema y comunicamos. Cada 10 años. que tiene varios significados diferentes en nuestra cultura. pueden ser las distribuciones empleadas en el análisis de datos.por ejemplo "todos los automóviles" o puede ser estrechamente definida. la Uaman censo. Casi todos estamos familiarizados con el censo de Estados Unidos. 2. ofrecen cursos de estadísticadentro de sus propias disciplinas.6 ESTADISTICA EN LOS NEGOCIOS 1. objetos o artículos de interés.o puede ser un conjunto de objetos.2 CONCEPTOS ESTADÍSTICOS BÁSICOS La estadística.Debido a limitaciones de tiempo y dinero. interpretación y presentación de datos numéricos. que han reunido estadísticas de la operación de su negocio. 5. Una muestra es una parce del conjunto y. El Webster's Third New /nternational Dictionary da una definición completa de estadística como una ciencia que se refiere a la acmnulación. Curso de estudio. si se toma adecuadamente. como "todas las lavadoras producidas el 3 de febrero de 2003. Datos y cifras. Rama de las matemáticas. Es frecuente que algunas personas se refieran a la palabra estadística como un grupo de datos. Una de las principales es subdividirla en dos ramas: estadística descriptiva y estadística inferencia!. El investigador define a la población como cualquier cosa que estudie.primera.la estadística se ba convertido en un curso de estudio por derecho propio. Medición de muestra. El estudio de la estadística se puede organizar en diversas formas. A lo que se refieren es a datos y cantidades medidas. por la General Electríc Company en la planta de Louisville". Una muerte.incluyendo el de negocios. una forma de hacerlo es llevar a cabo un censo de todos los estudiantesque en la actualidad se encuentren inscritos en esa universidad. Cuando los investigadoresreú11en datos de toda la població11 para una medida de interés determinada. Para comprender la diferencia entre estadística descriptiva e inferencia!. Por ejemplo. Los medios de comunicaciónusan la palabra estadística para referirse a una muerte. Muchos campos académicos. un gerente de recursos humanos podría tomar una muestra al azar de 40 empicados en lugar de usar un censo para medir el estado de ánimo de la compañía. Si un analista de negocios 11tiliw los datos que retí11e 1m grnpo para describir o llegar a condusiones acerca de ese mismo grupo. por ejemplo "todos los trabajadores actualmente empleados por Microsoft". Por ejemplo. análisis. Empecemos con un análisis de la palabra estadística. interpreta y presenta datos.por ejemplo. también es una rama de las matemáticas y la mayor parte de la ciencia estadística está basada en pensamiento y deducción matemáticos. La palabra estadística se usa en por lo menos otras dos formas importantes. Vista desde esta perspectiva. la estadística se llama estadística descriptiva. los investigadoresa veces prefieren trabajar con una muestra de la población en lugar de toda la población. tiene su propio lenguaje. ser una estadística en este sentido de la palabra es obviamente indeseable. Ciencia que reúne. son útiles las definiciones de población y de muestra. un fabricante de máquinas lavadoras probablemente desea determinar el número promedio de cargas que una máquina nueva puede lavar antes que necesite reparaciones. Por ejemplo. el cálculo de parámetros por lo general es imposible o no factible debido al tiempo y dinero necesarios para llevar a cabo un censo. Por tanto. Las estadísticas inferenciales se conocen a veces como estadísticas inductivas. las estadísticas son descriptivas.los investigadores pueden diseñar experimentos con pequeñas muestras de pacientes seleccionadas al azar y tratar de llegar a conclusiones y hacer inferencias acerca de la población. muestrear al azar cada estrato y usar estadística inferencial. La ventaja de usar estadística inferencia! es que hace posible que el investigador estudie efectivamente una amplia gama de fenómenos sin tener que llevar a cabo un censo. En tales casos. Por lo general los parámetros se denotan con letras griegas. La diferenciación entre los términos parámetro y estadístico es importante sólo con el uso de la estadística inferencial. Si un investigador reúne datos de 11na muestra y utiliza la estadística generada para llegar a conclusiones acerca de la población de la cual se toma la muestra. La mayor parte de estadísticas deportivas. El uso e importancia de la estadística inferencia! continúa en crecimiento. . La producción de algunos medicamentos nuevos es costosa para producirlos. calcula el número de lavadas antes de reparar por cada máquina. Una medida descriptiva de la población se denomina parámetro. La base para la estadística inferencial. parte de este texto está dedicado a la probabilidad (capítulo 4). Con el uso de La estadística inferencial. varianza poblacional (cr2). o presentar cualesquiera otras medidas de datos para el grupo con base en la prueba. para determinar la efectividad del anuncio para los diversos grupos de edades de la población. y desviación estándar de población (o). rebotes y primer down son estadísticas descriptivas porque se usan para describir el esfuerzo de un individuo o de un equipo. En un esfuerzo por estimar el nivel de confianza en el resultado del proceso. y desviación estándar muestra! (s). El maestro puede usar estas estadísticas para analizar el promedio del grupo. A menos que los parámetros se calculen directamente de la población. los estadísticos usan expresiones de probabilidad. entonces. calcular un estadistico en la muestra. por tanto las pruebas deben estar limitadas a muestras pequeñas de pacientes. hablar acerca de los márgenes de calificaciones del grupo. el promedio de salario en la oficina de Denver. Un experto en estadística de una compañia toma una muestra de máquinas. como la media muestra! (X). promedia los números y estima el valor poblacional o parámetro con el uso de la estadística. Podrían incluir el número de empleados en vacaciones durante el mes de junio. ventas corporativas para 2002. El investigador podría estratificar la población en categorías de edades que van de jóvenes a viejos. Las inferencias acerca de parámetros se realizan bajo incertidumbre. Ejemplos de parámetros son media poblacional (µ. Muchos de los datos estadísticos generados por negocios son descriptivos. Sin embargo. varianza muestra! (s2). es la capacidad para tomar decisiones acerca de parámetros sin tener un censo completo de la ~K~ . Una medida descriptiva de una muestra se llama estadístico y suelen denotarse con letras romanas.CAPITULO 1 INTRODUCCIÓN A LA ESTADISTICA 7 produce estadísticas para resumir el esfuerzo de examen de un grupo y las emplea para llegar a conclusiones acerca de sólo ese grupo. el investigador de negocios puede tomar una muestra al azar de la población.2 demuestra el proceso inferencial. Una aplicación de estadística inferencia! es en investigación farmacéutica. Supongamos que una empresa fabricante de bebidas gaseosas crea un anuncio publicitario que representa una máquina despachadora que habla al comprador y los investigadores de mercado desean medir el impacto del nuevo anuncio en varios grupos de edades. la estadística es inferencial. El parámetro es la media poblacional o número promedio de lavadas por máquina antes de reparaciones. Otro tipo de estadlstica se denomina estadística inferencial. el experto en estadística nunca sabe con certeza si los estimados o inferencias hechos a partir de muestras son verdaderos. La figura 1. por ejemplo promedio de bateo. Los datos reunidos se emplean para inferir algo acerca de un grupo más grande. Los investigadoresde mercados utilizan estadistica inferencia! para estudiar el impacto de la publicidad en diferentes segmentos del mercado. Un investigador de negocios a veces desea estimar el valor de un parámetro o realizar pruebas acerca del parámetro.). que en este caso es el promedio muestral. promedio de calificación de satisfacción gerencial sobre un censo de las actitudes de los empleados en la compañía y el promedio de rendimientos sobre inversión para la Lofton Company entre 1988 y 2002. e inferir por estimación el valor del parámetro. La mayor parte de los temas estudiados en este texto pertenecen a estadística inferencial. Los números que representan datos de nivel nominal (la palabra nivel se omite a veces) se puede usar sólo para clasificar o asignar categorías. lugares geográficos de establecimientos de venta al menudeo. Lo correcto del análisis de datos es que depende del nivel de medida de los datos recolectados. Intervalo 4. el investigador de negocios necesita saber el nivel de medición de datos representado por los números que se analicen. Ordinal 3. a un educador se asigna un 1. Los números de identificación de empleados son un ejemplo de datos nominales. que podrian representar los pesos de dos objetos que se embarcan.8 ESTADISTICA EN LOS NEGOCIOS ifüil¡fli Proceso de estadística inferencia! para estimar la media poblacional(µ) Población Muestra (parámetro) (estadística) µ i Seleccionar una muestra al azar 1. y así sucesivamente. De razón Nivel nominal El nivel más bajo de medición de datos es el nivel nominal. Numerosas preguntas demográficasde estudios resultan en datos que son nominales debido a que las preguntasse emplean sólo para clasificación. l. es probable que el receptor abierto no sea del doble del tamaño del defensa. A continuación veamos cuatro niveles comunes de medición de datos. Los números se emplean sólo para diferenciar empleados y no para hacer una exposición del valor de ellos. los números representan costos en dólares de artículos producidos. pesos de embarques y clasificaciones de subordinados en revisiones anuales. las clasificacionesrecibidas en una prueba al consumidor por dos productos diferentes. para fines de cómputo. los cuales representan miles de artículos. Todos estos datos no deben ser analizados de la misma manera · estadística porque las'entidades representadaspor los números son diferentes.3 MEDICIÓN DE DATOS Millones de datos numéricos se captan todos los días en negocios.o los números en la camiseta de un equipo de fútbol de un defensa y un receptor abierto. El siguiente es un ejemplo de esta pregunta que resultaría en datos nominales: ¡Cuál de las siguientes clasificacionesde empleo describe mejor su campo de trabajo? a) Educador b) e) d) e) f) Trabajador de la construcción Trabajador de manufacturas Abogado Doctor Otro Supongamos que. El uso dispar de números se puede ilustrar con los números 40 y 80. Por ejemplo. a un trabajador de la construcción un 2. Aun cuando 80 libras es el doble de 40 libras. Promediar los dos pesos parece razonable pero promediar los números de las camisetas en fútbol no tiene sentido. Estos números deberían . El fenómeno representado por los números determina el nivel de medición de datos. Por esta razón. Nominal 2. a un trabajador de manufacturas un 3. Prácticamentetodos estarán de acuerdo con que 5 es más alto que 4 en esta escala y que es posible clasificar las respuestas. Debido a que los datos nominales y ordinalesse deducen a vecesa partir de mediciones imprecisas. no los adjetivos.números de identificación de empleados y números de código postal son ejemplos adicionales de datos nominales. Los números que clasifican a estas empresas son sólo ordinales en su medición. como las preguntasdemográficas. Además de las posibilidades del nivel nominal. medio y bajo riesgo. Con datos ordinales.las diferencias en riesgo entre las categorias 1. por ejemplo 20º. ella podría no decir que las diferenciasen la cantidad de productividad entre los trabajadores clasificados 1. si a un fondo se le asigna 3 en lugar de 2. 2 y 3 no son necesariamenteiguales. Otro ejemplo del uso de númerosordinales en negocios es la clasificación de las 50 compañías más admiradas en la revista Fort11ne. el supervisorpodría no usar datos ordinales para establecer que son igualeslos intervalosentre los empleados clasificados1 y 2 y entre los empleados clasificados2 y 3. Los números de seguro social. un poco útil. las distancias o separación representadas por números consecutivos no siempre son iguales. los datos de intervalo tienen intervalos iguales. Por ejemplo. . Nivel ordinal Una medición de datos de nivel ordinal es más alta que el nivel nominal. si al alto riesgo se le asigna un 3 de calificación. son las mismas.la categorizaciónde personas u objetos. esto es. moderadamente útil.al riesgo medio 2 y al bajo l. 21 °y 22º.y asl sucesivamente. las temperaturas se puedan clasificar y las cantidades de calor entre lecturas consecutivas. esto es. 2 y·3 son necesariamente las mismas.pero la mayoria de quienes responden a la encuesta no considerarlan como iguales las diferencias entre no útil.CAPITULO 1 INTRODUCCIÓN A LA ESTADISTICA 9 usarse sólo para clasificar personas que respondieron la encuesta. El siguiente es un ejemplo de una de estas escalas: · Este material didáctico de computadora es: no útil poco útil 2 moderadamente útil 3 muy útil 4 extremadamente útil 5 Cuando esta pregunta de estudio se codifica para la computadora.la supervisora puede evaluar tres empleadosal clasificar su productividad con los números del J al 3. grupo étnico. Un ejemplo de medición de intervalo es la temperatura Fahrenheit. ubicación geográfica y lugar de nacimiento.sólo permanecerán los riümeros del 1 al 5. Algunos otros tipos de variables que con frecuencia producen datos de nivel nominal son el sexo. Las distancias representadas por las diferencias entre números consecutivos son iguales. Algunas escalasdel cuestionario tipo Likert son consideradas por muchos investigadorescomo de nivel ordinal. Nivel de intervalo La medición de datos de nivel de intervaloes el siguiente al nivel más alto de datos en el qut las distancias entre números consecutivos tienen significado y los datos son siempre n11méricos.monetario y de tasas de interés. Coa números de temperatura Fahrenheit.s y ordinales son datos no métricos y a veces se conocen como datos cualitativos. los datos nominale. lleva más riesgo. números telefónicos. Las técnicas estadísticas que son apropiadaspara analizar datos nominales son limitadas. por otra parte. El número J no denota la clasificación más alta. al menos productivo y a quien está entre los anteriores.la supervisora podria identificar al empleado más productivo. con el uso de datos ordinales. No obstante.o la clasificaciónde artículos. se puede aplicar a datos nominalesque producen informaciónútil. Ahora bien. religión.No obstante. Con datos ordinales. Estas medidasde riesgo se aplican a inversionescuando se clasificancomo de alto.Ciertas técnicas estadísticasson especialmente apropiadas para datos ordinales pero otras muchas no son apropiadas para usarse en este tipo de datos. la medición de nivel ordinal se puede usar para clasificar u ordenar objetos.por ejemplo la estadística ji cuadrada. Se usa sólo para diferenciar un educador (1) de un abogado (4). Los fondos mutuos como inversionesse clasificana veces en términos de riesgo al usar medidas de riesgo por incumplimiento.por lo que estas medidas de riesgo son sólo medidas de nivel ordinal. muy útil y extremadamente útil. no obstante algunas de las estadísticas más empleadas. Debido a que los datos de nivel de intervalo y de razón suelen ser capturados por instrumentos precisos que con frecuencia se emplean en procesos de producción e ingeniería. El valor de cero no se puede asignar en forma arbitraria porque representa un punto fijo. Este texto se concentra principalmente en estadísticas paramétricas. Como un ejemplo. Los datos de razón tienen las mismas propiedades que los datos de intervalo pero los datos de razón tienen un cero absoluto y la razón entre los dos números es significativa. tiempo. Algunas técnicas estadísticas requieren de datos de razón y no se pueden usar para analizarotros niveles de datos. puede ser utilizado en otras técnicas estadísticas. Ejemplos de datos de razón son la altura. los datos de razón pueden ser analizados por cualquier técnica estadística aplicable a los otros tres nivelesde datos más algunas otras. Por ejemplo. Con datos de razón. Comparaciónde los cuatro niveles de datos ifüii¡l·ii Uso del potencial de varios niveles de datos La figura 1. ordinales o de intervalo. es posible para un experto en estadística hacer comparaciones de razón y apropiadamente realizar cualquier análisis posible en datos nominales.en pruebas de estándares nacionales. La noción de cero absoluto significa que cero es fijo. Con datos de nivel de razón.~~~~~~~----°"======================!!!!!!!!!'!!!!!!!!!!'!!!!!!!!!!'!!!!!!!!!!'!!!!!!!!m--------------~ 10 ESTADISTICA EN WS NEGOCIOS Además. Las estadísticas paramétricasrequieren que los datos sean de intervalo o de razón. y = ax. y el cambio en dólares en el precio de acciones. no se requiere del factor b para convertir unidades de una medición a otra. Los datos nominales son los más limitados en términos de análisis estadísticos que se utilicen con ellos. o bien. Algunos otros ejemplos de datos de nivel de intervalo son el porcentaje de cambio en empleo. Otros ejemplos en el mundo de los negocios. convertir de temperatura en centígrados a temperatura Fahrenheit hace necesaria la relación: Fahrenheit = 32 + f centígrados Nivel de razón La medición de datosde nivelde razón es el nivel más alto de medición de datos. que contienen técnicas no paramétricas. buena parte del material de este texto requiere que los datos sean datos de intervalo o de razón. además. Si los datos son nominales u ordinales. a. y sumar otro factor. Con datos de nivel de intervalo. se denominan datos métricos y a veces se conocen como datos cuantitativos. número de camiones vendidos. esto es. tal que y = b + ax. y número de empleados. un investigador puede expresar que 180 libras de peso es el doble que 90 libras. volumen y la temperatura Kelvin. E] . Como ejemplo.deben usarse estadísticas no paramétricas. Por tanto. Por tanto. y el valor cero en los datos representa la ausencia de la caracterlstica en estudio. con excepción los capitulo 12 y 17. peso.con datos de nivel de intervalo. b. al convertir altura de yardas a pies: 1 pie = 3 · yardas. tiempo de medición de un trabajo. Los cuadros concéntricos denotan que cada nivel más alto de datos puede ser analizado por cualquiera de las técnicas empleadas en niveles inferiores de datos pero. quejas por 1 O mil volantes. Muchos de los datos capturados por máquinas en la industria son datos de razones. convertir las unidades de una medición a otra implica multiplicar por algún factor. De intervalo Las técnicas estadísticas pueden separarse en dos categorías: estadisticas paramétricas y estadísticas no paramétricas.3 muestra las relaciones del potencial de uso entre los cuatro niveles de medición de datos. el punto cero es un asunto de convención o conveniencia y no un punto cero natural o fijo. Esta definición hace posible que el experto en estadística pueda crear razones con los datos. millas pasajero. El cero es sólo otro punto en la escala y no significaausencia del fenó- meno. cero grados Fahrenheit no es la temperatura más baja posible. Con datos de razón.Las estadisticas no paramétricas también se pueden usar para analizar datos de intervalo o de razón. el porcentaje de rendimiento de una acción financiera. que son nivel de razón en mediciones. en otras palabras hacen una razón de 180:90. son el tiempo de ciclo de producción. o en procedimientos estandarizados de contabilidad. Los datos ordinales permiten al investigador realizar cualquier análisis que se pueda elaborar con datos nominales y algunos análisis adicionales. a "poco importante" un 3. Análisis estadístico usandola computadora: Excel y MINITAB El advenimiento de la computadora moderna abrió numerosas y nuevas oportunidades para el análisis estadístico. No obstante. Clasifique la capacidad de su médico: _excelente _buena _muy buena _regular _mala 6. Además. cuanto más alto el número. clasifique la atención de enfermeras: Mala 1 2 3 4 5 6 7 Excelente Soluci6n La pregunta 1 es una medición de tiempo con cero absoluto y por tanto es una medición de nivel de razón. Es probable que las preguntas 3. recuperar y transferir grandes conjuntos de datos. ¿Qué tan grave era su estado de salud cuando fue ingresado al hospital? _menor _crítica _grave _moderada 5. administradores de hospitales a veces envían por correo una encuesta de satisfacción de calidad a sus pacientes después que éstos son dados de alta. más importante es la ubicación del hospital. estas respuestas se pueden clasificar por selección. Esta pregunta no requiere jerarquía o clasificación del tipo de la unidad. los aumentos en importancia de 1 a 2 a 3 a 4 no son necesariamente iguales. y no se asignan adjetivos descriptivos a los números. . ¿En qué nivel de medición de datos resultarán estas preguntas? 1. Supongamos que se asigna un número a los descriptores en cada una de estas tres preguntas. 4 y 5 resulten en datos de nivel ordinal. Una persona que ha estado fuera del hospital durante dos semanas lo ha estado el doble de tiempo que alguien que ha estado fuera sólo una semana. Otros investigadores podrían argüir que por la imprecisión de la escala y lo vago de los valores de selección entre "malo" y "excelente". son tan tediosas y lentas de calcular en forma manual que fueron de poco uso práctico para investigadores antes de que se perfeccionaran las computadoras. ¿En qué tipo de unidad estuvo la mayor parte de su estancia? atención coronaria cuidados intensivos maternidad unidád médica unidad pediátrica unidad de cirugía 3. el programa de la computadora se ha perfeccionado para analizar datos por medio de refinadas técnicas estadísticas. y a "nada importante" un 1. Para la pregunta 3. a "muy importante" podría asignarse un 4. ¿Hace cuánto tiempo que se dio de alta del hospital? 2. Al seleccionar un hospital. En la siguiente escala de uno a siete. Los siguientes tipos de preguntas se formulan a veces en las encuestas. a "no muy importante" un 2. la medición es sólo ordinal en su nivel. Esta misma lógica se aplica a los valores numéricos asignados en las preguntas 4 y 5. ¿qué tan importante fue la ubicación del mismo? !Circule uno) Muy importante Poco importante · No muy importante Nada importante 4. Muchos investigadores dirían que esto es una medición de nivel de intervalo debido a la distancia igual entre números y la ausencia de un cero verdadero en esta escala. por ejemplo la regresión múltiple. La computadora permite almacenar.CAPITULO 1 INTRODUCCIÓN A U\ ESTAD!SnCA 11 Continúan presentándose muchos cambios en la industria de la salud. La pregunta 6 muestra siete opciones numéricas con iguales distancias entre los números mostrados en la escala. Algunas de las técnicas estadísticas ampliamente usadas. Por tanto. La pregunta 2 rinde datos nominales porque al paciente se le pide sólo categorizar el tipo de unidad en que él o ella estuvieron. Ciertamente. Debido a que hay mayor competencia por atender pacientes entre proveedores y la necesidad de determinar la forma en que éstos pueden servir mejor a sus clientes. los ingresos por roaming bajan porque los usuarios están en la red con más frecuencia. con más frecuencia. incluyendo el M!NJTAB. en zonas ruralesde la India En el Dilema de decisión. la salida estadística de computadora presentada es del MIN!TABy del software Microsoft Excel.El promedio de la cuenta mensual por el uso del inalámbrico. los investigadores podrlan ser enviados a regiones representativas de la India rural y realizar un estudio de consumidores acerca de su estado económico. Diversas razones harían preferible el uso de un proceso inferencia! a llevar a cabo un censo. para hacer ventas en zonas rurales de la India. y gramos de pasta dentlfrica consumida por año.allnetdevicu.que refleja este aumento en uso.No obstante. En el capitulo 7 vamos a explorar el uso del muestreo con mayor detalle. pasó de $41. valor de su casa o tierras. En muchos países. 27 April 2001.S.usos de consumo de productos y su voluntad para expandir sus compras. En algunos ejemplos. En esta situación particular. Se reportó el promedioanual de consumo de pasta dentífrica por persona. muchas estadísticas se reportaron acerca de la India rural. Los ingresos por roaming (unidad fuera de área asignada) bajaron. Esta cifra representó un crecimiento de casi 28% desde que terminó 1999. Muchos paquetes de software de hojas de cálculo de computadora también tienen capacidad de analizar datos estadlsticamente. Se dan porcentajes que describen características demográficas de la India rural. Futnt~ adaptado de "No Slump in U.1 • . se usan escalas Likert (mediciones de 1 a 5) para obtener respuestas acerca de intereses y cosas •. Los ingresos totales para empresas operadoras de inalámbricos en Estados Unidos llegaron a $50 mil millones para el afio 2000. Por ejemplo._ _.com/wirelesslnews/2001 /04/27/ no_slump.seguridad personal o los debates de etiqueta ¿podrán contener el uso de aparatos inalámbricos? Éstas y otras preguntas se pueden manejar mediante la recolección y análisis de estadísticas para negocios.24 a $45. En este texto. posesiones. No sólo hubo más personas que usaron aparatos inalámbricos. Los autores de las fuentes de donde se tomaron datos del Dilema de decisión nunca expresan si las cifras son en realidad tomadas de un censo de población o son cálculos tomados de una muestrade estas personas. podrlan obtenerse mediciones de nivel de razón de cosas como el ingreso. sino que también lo hicieron con más frecuencia. Si las cifrasprovienen de un censo. los investigadores tienen la posibilidad de reunir datos útiles y relativamente precisos al tomar una muestrabien planeada que es representativa de la población. lo cual refleja la continua expansión de la red.11¡¡.27 en el mismo periodo de un año. se recolectan datos de muestras de personas o cosas. número de hijos. al/NetDil-ica. su potencial como mercado. Wireless Usage".Debido a que el gobierno a veces lleva a cabo censos. Este proceso es inferencia!. A medida que las empresas de telefonla expanden sus territorios cubiertos. incluyen porcentajes de analfabetismo y posesión de comodidades domésticas. promedios y porcentajes presentados en el Dilema de decisión son parámetros. entonces los totales.1mw1H•·flllHiil·}l.html . La estadísticadescribe el estado de los negocios . edad del padre de familia. Podría reunirse una amplia variedad de estadísticas que representen varios niveles de datos. y de sus ventas.12 ESTADISTICA EN LOS NEGOOOS Los expertos en estadística de negocios emplean muchos de los populares paquetes de software de estadística. http://www. a su vez. caracterlsticas personalesy familiares. más de 11 O millones de clientes en Estados Unidos usaron teléfonos celulares en el año 2001. número de cabezas de ganado. estos datos podrían ser parámetros.m. leyes para conductores de vehículos. SAS y SPSS. ¿se nivelará su uso? Factores como la preocupación por la seguridad pública. Crece el uso de la comunicación inalámbricaen Estados Unidos Según un estudio semestral de la industria de comunicaciones de la Cellular Telecommunications & Internet Association. El promedio de duración de una U amada en 2001 fue de 3 minutos en comparación con 2 minutos y 38 segundos al término de 1999. ¿Qué pasará con el uso del inalámbricoen el futuro?A medida que el mercado sea más maduro. se pueden usar para estimar parámetros de población. Los datos resultantes son analizados y producen estadísticas que. cuerpo o población y llegar a conclusiones acerca del grupo más grande del cual se tomó la muestra. grupo o población y llegar a conclusiones sólo acerca de ese grupo. omitiendo estadísticas de los mismos estudios que discuten contra su caso. entonces sólo estadísticas no paramétricas son apropiadas para su análisis. Los 750 millones de personas que viven en la India rural representan el segundo grupo más grande de personas en el mundo. La palabra estadlstica tiene muchas connotaciones. Con tanto en la línea. Las estadisticas se utilizan ampliamente en negocios e incluye las disciplinas de contaduría. En este texto. Las personas no éticas en negocios podrían usar sólo datos selectivos de estudios para subrayar su punto de interés. Entre los significados más comunes de la palabra están: 1) la ciencia que reúne. 2) ordinal. RESUMEN La estadística es una importante herramienta para Ja toma de decisiones en negocios y se utiliza en prácticamente todos los campos de negocios. En este capitulo se hizo notar que si los datos son nominales u ordinales. 3) un curso de estudio. interpreta y presenta datos. un comportamiento no ético en negocios. Las estadlsticas en las crecientes ventas de algunos productos de cuidado personal parecen promisorias. a los habitantes de zonas rurales de la India se les puede pedir que clasifiquen diversos productos en términos de cuáles serla más probable que compraran. Ciertamente. Es. ocupación y religión resultarían en datos nominales. sistemas de administración de información. Otras variables como son la ubicación geográfica. El nominal es el nivel más bajo. Su capacidad como mercado es grande. los estudiantes de administracion de negocios necesitan estar conscientes de potenciales problemas éticos que pueden ocurrir con la estadística. La decisión para entrar al mercado de la India rural no es sólo una decisión de mercadeo. que puede ser 1) nominal. El tipo apropiado de análisis estadlstico depende del nivel de medición de datos. finanzas. Comprende la capacidad de producción y problemas de fechas de entrega. 5) una muerte. mercadeo y producción. Los resultados de estudios estadísticos se pueden expresar mal o exagerar para ganar un favor. 2) una rama de las matemáticas. problemas de contabilidad (la contabilidad para la lndia rural puede diferir de las técnicas empleadas en mercados tradicionales). 3) i11tervalo o 4) de razón. economía. El estudio de estadísticas puede subdividirse en dos categorías principales: estadística descriptiva y estadlstica i11ferencial. 4) datos y cifras. con lo cual se produce un nivel ordinal de mediciones. analiza. que representa la clasificación de sólo datos tales como la ubica- . Además. lo que darla datos ordinales. es obvio para quien tome decisiones que la lndia rural es todavía muy pobre y analfabeta. La estadística descriptiva resulta de recolectar datos de un cuerpo. es un segmento de mercado digno de más estudio. semejantes.CAPITULO 1 INTROOUCCIÓN A LA ESTADISTICA 13 CONSIDERACIONES ÉTICAS Con la abundancia y proliferación de datos estadísticos. en efecto. El uso de estadísticas pararnétricas para analizar datos nominales y/u ordinales es erróneo y podría ser considerado bajo algunas circunstancias como no ético. dificultades en transportes. En este Dilema de decisión. Como usuarios y productores. Por razones de privacidad. sistemas de información y otros campos relacionados. emplear estadlsticas fuera de contexto. algunos temas de preguntas como la edad o ingreso se expresan en rangos de clase que también resultan en un nivel ordinal de medición. compromisos financieros. afiliación a un partido político. quienes toman decisiones en la compañia necesitan tanta información relevante disponible como sea posible. La estadística inferencia! se genera a partir del proceso de recolectar datos muestrales de un grupo. crecimiento gerencial o reasignación. el mal uso de la estadística en el manero de negocios es un problema. cada capítulo contiene una sección sobre ética que analiza la forma en que los negocios pueden dar mal uso a las técnicas presentadas en el capítulo en una forma no ética. ciencias de toma de decisiones. 6) medición de muestra y 7) tipo de distribución empleada para analizar datos. administración. ¡Cuáles son los pronósticos futuros para el poder adquisitivo del pueblo en la India rural? ¡Problemas culturales importantes bloquearán la adopción de los tipos de productos que las compañías desean vender alú? Las respuestas a éstas y muchas otras interesantes y útiles preguntas se pueden obtener con el correcto uso de la estadlstica. ordinales. g. Las ventas en dólares en el restaurante local de pizzas cada mes.5 Clasifique cada uno de los siguientes datos como nominales. necesariamente representan distancias iguales. banca y servicios de salud. Si los datos son sólo nominales u ordinales en nivel. que tiene todas las cualidades de medición de intervalo.2 Exprese ejemplos de datos que pueden reunirse para fines de toma de decisiones a partir de cada una de las siguientes industrias: manufactura. c. de intervalo o de razón. recursos humanos. h. sistemas de información. e. El saldo comercial en dólares.4 Supongamos que el estudiante es gerente de operaciones de una planta que manufactura baterías. Identificación de impuesto de una compañía i. 1. buena. Dé un ejemplo de cómo podría usar la estadística descriptiva para tomar mejores decisiones gerenciales. El tiempo de respuesta de una unidad de emergencia 1. La edad de cada uno de sus empleados. 1 ia consume en un mes. 1. Las técnicas presentadas en este texto son principalmente paramétricas. El número de billetes vendidos en un cine en una noche cualquiera. La clave de larga distancia automática Estados Unidos. comunicaciones. Dé un ejemplo de la forma en que la estadística inferencia/ podrían usarse en la industria de la música grabada. El nivel más alto de medición de datos es el de razón. El de intervalo es el siguiente nivel más alto de medición de datos en el que las distancias representadas por números consecutivos son iguales. ventas al menudeo. El número de identificación de un empleado. El número de cuarto de galón de leche que una fami- negocios: contaduría. El uso de estadística paramétrica requiere datos de intervalo o de razón y ciertas suposiciones acerca de la distribución de los datos. h. El número de identificación en un cuestionario. Compare estos dos ejemplos. ¡Qué hace la diferencia? 1. pero los datos de razón contienen un cero absoluto y las razones entre números tienen significado. satisfactoria y mala. Los datos de intervalo y de Los tipos principales de estadística inferencia! son 1) esta110 paramétrica. deben usarse estadísticas no paramétricas. Dé un ejemplo de cómo podría usar la estadística inferencia/ para tomar mejores decisiones gerenciales. de clientes en e. Un ejemplo en la industria de viajes podría ser el costo de un viaje de negocios por dla en varias ciudades de Europa. nivel es ordinal. Un ejemplo en el campo de la mercadotecnia podría ser "número de ventas por mes por cada vendedor". rnercadotecnía. hecha por Fortune b.6 Clasifique cada uno de los siguientes datos como nominal. f. finanzas. seguros) viajes. a. La clasificación de cuatro máquinas en su planta des- nistración. media.14 ESTADISTICA ción geográfica. a. El siguiente de ordenamiento de razón a veces se llaman métricos o datos cuantitativos.1 Dé un ejemplo especifico de los datos que podrían ser reunidos de cada una de las siguientes disciplinas de b. La clasificación de una compañia 500. Ingreso per cápita. pués que se les ha designado como excelente. agricultura.Pérdidas o ganancias en dólares. producción y admi- c. 1. . d. El tiempo necesario para producir cada neumático en una linea de ensamble. EN LOS NEGOCIOS sexo o número que produce de seguro mediciones social. Los datos nominales y ordinales a veces se conocen como daros no rango en el que los intervalos entre números consecutivos no métricos o cualitativos. f. Clasificación de bonos de la Standard & Poor's de ciudades con base en las siguientes escalas: .3 Dé un ejemplo de estadística descriptiva en la industria de música grabada. de intervalo o de razón. g. dística paramétrica y 2) estadística TÉRMINOSCLAVE censo datos de nivel ordinal estadística descriptiva datos a nivel de intervalo datos métricos estadística inferencia! muestra datos a nivel de razón datos no métricos estadísticos parámetro datos de nivel nominal estadístico estadística no paramétrica población estadlstica paramétrica PROBLEMAS COMPLEMENTARIOS 1. Clase socioeconómica (baja. ordinal. d. alta). computación. dólares. Stock l al 20 para denotar el grupo industrial al cual pertenece la Volume. Costo de materiales. mano de obra internacional . Es posible tener acceso a los datos originales en Ja Data Library en http://www.nyse. Esta base de datos fue elaborada a partir de datos mostrados en el Internet por la New York Stock Exchange.el Moody's Handbook of Common Stocks.por ejemplo el mercadode acciones. Algunas de las industrias son productos alimenticios.Valor de embarques de la industria.9 mil millones ble contiene una observacióndel día diez de cada mes. subindustria en particular. Dos variables. Número de Base de datos del mercadode acciones empleadosy Número de trabajadores de producción. posible incumplimiento Calificación baja. y una observación del día 30 del mes denotadocomo 3.html bajo el titulo NYSEStatistics Archive. e Inpor mes durante nueve años da un total de 324 observacio. Cuatro variables. productos químicos.A continuación se encuentra una descripción de cada una de las bases.La fuente de la base de datos es la 1996Annual Surveyof Manufactures. Estas bases de datos se encuentranen el CD-ROM que acompaña a este texto.Tres observaciones factura. Valor de Embarques de Industria El Dollar value (valor del dólar) se reporta en unidades de se ha recodificado a la siguiente escala de l a 4. ¡Cuál seria un parámetro para este estudio? 1.Gastos nuevos de capital. manufactura.Gastos nuevos de capital.Costo de materiales. Al reconocer que el tiempo del mes puede 1 = $0 a $4.Las calificacionesde satisfacción para los 35 participantesse promedian para obtener una calificación media de satisfacción. maquinaria industrial y equipo de transporte. y Grupo industrial. ¡Cuál es la población para este estudio? b.una observacióndel día 20 del mes denota- .S.7 La Rathburn Manufacturing Companyproduce conductores eléctricos.ventario de fin de año. Cuatro de las bases contienen datos de series de tiempo que pueden ser especialmente útiles para pronósticos y análisis de regresión.9 mil millones de este día.S. Los datos se recolectan de fuentes confiables como lo es la Oficina del Trabajo. muebles. Reported Trades. que vende a contratistas en la industria de ANÁLISIS DE LA BASE DE DATOS Se pueden usar siete bases de datos principalespara aplicar las técnicas presentadas en este curso. do como 2. ¡Cuál es la estadistica para este estudio? d. productos de caucho. Las variables incluyen el Composite lndex. metales primarios. la American Hospital Association y el U. Número de trabajadores de producción. millonesde dólares. están en unidades de millones de nes por variable. La variable Grupo industrial consta de números del Industrial Index. estas bases de datos contienen 56 variables y 8 350 observaciones.com/marketinfo/marketinfo. Él elaboró un cuestionario que da una calificación de satisfacción entre 1 O y 50 para participantes que respondan a esta encuesta.CAPITULO 1 INTRODUCCIÓNA LA ESTADISTICA 15 Oasificación Calificación/tipo AAA Calidad más alta Calidad alta AA Calidad media alta A BBB BB B Calidad intermedia Poco especulativa Calidad baja. Department of Agriculture. o cerca 3 = $14 mil millones a $28.Valor agregado por manubles relativasal New York Stock Exchange.unidadesde mil. En conjunto. Census Bureau. junto con información que puede ser útil al estudiante para interpretar resultados. energía. Transportation Jndex. la Casa de Bolsa de Nueva York. Departrnent of Commerce. finanzas. cada varia2 = $5 mil millones a $13.S. ¡Cuál es la muestra para este estudio? c. Aproximadamente900 contratistas eléctricos compran alambre anualmente a Rathburn. A una muestra aleatoria de 35 de los 900 contratistas se les pidió contestar y llenar una encuestade satisfacción. El director de mercado de Rathburn desea determinar la satisfacción de estos contratistas con el alambre de Rathburn.están en La base de datos del mercado de acciones contiene ocho varia. especulativa Calificación baja. Las ocho variables son Número de empleados.9 mil millones hacer una diferencia en el valor de la observación. improbable recuperación ccc ce e la construcción.que es publicado por el Census Bureau del U. o cerca de este dia. atención médica y agroindustrias. y cada una de estas bases de datos se encuentra ya sea en formato ~UNITABo Excelpara mayor comodidad. denotado en la base de datos como 1 bajo la varia4 = $29 mil millones o más ble Parte del Mes.Estas siete bases de datos representan una amplia variedad de campos de acción de negocios. Utility Index. a. posible recuperación parcial Incumplimiento. el U. productos textiles. Valor agregado por manufactura. Base de datos de manufactura Esta base de datos contiene ocho variables tomadas de 20 industriasy 140 subindustriasen Estados Unidos. Dollar Value y Warrants Volumen. Inventarios de fin de año. Las seis legumbres son judías verdes. Payroll Expenditures. ganancias por acción ($). U. Alemania e Italia. ¿cuál es el nivel de datos para cada una de las siguientes variables? a.16 ESTADISTICA EN LOS NEGOCIOS Base de datos de mano de obra internacional 2 =Noreste Esta base de datos de series de tiempo contiene los porcentajes de desempleo civil en siete paises presentados anualmente entre 1959 y 1998.S. ingresos totales ($ millones). Las variables son tipo de industria. zanahorias. Control c. Japón. Base de datos de series de tiempo de agroindustria La base de datos de series de tiempo de agroindustria contiene el peso mensual (en mil libras) de propiedades de almacenamiento en frío para seis legumbres diferentes y para legumbres totalmente congeladas en un periodo de 14 años. ¿cuál es el nivel de datos para cada una de las siguientes variables? a. Australia. Control. Nuclear Electricity Gross Generation (miles de millones de kilowatt-horas). lllinois. Grupo de industria 2. Personal 3. ¿cuál es el nivel de datos para cada una de las siguientes variables? a. Las compañías representan siete tipos diferentes de industrias. Energy lnformation Administration. Los paises son Estados Unidos. Estas variables comprenden la Geographic Region. Cuatro categorlas de control están incluidas en la base de datos: 1 = gobierno. La información para estas bases de datos se toma de la American HospitalAssociation Guide to the Health-Care Field. brócoli. 1 =Sur 4 =Suroeste 5 = Montañas Rocallosas 6 = California 7 =Noroeste El control es un tipo de propiedad. Razón P/E . Coa! Production (millones de toneladas cortas). Base de datos de hospital Esta base de datos contiene observaciones para 11 variables en hospitales de Estados Unidos. edición 1998-99. l. y los números representan las siguientes regiones. Tipo de industria b. U. Service. Valor de embarques de la industria d. no con fines de lucro 3 = con fines de lucro 4 = gobierno federal El servicio es el tipo de hospital.S. Department of Labor. En la base de datos financiera. cebollas y chícharos. Canadá. promedio de rendimiento (%). U. 3 = Medio Oeste Base de datos financiera La base de datos financiera contiene observaciones sobre ocho variables para 100 compañías. La variable tipo muestra el tipo de industria de una compañia como: 1 =vestido 2 = productos químicos 3 = energía eléctrica 4 = abarrotes 5 = productos para atención médica 6 =seguros 7 =petróleo Base de datos de energía La base de datos de energ!a consta de datos sobre siete variables de energía en un periodo de 26 años. Número de trabajadores de producción b. Departrnent ofEnergy). Los datos están publicados por la National Agricultural Statistics Service del U. Number of Beds. publicada en Chicago. U.S. promedio en la ciudad).S. La variable de región está codificada de 1 a 7. dividendos por acción ($). La base de datos está adoptada del MonthlyEnergy Review. Total Expenditures. Number of Outpatients. Los datos son publicados por la Bureau of Labor Statistics del U. U. no federal 2 = no gobierno. Costo de materiales c.S. En la base de datos de manufactura. Number of Admissions. Los dos tipos de hospitales empleados en esta base de datos son: 1 = medicina general 2 = psiquiatría Las variables del total de gastos y nómina están en unidades de $1 000. Número de camas d. February 1999 (Office of Energy Markets and End Use. Las siete variables son World Crude Oil Production (millones de barriles por día). Energy Consumption (trillones de BTUs por año). Utilice la base de datos para contestar las siguientes preguntas. Fue! Rate for Automobiles (millas por galón) y Cost ofUnleaded (regular) Gasoline (U. activos totales ($ millones). Los datos fueron tomados del Moody's Handbook of Common Stocks (verano 1998). y Personnel. Cada una de las siete variables representa 168 meses de datos desde 1984 a 1997.S. Total de activos c. Number of Births.S. Región b. y razón entre precio promedio por utilidades (P/E). rendimiento sobre acciones (%). maiz. Department of Agriculture.S. Census. Francia. En la base de datos de hospital. 58. DiGiorno gran éxito con ventas de $120 millones el primer O. Fu<nt<: adaptado de "Upper Crusr'. j. $_00 millones el siguiente. los aauncios destacaron el sabor de recién horneada y el aspecto de rosca inflada del producto. e. Código postal de quien respondió a la encuesta.3 mil millones de la categorfa de pizzas congeladas. Si el d.. y en una serie de pruebas de gusto t ~llevada a cabo por Product Dynamics. ¿qué decisiones tomarla usted acerca de a quién entrevistar. ¿creen GCSmJUdorcs que las pizzas para llevar son siempre más ª lector estuviera a cargo de llevar a cabo esta investigación para ayudar a lanzar ese nuevo producto. Lo que encontraron siñquelas por nivel de datos. y qué medir? l. ¿por d p6hLco consume pizzas]. incluyendo calidad y no tener que Considere algunas otras medidas que los investigadores de c:cmr. a Name? Brand E. g. Por ejemplo. lo cual ayudó a convencer al réblico de la más alta calidad del sabor de DiGiorno. El Loran Marketing Group se concentró en grupos Kraft pudieran usar para este trabajo de investigación y clai?E2 K. g::::es comodidad y gusto). Numerosas preguntas tuvieron que contesa:s. Además. Clasificación del gusto de una marca dada de pizzas en una escala de 1 al 1 O. Número que represente la marca de pizza que se evalúe. p. DiGiorno Pizza ~ a todas las pizzas congeladas y terminó en segundo _ • sólo detrás de una marca para llevar. o en casa. último acceso en 1999.~ con mujeres entre 25 y 54 años. Marketwatch~News That Matters sitios Web. Antes de p:=. mala. Óis3ostró que las personas consumen pizzas congeladas por a. abajo del promedio. Amtrican D<magraphia. Dólares gastados por mes en pizzas por persona. "'What's in mano de 1999. Como subproducto. k. algunas de las posibles medidas apa~ axinar. Análisis Piense en la investigación de mercado que fue realizada por Kraft y en el hecho de que usaron diferentes compañías. Tiempo entre compras de pizzas. promedio.foodexplon:r.CAPITULO 1 INTRODUCCIÓN A LA ESTADISTICA 1. donde 1 es muy mal sabor y 10 es un sabor excelente. antes en http://www. en la actualidad tiene 13% del mercado & Estados Unidos. Esto impresionó a ::uanbros del grupo. Para satisfacer estas metas aparentemente diverc. l . Es el producto Kraft de más rápida crecimienllD al romper la barrera de los $200 millones. nrias otras razones. h.com/BUSINESS/ProduCU/MarketAnalysi>/ PF02896b. Número que represente la ubicación geográfica de quien respondió a la encuesta i. ¡. ¡cómo es que Kraft utilizó el proceso inferencia! en su investigación de mercado? ¡Puede usted considerar otra 0-Alcott realizó un estudio de investigación para Kraft · estadística descriptiva que pudiera usar Kraft en el proceso ¿que enviaron 1 000 encuestas para quienes gustan de pide toma de decisión? =. loo resultados indicaron que el público consume pizza ~ocasiones sociales divertidas.~ ~ publico Kraft llevó a cabo una extensa investiga& ::xrcado. ¿cuándo comen pizzasi. DiGiorno Pizza.e&:::es que Kraft iniciara la producción. btm. los anuncios también ~n fuerte identificación de la marca. Clasificación de calidad de una marca de pizza como excelente. Kraft creó la Pizza DiGiomo. cuando nadie 2. Sexo de quien respondió a la encuesta. CASO: DIGIORNO PIZZA: INTRODUCCIÓN DE UNA PIZZA CONGELADA PARA COMPETIR CON LAS PIZZAS PARA LLEVAR hlaft's DiGiorno Pizza llegó al mercado. Clasificación del sabor de cuatro marcas de pizzas en una prueba degustación. Edad del comprador de pizzas. dónde y cuándo hacer la encuesta. de $2. ~d pero deseaban que tuvieran el gusto de las pizzas b.. la se infla en el horno cuando se cocina.:z::z rar. f. Por medio de publicidad Kraft pudo superar dos proble~ qae surgieron por la investigación de mercado: el público taifa problemas para pronunciar DiGiorno y necesitaban estar ::ftllcidos de que la pizza congelada en realidad tiene buen abar. En los diversos esfuerzos de investigación de mercado por Kraft para DiGiorno.xtension Pctential" y "'OiGiorno Rising Crust Delivers $200 Million . buena. Número de pizzas consumidas por semana por casa. Kraft hizo repetir el nombre DiGiorno varias veces en a:::mcios para asegurarse que los consumidores podlan pro=iar el nombre. No fue suerte ni coincidenDíGíomo Pizza tuviera un éxito instantáneo. ¿Cuáles son algunas de las poblaciones en las que Kraft pudo estar interesado en usar estos estudios? ¿Trató Kraft en realidad de hacer contacto con todas las poblaciones? ¿Qué muestras se tomaron? En vista de estas dos preguntas. El público utilizó pizzas congeladas principal~ por comodidad pero seleccionaba pizzas para llevar recen en la lista siguiente y clasiñquelas por nivel de datos. 18 . un polígono de frecuencia.CAPÍTULO 2 Tablas y gráficas OBJETIVOS DE APRENDIZAJE El objetivo general del capítulo 2 es que el estudiante domine varias técnicas para resumir y representar datos. una gráfica de Pareto y una gráfica de dispersión. Construir una distribución de frecuencia. con le que podrá: l. Construir un histograma. Reconocer la diferencia entre datos agrupados y no agrupados. una ojiva. una gráfica de pastel. una gráfica de tallo y hoja. 2. 3. Ad Age Almariac. ¡Puede usted resumir estos datos en un reporte? 34 58 40 49 49 57 44 57 69 45 64 31 47 30 44 44 SI 65 60 65 61 62 68 43 66 63 44 34 57 44 67 614767 52 34 58 59 45 33 3.2 2 521 000 2 646 500 5.Estado de la manufactura de autos Según los datos publicados por el Automotive News Data Center. General Motors Corporation es la número uno en el mundo en ventas totales de autos y camiones ligeros. Supongamos que DaimlerChrysler toma al azar muestras de 40 distribuidores y descubre que los siguientes datos indican cuántos autos y camiones ligeros se vendieron en estas distribuidoras el mes pasado. Su gerente le pide que elabore un breve reporte que muestre el estado de ventas de autos y camiones ligeros en todo el mundo. vendiendo casi 200 000 autos menos en todo el mundo. El crecimiento de mayor porcentaje de 1999 a 2000 fue para PSA Peugeot-Citroen.1 Preguntas gerenciales y estadísticas Supongamos que el lector es analista de negocios para una de estas compañías. que aumentó ventas en 14.2 7 148 000 7 350 495 2. 19 . ¡Cómo podría usted representar gráficamente los datos de 1999 contra los datos de 20001 F11tt1tt: adaptado de Automotivc Ncws Data Cerner. Entre 1999 y 2000. p.2%. ¡Cuál es la mejor forma de expresar los datos de ventas en un reporte? ¡Son suficientes los datos sin procesar? ¡Puede usted en efecto exhibir la información gráficamente? 2.8 5 359 000 5 703 446 6. "Top 1 O Auto Manufacturers". l.4 2 519 600 2 877 900 14. Compañía General Motor Ford Motor Toyota Motor Volkswagen DaimlerChrysler PSA Peugeot-Citroen Fiat 1999 2000 %de cambio 8 786 000 8 591 327 -2. Durante este mismo periodo. A continuación veamos las cifras mundiales de ventas para los JO principales fabricantes de autos y camiones ligeros para 1999 y 2000. Ford Motor aumentó ventas en más de 200 000.4 Honda Motor 2 395 000 2 540000 6. respectivamente. Ford Motor Company es la número dos seguida por Toyota Motor Corporation y Volkswagen. 23.4 4 860203 5 161188 6. 31 de diciembre de 2001.3 2 567 878 2 629 044 2.2 4 864 500 4 749000 -2. General Motors mantuvo su posición número uno.0 Hyundai Motor Nissan Motor 2 600 862 2 634 530 1. Usted debe comparar la posición de su compañía con otras empresas. 6 1.4 11.8 En los capítulos 2 y 3 se presentan diversas técnicas para reformar o reducir datos y que éstos sean más manejables y se puedan usar para ayudar de manera más eficiente a quienes toman decisiones. La tabla 2.6 9.1. el investigador de negocios debe determinar el ancho del intervalo de clase. Además.8 .9. en Francia (datos agrupados) de modo que el investigador de negocios inicia la distribución de frecuencias en 1 y la terlotttValo mina en 13. Para los datos de la tabla 2. En cierto sentido.6 8.3/6. La tabla 2.1.2. incluyendo histogramas.S 10.2 5. La expresión de intervalo de clase.8 12. el investigador de negocios debe determinar primero el rango de los datos sin procesar. 5-menordc 7 Marca de clase 7-menordc9 9-menor de 11 9 l l-menor de 13 6 El punto medio de cada intervalo de clase se llama marca de clase y a veces se conoce como punto medio clase. Es el valor a la mitad entre ti intervalo de clase y se puede calcular . que es un resumen de datos presentados en la forma de intervalos y frecuencias de clase.6 JO. DISTRIBUCIONES DE FRECUENCIA Una herramienta particularmente útil para agrupar datos es la distribución de frecuencia.20 ESTADISTICA EN LOS NEGOCIOS TABLA 2. polígono de frecuencia. se conocen a veces como datos no agrupados.4 11.3 8.4 6. quienes toman decisiones pueden empezar a "echar mano" de la información contenida en los datos y usar éstos para mejorar el proceso de toma de decisiones. Normalmente. ojiva.2 1. Los datos que se han organizado en una distribución de frecuencia se denominan datos agrupados.1 Porcentajes de desempleo en Francia en 40 años (datos no agrupados) 1. La tabla 2.2.1 es 11.8 2. el resumen de datos puede ser demasiado general para ser útil.2).1? Las distribuciones de frecuencia son relativamente fáciles de construir.9 2.1 se agruparon en seis clases para la tabla 2.6 1. el número se redondea al siguiente número entero. gráfica de pastel y gráfica de Pareto para datos de una variable.5 2.6 2. Dos técnicas para agrupar datos son la distribución de frecuencia y la gráfica de tallo y hoja que en este capítulo se presentan. las distribuciones de frecuencia se construyen según el gusto individual de los investigadores de negocios. Aun cuando algunas directrices y reglas prácticas ayudan en su construcción.1 contiene datos sin procesar de los porcentajes de desempleo en Francia en más de 40 años. El rango de los datos de la tabla 2.5-1.6 5.O 10.2 contiene la distribución de frecuencia completada para los datos de clase Frecuencia de la tabla 2.4 1. 3-menorde 5 2 en la distribución del la tabla 2. ¿cómo se construyen distribuciones de frecuencia -<0mo la que se ilustra en la tabla 2. El segundo paso en construir una distribución de frecuencia es determinar cuántas clases contendrá.5 12.2 4. que en este caso es 2. las distribuciones de frecuencia varlan en su forma final y diseño. Los datos sin procesar.3 (12.2 presenta una distribución de frecuencia para los datos mostrados en la tabla 2.3 9. Una aproximación del ancho de clase se puede calcular al dividir el rango entre el número de clases. Después de seleccionar el número de clases. La distinción entre datos no agrupados y agrupados es importante porque los cálculos de estadística difieren entre los dos tipos de datos.2 evita este problema.2. El investigador de negocios llega a un número si examina el rango y determina el número de clases que abarcará el rango en forma adecuada y también que sea significativo para el usuario. ¿Cómo se construye una distribución de frecuencia a partir de datos sin procesar? Esto es.2 ción serla 11.3 11.6 10. La distribución de frecuencia debe empezar en un valor igual a o Distribución de frecuencia de menor al número más bajo de los datos no agrupados y terminar en un valor igual o mayor los porcentajes de desempleo que el número más alto.1 2. o sea 1. Cuando se construya una distribución de frecuencia.2 y el más alto es 12.6 10.2 1. Los datos de la tabla 2. Si la distribución de frecuencia contiene muy pocas clases. Con el uso de éstas y otras técnicas. en el capítulo 2 se estudian y exhiben varias herramientas gráficas para resumir y representar datos. Los puntos finales de la clase se seleccionan de modo que ningún valor de l-rnenor de 3 16 los datos pueda caber en más de una clase. El número final de clases es arbitrario.5. o datos que 110 han sido resumidos en ninguna forma.8 I0.1. Este capitulo se concentra en organizar datos no agrupados y mostrarlos gráficamente.5 1.8 12.1 2. esta aproximaTABLA2.1 6. El porcentaje más bajo de desempleo es 1.9 4.1 9.a partir de datos sin procesar como los de la tabla 2. Una regla práctica es seleccionar entre S y 15 clases.6 1.7 2. aun cuando los datos sin procesar originales sean idénticos.5 7. "menor de'.3 2. El rango se define a veces como la diferencia entre los números más grande y más pequeño. Muchas clases pueden resultar en una distribución de frecuencias que no agrega los datos suficientes para ser útil. y la gráfica de dispersión para datos numéricos de dos variables. -lo l-menorde3 3-mmorde5 5-menorde7 7-menorde9 9-menor de 11 11-nwnordel3 1bliia fNcumda 16 2 4 3 9 . Por ejemplo..3 "'untos medios de clase.2. años de servicio. como para la distribución de porcentajes de desempleo: Punto inicial de clase = 3 Ancho de clase = 2 Marca de clase = 3 + . En la tabla 2. incluyendo ventas acumuladas en un año fiscal.. Este proceso continúa hasta el último intervalo.225 34 ~ 1.3.3 indica frecuencias acumuladas para los datos de la tabla 2.--la nlidha 111-ia _. y frecuencia acumuladas para datos de desempleo 1. . en la distribución de la tabla 2.. el punto medio del intervalo de clase 3-menor de 5 es 4 o (3 + 5)/2.i 40 ~-iio dedme 2 4 6 8 10 12 F. La frecuencia acumulada para cada intervalo de clase es la frecuencia para ese intervalo de frecuencia sumado al total acumulado precedente. La tercera columna de la tabla 2.. marcador final de deportes durante un concurso (puntos acumulados). Frecuencia relativa La frecuencia relativa es la proporción de la frecuencia total que estd en cualquier intervalo de clase dado en una distribución de frecuencia. la frecuencia acumulada para la primera clase es la misma que para la frecuencia de clase: 16.oso .10. si se seleccionaran valores al azar de los datos de la tabla 2·. puntos ganados en un curso y costos por hacer negocio en un periodo. Frecuencia acumulada La frecuencia acumulada es u11 total corriente de frecuencia por las clases de una distribución de frecue11cia. Por ejemplo.2.CAPITULO 2 TABLAS Y GRAFICAS 21 como el promedio de los dos puntos finales de clase. lo cual da una nueva frecuencia acumulada de 18.!.000 25 40 .3. De hecho. la frecuencia relativa para el intervalo de clase 5-menor de 7 es 4/40 o . La cuarta columna de la tabla 2.400 16 18 . la probabilidad de sacar un número que sea "5-menor de 7" serla . Una segunda forma de obtener la marca de clase es calcular la mitad de la distancia en el intervalo de clase (la mitad del ancho de clase) y sumarla al punto inicial de clase.. La consideración de la frecuencia relativa es preparatoria al estudio de probabilidad del capitulo 4. La frecuencia relativa es la frecuencia de clase individual dividida entre la frecuencia total.l . en cuyo punto el total acumulado es igual a la suma de las frecuencias ( 40). ~encía relativas.100 22 .2.3 contiene las marcas de clase para los datos de la tabla 2.. El concepto de frecuencia acumulada se emplea en muchos campos de acción.(2) 2 =4 La marca de clase es importante..2. la frecuencia relativa para esa clase de intervalo. TABLA 2.075 .10. La tabla 2.3 es una lista de las frecuencias relativas para la distribución de frecuencia de la tabla 2. porque se convierte en el valor representativo para cada clase en la mayor parte de cálculos de estadlstica de grupo. de la tabla 2. La frecuencia acumulada para el segundo intervalo de clase es la frecuencia de ese intervalo (2) más la frecuencia del primer intervalo ( 16). 40 7.05 6.30 7.80) y pasaa a (7.SO-menor de 7.30 y termina en 7 .96 6.80 7.0167 1.84 7.31 6.1000 .1667 .22 ESTADISTICA EN LOS NEGOCIOS PROBLEMA DE DEMOSTRACIÓN 2.30-menor de 7.10-menor de 7.0833 .84 Construya una distribución de frecuencia para estos datos.55 .14 7.23 6.57 7. 7. El primer punto final de clase debe ser 6.25 7.00 7.0000 . el último punto final debe ser 7 . cada ancho de clase es aproximadamente: Ancho de clase = Rango Número de clases =~ 13 = 0.60 6.00-menor de 7.16 6. marcas de clase.34 6. 11.60 Totales Marcas de Frecuencia clase Frecuencia relativa 1 6.56 o más alto para incluir el valor más grande.50-menor de 6.16 6.1 O.30-menor de 6.70 7. La distribución de frecuencia resultante.12 7.40 6.40 6.0167 .65 6. Calcule y muestre los puntos medios de clase. están en la misma clase (7.11 6.28 6.70-menor de 6.29 6.16 7.40-menor de 6. Casi todas las tasas de interés de hipotecas (52 de las 60) están en las clases que empiezan con (6.90 6.56-6.1000 .1833 .35 6.00 7.60.97 7. Si se utilizan 13 clases.78 6.03 6.30 7.56 7-.96 7.1000 .21 (7.35 7.30-menor de 7.1 Los siguientes datos son el promedio de tasas semanales de interés de hipoteca para un periodo de 60 semanas.0000 o 6 6 10 8 11 5 6 3 _L 60 Frecuencia acumulada 3 4 10 16 26 34 45 50 56 59 60 Las frecuencias acumuladas y frecuencias relativas de estos datos dejan ver las clases de tasas de interés de hipotecas que es probable se presenten durante el periodo.95 7.94 7.16 6. Intervalo de clase 6.88 7.70-menor de 6.35 6.02 6.69 6.87 7.50 6.77 7. Soluci6n ¿Cuántas clases debería contener esta distribución de frecuencia? El rango de los datos es 1.10 7.08 6.1333 .80-menor de 6.0500 . Las tasas con la mayor frecuencia.95 7.98 7.96 7.0167 .60-menor de 6.03 7.40-menor de 7.35 o menor. para incluir el valor más pequeño.10 7.50 7.10-menor de 7.80 6.20-menor de 7.24 6.02 7.45 6.75 6.17 6. En este caso la distribución de frecuencia empieza en 6.85 6.05 7.15 7.55 6.45 7.47 6.13 7.95 7.093 Si se utiliza el ancho de una clase de .40 6.40).30 7.31 6. es posible construir una distribución de frecuencia con puntos finales que sean de aspecto más uniforme y permitan la presentación de la información en categorías más conocidas para usuarios de tasas de interés por hipotecas.99 7.90 7.0333 .75 6.78 6.39 7.90-menor de 7 .11 7.35).20).78 7.29 6. frecuencias relativas y frecuencias acumuladas aparecen listados en la siguiente tabla.70 6.79 7.07 7. frecuencias relativas y frecuencias acumuladas para esta distribución de frecuencia.20 7 . .57 7. 1 PROBLEMAS 2. Examine los resultados de (a) y (b) y comente sobre la utilidad de la distribución de frecuencias en términos de capacidad de resumir temperaturas. Louis. se cuentan éstas y se obtienen los siguientes datos. 42 55 16 38 31 69 31 17 64 12 70 85 40 79 38 73 62 40 75 61 64 to 81 35 52 38 47 36 53 43 47 24 15 36 16 48 63 44 31 30 66 45 35 23 81 25 84 17 60 33 a. Intervalo de clase O-menorde5 5-menor de 10 10-menor de 15 15-menor de 20 20-menor de 25 25-menor de 30 30-menor de 35 Frecuencia 17 23 18 10 4 ¿Qué indica la frecuencia relativa al propietario del restaurante de comida rápida acerca de las edades de clientes? . de modo que cada caja pese lo mismo. Supóngase que se muestren al azar 100 cajas de pasas. ¡Qué deja ver la distribución cuencias acerca de los llenados de cajas? de fre- 2. b. Construya una distribución de frecuencias para los datos usando cinco intervalos de clase.2 Se supone que un proceso de empaque debe llenar pequeñas cajas de pasas con aproximadamente 50 pasas. el propietario construye la distribución de frecuencias que se muestra a continuación. la frecuencia relativa y la frecuencia acumulada. A partir de estos datos.CAPITUW 2 TABLAS Y GRÁFICAS 23 l. 2. determine la marca de clase. Construya una distribución de frecuencias para los datos usando JO intervalos de clase. No obstante.1 Los siguientes datos representan las temperaturas altas vespertinas para 50 días de construcción durante un año en St. va a variar el número de pasas de cada caja. 57 44 49 49 51 54 55 46 59 47 51 53 49 52 48 46 53 59 53 52 53 45 44 49 55 51 50 57 45 48 52 57 54 54 53 48 47 47 45 50 50 39 46 57 55 53 57 61 56 45 60 53 52 52 47 56 49 60 40 56 51 58 55 52 53 48 43 49 46 47 51 47 54 53 43 47 58 53 49 47 52 51 47 49 52 48 53 47 48 46 49 52 41 50 48 57 44 48 57 46 Construya una distribución de frecuencias para estos datos. Para cada intervalo de clase de la distribución de frecuencias.3 El propietario de un restaurante de comida rápida averigua las edades de una muestra de clientes. c. 2.1 muestra claramente que el intervalo de clase l-menor de 3 proporciona con mucho el conteo de frecuencia más alto (16). Una mirada rápida a un histograma deja ver qué intervalos de clase producen los totales de frecuencia más altos. por ejemplo de la clase í-rnenor de 3 a la clase 3-menor de 5. pero. Nótese que las escalas empleadas a lo largo de los ejes X e y para el histograma de la figura 2. La conversión de datos a gráficas puede ser creativa e ingeniosa. trazando un segmento de recta horizontal del punto final de clase al punto final de clase en cada valor de frecuencia y conectando cada segmento de recta verticalmente desde el valor de frecuencia al eje x para formar una serie de rectángulos.1 son casi idénticas. el paso más dificil en este proceso es reducir datos importantesy a veces costosos a una imagen gráfica que sea tanto clara como concisa.2 REPRESENTACIÓN GRÁFICA DE DATOS Uno de los mecanismos más efectivos para presentar datos de manera significativa a quienes toman decisiones es una representación gráfica. La figura 2. 3) ojiva. quien tome decisiones puede con frecuencia obtener un panorama general de los datos y llegar a alguna conclusión útil con sólo estudiar la tabla o gráfica.4 El gerente de recursos humanos de una gran compañia encarga un estudio en el que se examinan los registros de empleados de 500 compañías para observar el ausentismo durante el año pasado. 2. La figura 2.2 muestra cómo se verla el histograma de los porcentajes de desempleo si la escala del eje y fuera menor que la del eje x. Es importante que el usuario de la gráfica comprenda da- . 4) gráfica de pastel. la frecuencia relativa y la frecuencia acumulada. 5) gráfica de tallo y hoja. Uno de los usos más importantes de una representación gráfica en estadística es ayudar al investigador a determinar la forma de una distribución. Con frecuencia. La construcción de un histograma comprende marcar el eje x (abscisa) con los puntos finales de clase y el eje y (ordenada) con las frecuencias. determine la marca de clase. Para cada clase de la distribución de frecuencias.1 es un histograma de la distribución de frecuencias de la tabla 2.2. la gráfica puede tener diferentes escalasen los dos ejes. producido con el uso del software MINITAB. debido a que los rangos de números significativos para las dos variables que se grafican a veces difieren considerablemente. un aumento de 6. Un histograma es una herramienta útil para diferenciar las frecuencias de intervalos de clase.5 Liste tres usos específicosde frecuencia acumuladas en negocios. Por medio de tablas y gráficas .24 ESTADISTICA EN LOS NEGOCIOS 2. 8 investigador de negocios que lleva a cabo el estudio organiza los datos en una distribución de frecuencias para ayudar al gerente de recursos humanos en el análisis de los datos. A continuación se muestra la distribución de frecuencias. La figura 2. Nótese que la menor diferencia en la longitud de los rectángulos parece representar las frecuencias en la figura 2. 2) polígono de frecuencia. A continuación se presentan seis tipos de representación gráfica: 1) histograma. una reducción de 14. Histogramas Un histograma es un tipo de gráfica de barras verticales que se utiliza para representar una distribución de frecuencias. Intervalo de clase Frecuencia O-menor de 2 218 2-menor de 4 207 4-menor de 6 6-menor de 8 56 11 8-menor de 10 8 2. pero a la vez consistente con el mensaje de los datos originales. y 6) gráfica de Pareto. Un examen del histograma revela en dónde se presentan grandes aumentos o reducciones entre clases. y de la clase 7-menor de 9 a la clase 9-menor de 11. SY GRÁFICAS 25 Histograma MINITAB de datos 15 oe desempleo en =rancia 9 11 13 Porcentajesde desempleo en Francia ramente las escalas que se emplean para los ejes de un histograma. el histograma sigue siendo muy importante.CAPITULO2 TABL'. De otra forma. A veces. también se crea un histograma grañco. Supongamos Histograma MINITAB de datos de desempleo en Francia (eje y comprimido) 15 " ·¡¡ ~ 10 ~ u. a quienes toman decisiones se les presenta una gran base de datos de información y no saben por dónde empezar al tratar de entender lo que significan los datos. Aun cuando casi todos los conceptos se presentan en el capitulo 3. aquí se presenta la noción de histograma como herramienta inicial de acceso a estas caracteristicas de los datos. pero al hacer die en Chart output de la caja de diálogo de histograma Excel. . y los datos de resultados aislados. la cantidad de variabilidad de los datos. El análisis del histograma de estos datos puede dar información inicial acerca de la forma de la distribución de los datos. el creador de una gráfica puede "mentir con la estadística" al alargar o comprimir una gráfica para formar un punto: Uso de histogramas para obtener una visión general de los datos Debido a la generalizada disponibilidad de computadoras y programas de estadística para investigadores de negocios y para quien tome decisiones. 5 11 13 Porcentajes de desempleo en Francia · Debe señalarse que el paquete Excel utiliza el término histograma para referirse a una distribución de frecuencia. una de las variables de la base de datos de Stock Market (que se ve en el CD-ROM) es el Stock Volume. La base de datos contiene 324 observaciones de volumen de acciones. la ubicación central de los datos. Por ejemplo. El enlace de estos puntos medios completa la gráfica. Aun cuando el centro del histograma está ubicado cerca de 500 millones de acciones. Además. En el capítulo 3 veremos que la forma de esta distribución está sesgada hacia el extremo derecho. La figura 2. Los resultados aislados son puntos de datos que aparecen fuera del cuerpo principal de observaciones y pueden representar fenómenos que difieren de los representados por otros puntos de datos. Ojivas Una ojiva es un polígono defrecuencias acumuladas. Se podría concluir que en pocos dJas del mercado de acciones. Se determina un punto para el valor de frecuencia en el punto medio de cada intervalo de clase (marca de clase). Se pueden captar éstas y otras nociones al examinar el histograma y mostrar que los histogramas desempeñan un papel importante en el análisis inicial de datos. La información captada a partir del polígono de frecuencias e histogramas es semejante. lo cual afecta la impresión del usuario de lo que representa la gráfica. Podemos ver. ¿Qué se puede saber a partir de este histograma? Prácticamente todos los volúmenes del mercado de acciones caen entre cero y mil millones de acciones.6 presenta una ojiva obtenida con el Excel para los datos de la tabla 2. al asignar escala a puntos finales de clase a lo largo del eje x y a los valores de frecuencia a lo largo del eje y. 0011¡111. se notan algunos datos que se acercan a los mil millones. como se muestra en la figura 2. Al igual que con el histograma.3.2. Al enlazar los puntos se completa entonces Ja ojiva. La distribución toma una forma que es alta en el extremo izquierdo y se hace aguda hacia la derecha._ Histograma de volúmenes de acciones.3 muestra un histograma de estos datos producido por el MINITAB. No obstante. 1990-1998 50 40 30 20 10 o 500 millones 1000 millones . La construcción de un polígono de frecuencias empieza. La figura 2. La figura 2. una gran parte de las observaciones del volumen de acciones cae en el extremo inferior de los datos en algún punto entre 100 millones y 400 millones de acciones.5 muestra un polígono de frecuencias de los datos de distribución de la tabla 2. el cambio de escalas de los ejes puede comprimir o alargar el polígono de frecuencias. Un punto de frecuencia cero se grafica al principio de la primera clase y la construcción continúa al marcarse un punto en el extremo de cada intervalo de clase para el valor acumulado.26 ESTADISTICA EN LOS NEGOCIOS que quien tome decisiones financieras desea usar estos datos para llegar a algunas conclusiones acerca del mercado de acciones. que los datos del volumen del mercado de acciones no están normalmente distribuidos.2. al igual con un histograma. Al observar el histograma.4. Polígonosde frecuencia Un polígono de frecuencias es una gráfica en la que segmentos de recta "que enlazan puntos" representa una distribución de frecuencias. a veces es útil determinar si los datos están normalmente distribuidos en forma aproximada (curva en forma de campana). al examinar el histograma de la figura 2. obtenido con el uso del programa Excel. el uso de valores de frecuencia acumulada requiere que la escala a lo largo del eje y sea suficientemente grande para incluir el total de frecuencia. se vende un gran volumen de acciones. el histograma muestra algunos resultados aislados en el extremo superior de la distribución. AquI también se inicia la construcción al marcar el eje x con los puntos finales de clase y el eje y con las frecuencias. En estadística. CAPtruLO 2 TABLAS Y GRÁFICAS 27 Las ojivas son más útiles cuando quien tome decisiones desea ver totales corrientes. el uso de gráficas de pastel es mínimo en ciencias y tecnología debido a que 1.ribución normal Gráficas de pastel Una gráfica de pastel es una representación circular de datos donde el área de todo el pastel representa 100% de los datos en estudio y las rebanadas representan una descomposiciónen porcentaje de los subniveles. si un controlador está interesado en controlar costos. en particular para representar factores como por ejemplo categorías de presupuesto.:-1. Las pendientes pronunciadas de una ojiva se pueden usar para identificar aumentos agudos en frecuencia.111- 18 - -gono de 29c:uencia. -3 e 35 30 ~ 25 e 20 ·o" . No obstante. 12 ·o e .. Se utilizan ampliamente en negocios. porcentaje de participación en el mercado y asignaciones de tiempo y recursos.a::el de los datos ::.:) 10 ~ "- 6 4 o 3 7 9 45 40 . En la figura 2. ~en :.:) ~ "- 15 JO o 3 9 Puntos finales de dase 11 13 11 13 .s:. Por ejemplo.4 :>.esempleo 16 14 . Las gráficas de pastel muestran las magnitudes relativas entre partes y un todo..6 pueden presentarse pendientes agudas en la clase l-menor de 3 y la clase 9-menor de 11. lo cual significa grandes totales de frecuencia de clase. RGUllA 2. una ojiva podrfa representar costos acumulados de un año fiscal.... 48° del pastel. "william S. The El<ments of Graphmg Data {Monterey. CA: Wadsworth Advanced Books and Software.. porque piensan que es más fácil comparar categorias que son similares en tamaño con el histograma o Ja gráfica de barras que con la gráfica de pastel.28 ESTADISTICA EN LOS NEGOCIOS •HA·1fii!i.fi. para un observador es más dificil interpretar el tamaño relativo de ángulos en una gráfica de pastel que juzgar la longitud de rectángulos en un histograma o la distancia relativa de un punto de polígono de frecuencias desde el eje x. "Where Are Soft Drinks Sold?" las representaciones del porcentaje de ventas por lugar fueron mostradas tanto por una gráfica de pastel como por una gráfica de barras verticales...L.. las cifras de ventas de número entero son proporciones convertidas al dividir cada cantidad de ventas entre la cantidad total de ventas. 9 600 millones de cajas de refrescos se vendieron sólo en Estados Unidos. Tiendas M~. fuentes de sodas. Cleveland.4._ _ ¿Dónde se venden bebidas gaseosas? El mercado de bebidas gaseosas (refrescos) es sumamente grande y creciente en Estados Unidos y en todo el mundo. vendecnvasadosl doras guolintras Comer· Panmoames ciu Lugardcvcnw pueden llevar a juicios menos precisos de lo que es posible con otros tipos de gráficas. En la construcción de la gráfica de pastel primero se determina la proporción entre la subunidad y el entero.. La gráfica de pastel de la figura 2. !ne.::_=-.1¡111.L. . Multiplicar este valor por 360 resulta en 47. tiendas de alimentos envasados o gasolineras y máquinas despachadoras.Fumt< merado dr ." En general.J+M •. Por ejemplo. En un año reciente. las ventas de Aquafresh de $177 989 000 representan una proporción de . . Las ventas de Aquafresh constituyen 47. ¿Dónde se venden bebidas gaseosas? Los siguientes datos de Ja investigación de Sanford C.:1=->-=11::.OO. 1985). j :=-<-=l=.. construida con el uso de MINITAB. =_=. en Jugar de la gráfica de pastel. Bernstein indican que los cuatro Jugares principales para ventas de bebidas gaseosas son supermercados. Lupr de wntas Tiendas de alimentos ~dos/gasolineras 16% Pon:mtaje Supermercado Fuente de soda.. Tienda de alimentos envasados/gasolineras M'quinas expendedoras Comerciantes Farmacias « 24 16 11 so------------------~ 30 Estos datos se pueden exhibir gráficamente en varias formas..1319)... En el artículo Statistics in Business Today. Primeramente.48º.4 contiene cifras de ventas generadas por Information Resources.. La tabla 2. La gráfica de pastel se completa entonces con el uso de un compás para trazar las rebanadas. Aqul se ilustra una gráfica de pastel de Excel y una gráfica de barras de MINITAB de los datos. cada proporción se multiplica por 360 para obtener el número correcto de grados y representar cada artículo.i Super.. de ..1319 del total de ventas {177 989 000/1349 326 000 = . describe los datos de la tabla 2... Algunos expertos en estadística prefieren el histograma o la gráfica de barras. Esta proporción es análoga a la frecuencia relativa calculada para distribuciones de frecuencia.¡111¡Mi[.7. para las principales 10 marcas de pastas dentales.!im. Debido a que el círculo contiene 360 grados. Robos de empleados 17 918.6/43 281.69 Closeup Ultrabrite Totales 32 009 ()()() . -narca Sensodyn 3. asociada con cada una de estas fuentes.2 Según la National Retail Federation y el Center fer Retailing Education de la University of Florida. las cuatro principales fuentes de disminución de inventario son robos de empleados.2380 85.6 $43 281.0386 13.4% :O-T"ica de pastel ~AB de ventas .0812 29.1319 47.6 2 553.00 1.53 25 358 000 .55 109 512 000 .6 15191.A 2.68 177 989000 .7 = . s1 349 326 29 Closeup 2.CAPITULO 2 TABLAS Y GRAFICAS tul. errores administrativos y fraude de vendedores.2745 98.7% Listerine 3% PROBLEMA DE DEMOSTRACIÓN 2.48 170630000 . Solución Convierta cada cantidad de dólares sin procesar a una proporción al dividir cada cantidad individual entre el total.39 Listerine 40 107 000 .0297 10..82 321084000 .0372 13.351 7 617. la disminución estimada en cantidad anual en dólares (millones de dólares).23 52 067 000 .176 Fraude de vendedor Total 2 553. es: Robos de empleados Robos de clientes Erroradministrat ivo Fraude de vendedor Total $17 918.059 1.7 = .6/43 281.9 7 617.::e oasta dentífrica pe-.9/43 281. .0237 8.6/43 281.4 :mas de pasta ="lea de 10 :ic oales marcas Marca Crest Colgate Aquafresh Mentadent Arm &Hammer Rembrandt Sensodyn Vmtu Proporción Grados $370 437 000 .7 Construya una gráfica de pastel para representar estos datos.90 50 133 000 . robos de clientes en tiendas.0187 ____§n_ oro 1..7 = .:1 .0000 360.7 = .000 Convierta las proporciones a grados al multiplicar cada proporción por 360º.414 Robos de clientes Error administrativo 15191.1265 45. 6 se muestra una gráfica de tallo y hoja de estos datos. Si un conjunto de datos tiene sólo dos dígitos. el tallo es el valor de la izquierda y la hoja es el valor de la derecha. al que se sometieron 35 estudiantes para posiciones en esa planta. Los dígitos de la extrema derecha son las hojas y contienen los valores más bajos. 360° = . Los dígitos de la extrema izquierda son el tallo y están formados por los dígitos de más alto valor.059 .351 . La tabla 2. Una ventaja de esta distribución es que el instructor puede fácilmente ver si las calificaciones están en el extremo superior o inferior de cada corchete.30 ESTADISTICA EN LOS NEGOCIOS . si 34 es uno de los números. 360° = Robos de empleados Robos de clientes Error administrativo Fraude de vendedor Total 149.0' 126. Una segunda ventaja de las gráficas de tallo y hoja es que los valores de TABLA 2. la división del tallo y hoja es cuestión de preferencia del investigador.4° 21.6 TABLA 2.0° Fraude de vendedor 6% Robos de clientes 35% Gráficas de tallo y hoja Otra forma de organizar datos sin procesar en grupos es por una gráfica de tallo y hoja.5 Calificaciones de examen de seguridad para estudiantes de planta 86 76 23 77 81 79 68 77 92 59 68 75 83 49 91 47 72 82 74 70 56 60 88 75 97 39 78 94 55 67 83 89 67 91 81 Gráfica de tallo y hoja para datos de examen de seguridad de planta Tallo 3 4 6 7 8 9 Hoja 3 9 7 5 o o 1 9 6 7 2 9 7 4 2 2 8 5 3 4 8 5 3 7 6 6 7 8 7 9 8 9 . Esta técnica es sencilla y da una vista de características únicas de los datos.414. Para números con más de dos dígitos. 360° = .4° 63. Por ejemplo.5 contiene calificaciones de un examen sobre política y reglas de seguridad de una planta. así como determinar la dispersión de las calificaciones. un tallo y una hoja. el tallo es 3 y la hoja es 4. Una gráfica de tallo y hoja se construyeal separar los dígitos de cada número de los datos en dos grupos.2' 360. En la tabla 2. 360º = .176. 25% por clavijas defectuosas y 5% por cojinetes pegados.47 1. en la que los principales tres problemas con motores defectuosos.15 Con el uso de dólares como tallo y centavos como hoja. construya una gráfica de tallo y hoja de los datos.20 3.95 3. Los analistas emplean este registro para obtener una gráfica de bamu verticales que exhiba los tipos de defectos más comunes. Supongamos que el número de motores eléctricos que son rechazados por inspectores de una compañía se incrementó.64 1.64 9.20 5. que es un registro cuantitativo del número y tipos de defectos que se presentan en un producto o servicio. cortocircuito en las bobinas y clavijas defectuosas.65 3. Es probable que directores y trabajadores de la compañía comiencen a mejorar la calidad al examinar los segmentos del proceso de producción que se relacionen con el alambrado para posteriormente estudiar la construcción de las bobinas y luego las clavijas y el proceso del proveedor de éstas.55 4.97 3. El experto en calidad J.10 4. con lo cual los directores pueden formular un plan lógico para reducir el número de defectos.11 4.15 2.84 2.21 8.53 4. Solución Tallo Hoja 1 2 3 4 5 6 83 09 20 10 11 93 75 21 15 42 20 64 15 94 80 8 9 10 97 78 32 65 47 84 34 84 45 95 53 64 67 89 Gráficas de Pareto Un concepto y movimiento importantes en negocios es la Administración de Calidad Total (véase el capitulo 18}.34 3. De la gráfica de Pareto.80 4.67 1.84 2. Una gráfica de Pareto hace posible que quienes tomen decisiones en control de calidad separen los defectos más importantes de los defectos triviales.93 3.89 3. clasificados en el orden en que se presentan de izquierda a derecha.32 7.09 2.8 muestra una gráfica de Pareto construida a partir de esta información. Juran aplicó esta noción al campo de la calidad al observar que la mala calidad puede a veces resolverse al atacar algunas causas principales que resultan en casi todos los problemas.78 3. para establecer prioridades en el trabajo de mejora de calidad según sea necesario. Los directores de la compañía examinan los registros de varios cientos de motores en los que se encontró por lo menos un defecto y encuentran que 40% de los defectos son por alambres defectuosos. es decir. Uno de los importantes aspectos de la administración de calidad total es la constante búsqueda de causas de problemas en productos y procesos. PROBLEMA DE DEMOSTRACIÓN 2. . alambres defectuosos. Las gráficas de Pareto se denominan as! en honor al economista italiano Vilfredo Pareto. 30% por cortocircuito en las bobinas.3 Los siguientes datos representan los costos (en dólares) de una muestra de 30 remesas postales hechas por una compañía.42 5.M. La gráfica de barras se llama gráfica o diagrama de Pareto. justifica 95% de los problemas. 3. Una técnica gráfica para mostrar causas de problemas es el análisis de Pareto. quien observó hace más de 100 años que casi toda la riqueza de Italia estaba controlada por unas cuantas familias que eran los principales motores detrás de la economía italiana.CAPITULO 2 TABLAS Y GRAFICAS 31 los datos originales sin procesar se retienen (en tanto que casi todas las distribuciones de frecuencia y representaciones gráficas usan el punto medio de clase para representar los valores en una clase).45 5.83 3.94 7. La figura 2.75 10. 32 ESV.DISTICA EN LOS NEGOCIOS ma11i!I!: .. Gráfica de Pareto para problemas de motores eléctricos 40 § .. 30 -¡; -e 25 35 ·;:*- 20 o o. 10 15 ~ Alambre Conocimllto Clavija defectuoso en bobina defectuosa U@i1¡tt¡.. Cojinetes pegados r---l-º-º-;::==================::;---------------100 Gráfica MINITAB de Pareto para problemas de motores eléctricos 80 .. ~ so ., 60 .u 40 .¡: ;: ~ 20 Defecto Cuenta Porcentaje %acum. Alambre defectuoso 40 40.0 40.0 Cortocircuito en bobina 30 30.0 70.0 Clavija defectuosa 25 25.0 95.0 Otros 5 5.0 100.0 La figura 2.9 es una presentación MINITAB de la gráfica de Pareto. Además del análisis de la gráfica de barras, el análisis de MINITAB de Pareto contiene una gráfica de linea de porcentaje acumulado. Observe las pendientes en la gráfica de linea en la que las pendientes mayores representan los problemas que se presentan con más frecuencia. Cuando las pendientes bajan, los problemas se presentan con menor frecuencia. La gráfica de línea proporciona a quien tome decisiones otra herramienta para determinar cuáles problemas resolver primero. 2.2 PROBLEMAS 2.6 Construya un histograma y un polígono de frecuencia para los siguientes datos. Intervalo de clase 30-menor de 32 32-menor de 34 34-menor de 36 36-menor de 38 38-menor de 40 40-menor de 42 42-menor de 44 44-menor de 46 Frecuencia 7 15 21 34 24 17 8 CAPITULO 2.7 2.8 33 Construya un histograma y un polígono de frecuencia para los siguientes datos. Intervalo de clase Frecuencia !O-menor de 20 20-menor de 30 30-menor de 40 40-menor de SO SO-menorde 60 60-menor de 70 70-menor de 80 9 7 10 6 13 18 IS Construya una ojiva para los siguientes datos. Intervalo de clase 3-menor de 6 6-menor de 9 9-menor de 12 12-menor de IS IS-menor de 18 18-menor de 21 2.9 2 TABLAS Y GRÁFICAS Frecuencia 2 s 10 11 17 s Construya una gráfica de tallo y hoja usando dos dígitos para el tallo. 212 2S7 243 218 2S3 273 2SS 239 271 261 238 227 220 226 240 266 249 2S4 270 226 218 234 230 249 2S7 239 222 239 246 2SO 261 2S8 249 219 263 263 238 2S9 26S 2SS 23S 229 240 230 224 260 229 221 239 262 2.10 A continuación aparece una lista de las compañías de contabilidad más grandes de Estados Unidos, junto con sus datos de ingresos netos para 1997 (millones de dólares), según el Public Accounting Report. Firma Andersen Worldwide Emst&Young Deloitte & Touche I<PMG Peat Marwick Coopers & Lybrand PriceWaterhouse Grant Tbornton McGladrey & Pullen BDO Seidrnan Ingresos $S44S 4416 3 600 2 698 2S04 2 344 289 270 240 Construya una gráfica de pastel para representar estos datos. Aplique leyendas a las rebanadas con los porcentajes apropiados. Comente sobre la efectividad de usar una gráfica de pastel para exhibir los ingresos de estas empresas de contabilidad más importantes. 2.11 Según la Air Transport Association of América, Delta Airlines encabezó todas las líneas en cuanto al número de pasajeros transportados en un año reciente. Las cinco principales aerolíneas fueron Delta, United, American, U.S. Airways y Southwest. A continuación aparece el número de pasajeros transportados (en miles) por cada una de estas aerolíneas: 34 ESTADISTICA EN LOS NEGOCIOS Aerolínea TABLA 2.7 Valor de construcciones nuevas en un periodo de 35 años Residmcial No residencial 169635 96497 155113 115372 149410 96407 175822 129275 162706 140569 134605 145054 195028 131289 231396 155261 234955 178925 266481 163740 267063 160363 263385 164191 252745 169173 228943 167896 197526 135389 232134 120921 249757 122222 274956 127593 251937 139711 281229 153866 280748 166754 297886 177639 315757 175048 Fuente: U.S. Census Bureau, Current Construction Reports (en millones de dólares estables). Pasajeros Delta 103133 United 84 203 American 81 083 US Airways 58 659 Southwest 55 946 2.12 Information Resources, Inc. reporta que, en un año reciente, Huggies fue la marca de pañales de mayor venta en Estados Unidos con 41.3% de la participación en el mercado. Otras marcas que destacan son Pampers, con 25.6%, Luvs con 12.1 %, Drypers con 3.3%, Fitti con 0.9%, y marcas libres con 15.8%. Utilice esta información para construir una gráfica de pastel de la participación en el mercado de pañales. 2.13 Los siguientes datos representan el número de pasajeros por vuelo en una muestra de 50 vuelos procedentes de Wichita, Kansas, a Kansas City, Missouri. 23 46 66 67 13 58 19 17 65 17 25 20 47 28 16 38 44 29 48 29 69 34 35 60 37 52 59 51 33 46 23 38 52 so 80 48 17 57 41 77 45 47 49 19 32 64 27 61 70 19 Construya una gráfica de tallo y hoja para estos datos. ¿Qué nos dice la gráfica de tallo · y hoja acerca del número de pasajeros por vuelo? 2.14 Una aerolínea utiliza un banco central telefónico y un proceso semiautomático telefónico para tomar reservaciones. Ha estado recibiendo un número anormalmente alto de quejas de clientes acerca de este sistema de reservaciones. La compañia llevó a cabo un estudio de clientes, en el cual preguntaron si habían tenido cualesquiera de los siguientes problemas al hacer reservaciones: tono de ocupado, desconexión, mala conexión, demasiado tiempo en espera para hablar con alguien, no comunicarse con un agente, conectado a extensión equivocada. Supongamos que el estudio de 744 dientes quejosos resultó en el siguiente total de frecuencia. Número de quejas 184 Queja Demasiado tiempo en espera 10 Transferido a extensión equivocada 85 No comunicarse 37 Desconexión 420 8 con un agente Tono de ocupado Mala conexión Construya un diagrama de Pareto, a partir de esta información, para mostrar los diferentes problemas encontrados al hacer reservaciones. 2.3 DESCRIPCIÓN GRÁFICA DE DATOS NUMÉRICOS DE DOS VARIABLES: GRÁFICAS DE DISPERSIÓN En investigaciones de negocios, muchas veces es importante explorar la relación entre dos variables numéricas. En los capítulos 3 y 13 se exponen métodos estadísticos más detallados, pero aquí presentamos un mecanismo gráfico para examinar la relación entre dos variables numéricas: la gráfica de dispersión (o diagrama de dispersión). Una gráfica de dispersión es una gráfica en dos dimensiones donde las parejas de los puntos son dos variables numéricas. Como ejemplo de dos variables numéricas, considere los datos del la tabla 2. 7 donde aparecen los valores de construcciones residenciales nuevas y no residenciales nuevas en Estados Unidos para varios CAPITULO h~11i' 111·• Gráfica MINITAB oe dispersión de construcción -esidencial y -o residenciet ueva 2 TABLAS Y GRÁFICAS 35 180000 160000 ~ 5 ·~ zo . 140000 -e 120000 100000 80000 120000 220000 320000 Residencial años en un periodo de más de 35 años. ¡Tienen alguna relación estas dos variables numéricas? Podría parecer lógico, cuando hay auge de construcciones que al mismo tiempo hubiera auge en construcciones residenciales y no residenciales; sin embargo, la gráfica de dispersión MINITAB de estos datos que se ve en la figura 2.10 muestra resultados mixtos. La aparente tendencia es que hay más construcción de edificios residenciales nuevos cuando tiene lugar más construcción de no residenciales y menos construcción de residenciales nuevos cuando está a menores niveles la construcción de no residenciales. La gráfica de dispersión también muestra que en algunos años hubo más construcción de residenciales nuevos y menos construcción de no residenciales al mismo tiempo y viceversa. 2.3 PROBLEMAS 2.15 La U.S. National Oceanic and Atmospheric Administration, National Marine Fisheries Service, publica datos sobre la cantidad y valor de pesca nacional en Estados Unidos. A continuación aparece la cantidad (en millones de libras) de peces capturados y empleados para consumo humano y productos industriales (aceite, carnada, alimento para animales, etc.) en más de una década. ¡Es una relación evidente entre la cantidad empleada para consumo humano y la usada para productos industriales para un año dado? Construya una gráfica de dispersión de los datos. Examine la gráfica y discuta la intensidad de Ja relación de las dos variables. Alimento humano Productos industriales 3 654 2 828 3 547 2 430 3 285 3 082 3 238 3 201 3 320 3 118 3 294 2 964 3 393 2 638 3 946 2 950 4 588 2 604 6 204 2 259 2.16 ¡Existe relación entre el dinero invertido en publicidad por una compañia y los ingresos totales por ventas? Los siguientes datos representan el dinero invertido en publicidad y los ingresos por ventas para varias compañías en una industria dada durante un año reciente. Construya una gráfica de dispersión de los datos a partir de las dos variables y comente la relación entre las dos variables. 36 ESTADISTICA EN LOS NEGOCIOS Publicidad (en millones de dólares) Vontas (en millones do dólares) 4.2 1.6 6.3 155.7 87.3 135.6 99.0 168.2 136.9 101.4 158.2 2.7 10.4 7.1 5.5 8.3 Estado de la manufacturade autos Debido a que los datos sin procesar del Dilema de decisión están en millones, es ventajoso representar gráficamente los datos para el lector o el oyente. Como ejemplos de lo que se puede hacer gráficamente, en la figura 2.11 se ilustran los datos de participación en el mercado para 1999 en una gráfica de pastel de MINITAB; los datos para 2000 se muestran en un histograma Excel en la figura 2.12. Los datos de distribuidorasse pueden resumir si se usa una distribución de frecuencia o una gráfica de tallo y hoja. La siguiente distribución de frecuencia de los datos muestra que los intervalos de los datos son 69 - 30 = 39. Si los anchos de clase son 5 y la distribución de frecuencia empieza en 30, se necesita de 8 clases. • 30-menor de 35 35-menor de 40 40-menor de 45 45-menor de 50 50-menor de 55 55-menor de 60 60-menor de 65 65-menor de 70 6 o 6 2 6 6 7 CONSIDERACIONES ÉTICAS Las consideraciones éticas para las técnicas aprendidas en el capitulo 2 empiezan con los datos escogidos para la representación.Con la abundancia de datos disponibles en negocios, la persona que construya el resumen de datos debe ser selectiva al escoger las variables reportadas. El potencial es grande para el analista que seleccionará las variables o incluso datos dentro de las variables que sean favorables para su propia situación o que se perciba sean bien recibidos por el oyente. La sección 2.1 hizo notar que el número de clases y el tamaño de los intervalos en distribuciones de frecuencia por lo general son seleccionados por el investigador,quien debe ser cuidadoso para seleccionar valores y tamaños que sean un reflejo honesto y exacto de la situación y no un caso sesgado, exagerado o subestimado. • En las secciones 2.2 y 2.3 estudiamos cómo construir cuadros y gráficas señalando que en muchos casos tiene sentido usar escalas desiguales en los ejes. No obstante, hacer esto último abre la posibilidad de "engallar con la estadística"al alargar o comprimir los ejes para recalcar el punto de vista del analista o investigador. Es imperativo que las distribuciones de frecuencia, asi como tablas y gráficas, se construyan de modo que reflejen datos reales y no simplemente la propia observación del investigador. .f---+-~+---i ..a. a Honda Motor (5. ---•--11•.CAPITULO 2 TABLASY GRÁFICAS 37 Una gráfica de tallo y hoja de estos datos aparecería como se ve a continuación.0%) (ll.2%) Toyota motor (12.5%) DaimlerChrysler HyundaiMotor (6..:. • ~~oastel _:::.:¡ 'Q e e !! e 6000000 5000000 4000000 -!t 3000000 2000000 1000000 o--'-'~-+-~1---+~+---+~+-__.13 aparece una gráfica Excel de estas dos variables numéricas. Tallo 4 5 6 Hoja 013444 0344444557799 12777889 o 112345567789 Es posible emplear una gráfica de dispersión para examinar la relación entre los datos de 1999 y 2000.z.. En la figura 2.3%) 10000000 9000000 cz::s oe ventas 2 :ompañía 8000000 ¡¡ 7000000 -. Es análoga a la probabilidad de sacar al azar. Casi todo el análisis de estadística se realiza con datos no agrupados. y otras importantes características de los datos. La construcción de una distribución de frecuencia exige varios pasos. Es importante distinguir entre datos agrupados y no agrupados. La frecuencia acumulada es una cuenta corriente de frecuencia total que se inicia con el primer valor de frecuencia y suma cada frecuencia resultante al total. es decir. pocas clases agregan en exceso los datos en categorías sin sentido y muchas clases no resumen los datos lo suficiente para que sean útiles. para calcular el número de grados del circulo asignados a cada categoría El investigador debe tener cuidado con el uso de gráficas de pastel. La frecuencia relativa es un valor calculado al dividir una frecuencia individual entre la suma de las frecuencias.38 ESTADISTICA EN LOS NEGOCIOS ma11¡!·111• Gráfica de dispersión de una compañía de ventas. que es una selección arbitraria del investigador. Una gráfica de Pareto es una gráfica de barras verticales que se utiliza en Administración Total de la Calidad paramostrar gráficamente la causa de problemas en orden descendente para ayudar a quien tome decisiones a priorizarlas. La gráfica de dispersión tiene dos dimensiones en parejas de puntos que provienen de dos variables numéricas y se utilizan para determinar si existe cualquier aparente relación entre las dos variables. La representación gráfica de datos es-' especialmente útil para ayudar a expertos en estadística a determinar la forma de distribuciones. Las ojivas son polígonos de frecuenda acumulada. un tallo y una hoja. La gráfica de ojiva se inicia en el comienzo del primer intervalo de clase con un valor de cero y continúa por los valores de las frecuencias acumuladas hasta los puntos extremos de clase. porque a veces es difícil distinguir los tamaños relativos de las rebanadas. • •• • RESUMEN Los dos tipos de datos son agrupados y no agrupados. La cantidad de cada categoría se representa como una rebanada del pastel proporcional al total. Los tallos son los dígitos de la extrema izquierda de los números y las hojas son los dígitos de la extrema derecha. gráficas de tallo y hoja. El experto en estadística puede saber mucho acerca de la forma de la distribución. a continuación. de todos los valores. formando así un rectángulo. gráficas de Pareto y gráficas de dispersión. El tercer paso en la construcción de una distribución de frecuencia es determinar el ancho del intervalo de clase. que es la diferencia entre el valor más grande y el valor más pequeño y. sin procesar. se determina el número de clases. un valor de un intervalo de clase dado. Las rebanadas se determinan al multiplicar por 360º la proporción de cada categoría. Los tipos de representaciones gráficas presentadas en este capitulo son histogramas. Las gráficas de tallo y hoja son otra forma de organizar datos.. Los números se dividen en dos partes. El investigador de negocios determina cómo dividir los dígitos en tallos y hojas. con todos los valores de hoja correspondientes a cada tallo mostrado junto a ese tallo. Un histograma es una gráfica de barras verticales en donde un segmento de recta enlaza puntos finales de clase en el valor de la frecuencia. No obstante. Una gráfica de pastel es una representación circular de datos. . Los datos agrupados son datos organizados en una distribución de frecuencia. Los datos son de 1999 y 2000 10000000 9000000 8000000 7000000 o 6000000 o o 5000000 "' 4000000 3000000 2000000 1000000 • . polígonos de frecuencia. Un polígono de frecuencia se construye al graficar un punto con la marca de cada intervalo de clase por el valor de cada frecuencía y luego enlazar los puntos. Los tallos se ponen en lista individualmente. La marca de clase es el punto medio de un intervalo de clase. La frecuencia relativa representa la proporción de valores totales que está en un intervalo de clase dado. La división del rango de valores entre el número de clases da el ancho aproximado del intervalo de clase. el primero de los cuales es determinar el rango de los datos. si examina un histograma de los datos. porque las operaciones estadísticas en los dos tipos se calculan de modos diferentes. Dos rectas verticales enlazan este segmento de recta hasta el eje x. gráficas de pastel. ojivas. Los histogramas están tomando una creciente importancia como herramienta inicial de análisis. Es el promedio de los puntos finales de clase y representa el punto a la mitad del intervalo de clase. Los puntos en una ojiva se grafican en los puntos extremos de clase. la frecuencia relativa y la frecuencia acumulada. Haga que la hoja contenga un dígito. 12 17 Intervalo de clase Frecuencia SO-menor de 60 60-menor de 70 70.menor de 80 80-menor de 90 90-menor de 100 13 27 43 31 9 Construya una gráfica de pastel a partir de los siguientes datos..22 Un examen de rechazos muestra por lo menos 1 O problemas.23 Construya una gráfica de dispersión para las siguientes dos variables numéricas.CAPITULO 2 TABLAS Y GRÁFICAS 39 [ TÉIHINOS CLAVE frecuencia gráfica de gráfica de gráfica de z¡. ¿Qué puede usted observar acerca de los datos a partir de la distribución de frecuencias? 44 57 298 317 316 324 9 Pruebe sus conocimientos 51 53 41 2. un polígono de frecuencia."'Jáón de frecuencias '=IXDÓa acumulada relativa dispersión Pareto pastel gráfica de tallo y hoja histograma marca de ciase ojiva polígono de frecuencias punto medio de clase rango PltOBLEMAS COMPLEMENTARIOS de estadísticas :_1. Leyenda Valor A B 55 121 83 46 e D 312 314 290 306 324 309 311 286 289 335 294 "s26 317 301 308 284 6 10 14 8 2.Para los siguientes datos. Construya una gráfica de Pareto para estos datos. y una ojiva para la siguiente distribución de frecuencia. determine la marca de clase. construya una distribución de frecuencia con seis clases. 53 53 44 56 42 52 41 50 57 56 52 63 46 50 52 44 46 50 69 42 36 62 43 47 55 57 53 46 51 54 47 47 52 53 58 51 38 49 39 44 55 43 42 57 49 Construya una distribución de frecuencias p:tra estos datos usando ocho clases. 21 21 39 28 18 20 Frecuencia 1 2 673 29 108 379 73 564 12 402 54 202 4 5 6 7 8 9 10 Para cada intervalo de clase de la distribución de frecuencia dada.24 La Whitcomb Company fabrica un anillo metálico para motores industriales que por lo general pesa 50 onzas.rupados no agrupados =i.. A continuación veamos un total de frecuencia de los problemas. s.21 Construya una gráfica de tallo y hoja para los siguientes datos. 3 10 15 8 9 !. ~O Problema ..:».19 Construya un histograma. 57 26 46 23 51 43 41 42 46 50 31 28 u 35 47 29 19 52 33 18 29 23 36 29 28 2. Una muestra aleatoria de 50 de estos anillos metálicos produjo los siguientes pesos (en onzas). Intervalo de clase Frecuencia 20-menor de 25 25-menor de 30 30-menor de 35 35-menor de 40 40-menor de 45 45-menor de 50 17 20 16 15 8 6 2. 7 64. El investigador totalizó los resultados y los presentó en la distribución de frecuencias que se ve a continuación.4 27.1 52.1 52.5 32.29 Una atención prenatal buena y de costo relativamente bajo puede evitar toda una vida de gastos debidos a complicaciones que resultan del bajo peso de nacimiento de un bebé.32 Las siguientes cifras de importaciones en Estados Unidos de productos agrícolas y artículos manufacturados se tomaron de años seleccionados entre 1970 y 2000 (en miles de millones de dólares). b.1 48. Género R&B Alternativa Rap Country Pista Metal Clásica Latina Álbumes vendidos 146.9 55.5 61.4 37.1 76.27 Utilice los datos del problema 2.25. rap y música country.25 Una compañía de distribución ubicada en el noroeste de Estados Unidos hizo una encuesta a 53 de sus gerentes de nivel medio. frecuencia relativa y frecuencia acumulada para estos datos. cada una de unos 2 000 pies cuadrados de construcción. un polígono de frecuencias y una ojiva.4 26. La distribución de frecuencias que se ilustra contiene las categorías de precios para las 86 casas. Precio Frecuencia $1. que muestre el porcentaje del total que representa cada uno de estos géneros.2 54. son R&B.5 32.9 32.9 60.90-menor de 2. La encuesta obtuvo las edades de estos gerentes. lnternational Trade Administration. junto con el número de álbumes vendidos de cada uno (en millones).20-menor de 2. alternativa (rock).8 14. 2. Precio pedido Frecuencia $ 60 000-menor de S 70 000 70 000-menor 80 000-menor 90 000-menor 100 000-menor 110 000-menor de 80000 de 90000 de 100 000 de 110000 de 120000 21 27 18 11 6 3 2. 47. el grupo construyó la distribución de frecuencias de los precios de cinco libras del azúcar marca Dominó en las tiendas encuestadas.65 2.50-menor de 2. Construya un histograma y un polígono de frecuencias para esta distribución de frecuencias y observe la forma de una distribución normal.4 102.3 71.3 77.9 63.9 46. ¿qué aspecto tiene la distribución normal? 2. a. Cantidad gastada en atención prenatal $ O-menor 100-menor 200-menor 300-menor 400-menor 500-menor Frecuencia de madres primerizas de $100 de 200 de 300 de 400 de 500 de 600 3 6 12 19 JI 6 2. un poligono de frecuencia y una ojiva para los siguientes datos.8 60.05-menor de 2.30 Un grupo de consumidores hizo una encuesta de precios de alimentos en 87 tiendas de la costa atlántica.90 1.4 54. La fuente de los datos es la U.4 19. Intervalo de clase 20-menor 25-menor 30-menor 35-menor 40-menor 45-menor de 25 de 30 de 35 de 40 de 45 de 50 Frecuencia 8 6 5 12 15 7 2. según SoundSean para un año reciente.5 56.35 2.9 54.20 2. Con base en los resultados que obtenga de estas gráficas.6 73.1 Construya una distribución de frecuencias que inicie con 10 como el punto más bajo de clase y utilice un ancho de clase de 10.4 58. los cuales posteriormente fueron organizadas en la distribución de frecuencia que se muestra a continuación.31 Los diez principales géneros musicales.4 47. .6 14.35-menor de 2. Calcule un histograma.3 87.8 27. Construya un histograma. un polígono de frecuencias y una ojiva a partir de estos datos.4 30.1 60.8 67. Construya una gráfica de dispersión para estos datos y determine cualquier relación evidente entre importaciones de productos agrícolas e importaciones de articulos manufacturados durante este periodo.1 46.7 56.9 19. Determine la marca de clase.1 48.2 57.26 A los siguientes datos se les ha dado aproximadamente la forma de una distribución normal (véase el capítulo 6).5 Construya una gráfica de pastel para estos datos.28 En una ciudad del sur de tamaño medio.6 74.6 58. Construya una ojiva.6 38. Construya un histograma y un polígono de frecuencias. 2.5 55.7 40.7 32.8 71.1 81.6 65. 86 casas están en venta. entre los precios de alimentos medidos estaba el azúcar. De los datos recolectados.75-menor de $1. A continuación aparecen éstos y otros géneros musicales. Los precios de ellas varían.6 73.50 2. Utilice estos datos para construir un histograma. En un estudio muestra al azar se pidió a 57 madres primerizas que calcularan cuánto gastan en atención prenatal.8 60.3 26.65 menor de 2.40 ESTADISTICA EN LOS NEGOCIOS 2.5 61.S.3 39.1 35.80 9 14 17 16 18 8 2.1 53.05 2. .653 4730 -4.5 ~. 20 10 = .Zs ~e de descarga de productos químicos 199 . A continua3)o.37 Suponga que son entrevistados 150 compradores en una zona comercial de nivel económico elevado. +L"'ll 150 000 5750 4654 5923 4304 5254 5919 5873 5166 4440 5478 Anestesiología Medicina familiar Pediatrla Cirugía general 2. etiquetas =atas.8 629. Interpretación de salida de computadora 2.5 388. Los datos están resumidos con el uso de la gráfica MINITAB de tallo y hoja .36 2656 2742 2200 2976 2344 2996 aparece una lista de industrias con el = i. Descarga total (libras) 737 100 000 566 400 000 229 900 000 109 700000 102 500 000 89 300 000 85 900 000 63 300 000 29 100 000 ~ F.7 [l...f oon v 6 000 habitantes como muestra para representar ~os poblados para fines de estudio.. Construya 7 una gráfica de pastel para represenmíonnación. decoloración. 30 ·Oe "" ~ u.f.3 ~ Construya una gráfica de tallo y hoja para los datos. donde una de las preguntas es el nivel de ingresos de la familia. agarradera erres.--. una organización de investigación seleccionó 50 poblaciones de Estados Unidos de entre .. tOS:& i!'!cdla:msquunicos ~primarios A continuación aparece una lista de 30 diferentes promedios de acciones del Dow Jones industrial. los habitantes de estos pueblos.. ¿Qué dice esta gráfica acerca de las diversas especialidades? Especialidades médicas Psiquiatrla ::.0 133. donde cada hoja contenga dos dígitos.or A?rradera rota ñlla en plástico Etiqueta 32 117 86 221 44 504~ ._ lfODC»las 27. Environmental Protection fl!CI.0 257..- 50 000 100 000 Ingresos de la familia en dólares = Dtco&oraáón Gn>:. donde el tallo contenga dos dígitos .:!> E:i d censo de 2000. Las causas de botellas de a!idad incluyen plástico defectuoso. Articulas manufacturados :..A 19.39 Supongamos que se hace un estudio a 100 empresas de contadores públicos titulados.. Utilice estos datos para una gráfica de Pareto.is:Xm y caucho ~ & transporte ~ ~&bñcados ~ ~d«trico ::3J =rafila manufacturera produce botellas de pláspzn b industria lechera.a...! 93 2. según la U. .58 4866 -4116 525¡ 53o6 -4199 5221 5556 5338 4963 5366 5858 4328 5048 4212 5263 4299 4361 4512 5090 5431 4346 4459 4232 5669 4339 5831 5737 4388 4822 5291 4734 5832 4878 4224 4834 2. para determinar cuántas auditorias realizan en un cierto tiempo..38 A continuación se ilustra una gráfica de pastel producida en Excel. ~cia de los problemas. Problema Númuo 2301 2830 2764 2375 2760 2437 2975 2405 2337 2602 2555 2268 3002 2677 2961 2670 2524 2448 2468 2990 3010 2922 2814 2460 Construya una gráfica de tallo y hoja para estos 30 valores.. Los siguientes datos para 500 botellas de ~que fueron rechazadas incluyen los problemas y ... Estudie el histograma MTNITAB de los siguientes datos y discuta qué se puede deducir acerca de los compradores... Algunas de las botellas son =r'iazadas por su mala calidad. grosor incorrecto.S.3 ?9.CAPfTUW 2 TABLAS Y GRÁFICAS 41 . que representa especialidades médicas. Analice las implicacio'XI de la gráfica.3 54. Procter & Gamble todavía vende más jabón. en sus productos como jabón para toda la familia. No obstante. M<S ANÁLISIS DE LA BASE DE DATOS l. la rebasó al alcanzar 31.40 La siguiente ojiva Excel muestra ventas de juguetes por una compañía en un periodo de 12 meses. ¡qué tipo es más prevaleciente en la base de datos y cuál es el que menos se ve? 4.42 ESTADISTICA EN LOS NEGOCIOS que se ilustra. ¡Qué revela la distribución de frecuencia acerca del número de trabajadores de producción? 2. Dic. produce una distribución de frecuencias al construir un histograma que verifica Frecuencia bajo Opciones y hacer clic en Mostrar Leyendas de Datos bajo Anotación. Construya una ojiva para la variable. Las 100 compañías de esta base de datos están cada una clasificada en uno de siete tipos de cornpañías. Abril May. con lo cual resulta en ventas más altas en general. ¡Qué se puede saber acerca del número de auditorías realizadas por estas empresas en la gráfica? Númerosen tallo y hoja TaUo y boja de número de auditorias N Unidad de boja = 1. Type. Se creó un nicho para este jabón por la segmentación del mercado de jabones en jabones especialmente para niños. Por ejemplo. construya una distribución de frecuencia para Ja variable. a finales de 1991 su principal rival. ¡A qué conclusiones puede llegarse acerca de las ventas de juguetes en esta compañía! ~e ~E e 100 !! " ¡'. Jun. Con el uso de la base de datos de desempleo internacional. Lever Bros. Nov.0 9 1 222333333 16 4445555 26 6666667777 35 1 888899999 39 2 0001 44 2 22333 49 2 55555 (9) 2 677777777 42 2 888889 000111 35 3 29 3 223333 23 3 44455555 15 67777 3 10 3 889 7 4 0011 3 4 222 = 100 2. Estos tipos aparecen en lista al final del capítulo l. Lever Bros habla estado detrás de Procter & Gamble desde que entró al mercado de jabones con Lifebuoy en 1895. Lever 2000 vendió $113 millones en 1991. . del cual Procter & Gamble tuvo una participación de 30. tuvo la idea de vender un jabón para toda la familia y la respuesta del consumidor fue sólida. Mar. Construya una gráfica de pastel de estos tipos y comente la salida. ¡Qué forma tiene el histograma? ¡Es alto en la parte media o cerca de uno o ambos puntos extremos? ¡Es relativamente constan- te en tamailo en las clases (uniforme) o parece no tener forma? ¡Parece estar normalmente distribuida? 3. introdujo un nuevo jabón.5%. el Lever 2000. Reported Trades. Con el uso de la base de datos de manufactura.. pero las marcas de Lever cuestan más. Sep. Oct. Lever Bros. cuando introdujo el jabón Ivory (Marfil). construya una gráfica de tallo y hoja para Italia. con lo cual deja ver las cuentas de frecuencia de clase. En MINITAB. Jul. en la base de datos financiera. 60 "'3" =- 40 e 20 '!t 80 F<b. construya un histograma para la variable. ¡Qué muestra la gráfica acerca del desempleo para Italia en los últimos 40 años? ¡Qué es lo que no muestra la gráfica? CASO: LAS JABONERASPRESENTAN BATALLAS Procter & Gamble ha sido la principal fabricante de jabón en Estados Unidos desde 1879. número de trabajadores de producción en todas las industrias. En Excel la distribución de frecuencias se refiere a un histograma. (Unilever). Agos. mujeres y hombres. delante de Procter & Gamble por primera vez en la competencia de ingresos por venta de jabón personal. En 1990 Lever Bros. Con el uso de la base de datos de mercado.5% del mercado de jabón personal con ventas de $1 600 millones. poniendo a Lever Bros. 7 21. vol.1 20.cincypost. 6.. Ieanne Whalen and Pat Sloan. forma errónea del jabón.8 26. color erróneo en el jabón.4 20.8 19.O 18. 65. etiquetas erróneas.4 15. núm. 2 de febrero de 1999.4 17. 81. '"Buoyant Sales of Lever 2000 Soap Bring Sinking Sensation to Prceter & Gamble': Wall Strttt }01m1al1 19 marzo.3 13. World Wide Web Edition of The Ci11dnnati Post.:w [h! ~~ ->pring Los: ~ e.res.9 30. el cual se ha visto como jabón para A i:nal de cuentas. Para los datos de las últimas cantidades. num. Procter & Gamble respondió al ~su jabón para baño humectante Oil of Olay. "tntros Help Boost Soap Coupons". años 1983.Cada uno de estos jabones es producid. Se examinan las causas de problemas de todos los jabones defectuosos..9 19.:IXl l l por ciento.8 21.6 25.business/pg022599. p.::.e cuatro fabricantes de jabones: Unilever.5 16.1 22. Aquí se proporcionan algunas de las principales causas de problemas y el número de ellas. 21.6 15. ¡Qué ventajas ofrece la gráfica de tallo y hoja de estas cantidades de ventas sobre el histograma? ¡Cuáles son algunas desventajas? ¡Cuál usaría usted en reuniones de trabajo con personal de producción y por qué? 3. http://www.0 18. Ctrv Sépw"d ..2 14. Construya un histograma que represente estos datos.3 26. fragancia impropia.<0V<r 2000 Family~ Bmndwuk.0 20. vol.8 Construya una gráfica de tallo y hoja con el uso de números enteros como los tallos.3 22.9 18.a gerencia de producción desea conocer cuál es la = = mejor manera en que se distribuyen en todo el año. (Unilever) con 31. p.a pa ~ decir que Procter & Gamble fue rápida tma respuesta al éxito del Lever 2000.7 20.5% y los demás con !'L"ll 1991.1 19.3 17.. Lever Bros. Procter DW y Colgate-Palmolive. pero la demanda no es consy . y "P&G Places Coast Soap Up for Sale". .4 IS. con .5 21. Todos los derechos reservados en el mundo. Ad. ~representa las cantidades más recientes de los "Wm::z.3 15. 1992. observa sobre las participaciones del mercado de las ~ compañías al estudiar las gráficas? En particular.4 23. 32 (21 de agosto de 1995).ive Procter & Gamble Procter & Gamble Unilever Procter & Gamble Procter & Gamble Dial Ventas ($en millones) 271 193 138 121 115 94 93 69 48 44 . 36. Adwrtismg Age. numero 41 (28 de septiembre . l:' Colgate-Palmolive con 6.. Procter & nrias estrategias posibles.8 20.9 32.. Pam Weisz. . las participaciones del mercado de jabón ~ Bros.2 26. The Post.0 25. está Procter & Gamble respecto a años anteriores? ~os que Procter & Gamble vende unos 20 millode iabones por semana.3 18. representan las ventas de jabones por semana en todo un año. p.:¡ks ptx>nes para uso personal en Estados Unidos. incluyendo el repo- _. Con base en sus hallazgos.2 19.2 26.4 20. ¿qué recomendaría usted a la compañia? Causa del problema Superficie del jabón Color Fragancia Etiqueta Forma Sello Etiquetado Consistencia del jabón Frecuencia 89 17 2 32 8 47 5 3 Fuente: adaptado de Valcric Reitman. ¿ Safeguard. ¡Qué ve usted en la gráfica que pudiera ser útil para el personal de producción (y ventas)? 17.1994). Colgate-Palmolive con 8% y los . "$40 M Extends 1..1 %.6 39. Con el n sea de Excel o de MTNITAB.5 17.3 26. Procter & Gamble Dial con 19%. mala consistencia del jabón. superficie estropeada del jabón. vol. lng.ismg Age. Dow Iones & Company.4 20. ~ que el total de "los demás" es de $119 millones. (Unilever) con 24%.2 26. Las siguientes cantidades en ventas.% ~ años. la participación del mercado de jabón fue para G3:nble con 37.-a::a:o por un esfuerzo publicitario que costó $24 milloj:abón tuvo gran éxito y Procter & Gamble vol-=z sa participación en el mercado. trace gráficas de las par~mes del mercado de jabón personal para cada uno .4 23.:zs: Fabricante Unilever Dial Unilever Colgate-Palmol. 65.4 24._:eccmus ventas.2 23. sello defectuoso.7 17. Se prueba la calidad de una muestra aleatoria de jabones terminados y en sus envolturas.1 12. Laurie Freernan. 19 (2 de mayo de 1994).6 24.5 20. 1991 y las últimas cantidades.5%. entre otros.. este producto fue -. p. dadas en millones de jabones. ~os que el estudiante está haciendo un reporte := Procter & Gamble que muestre su participación en el -m:::::adc Junto con la participación de otras compañías ~ ia.CAP!TUW 2 TABLASY GRÁFICAS 43 :. Utilice una gráfica de Pareto para analizar estas causas de problemas. D. 1992. Entre los problemas encontrados están: envoltura inapropiada. 30..6 18.3 23. "P&G Pushes Back •?mSl Unilever in Soap".html. Reimpreso con premiso de The Wall Street Joumal.com. ziio de distribución nacional. luego seleccione Chart del menú descendente. Si desea que Excel automáticamente determine los bins. gráficas de tallo y hoja. Excel puede generar distribuciones de frecuencia e histogramas con el uso de D. leyendas y ubicación de la salida según se desee. Para construir una gráfica de pastel en Excel. En la caja de rango de datos ponga la ubicación de los bins y las frecuencias de la distribución de frecuencia. Estas tablas de columna son en realidad gráficas de barras verticales con espacios entre las clases. gráficas de Pareto y gráficas de dispersión junto con lo necesario para construir una distribución de frecuencias.Chart Output en la parte baja de la caja de diálogo. a las que se tiene acceso mediante el S. dando a la gráfica un titulo. D. polígonos de frecuencia y ojivas con la función Chart Wizard.) en una columna y los valo-· res (frecuencia. el usuario puede construir histogramas. Para construir una ojiva. Excel ofrece la capacidad de producir muchas de las tablas y gráficas presentadas en este capitulo.ata analysis está ubicado en el fondo del menú de despliegue descendente. Los pasos son prácticamente los mismos para la gráfica Line (renglón) que para la gráfica Column. con la que es posible construir una del tipo histograma. determinar qué etiquetas de datos usar.tat. haga clic con el botón derecho del ratón sobre una de las barras de la gráfica. y Excel producirá una gráfica de histograma con una ojiva sobrepuesta en la misma.Chart Aquí se dispone de varias tablas y gráficas. Si el usuario desea especificar los bins.[!ata Analysis. etc. Para tener acceso a Chart Wizard seleccione Insert en la barra de menú. Utilice Bar para un histograma y Connect para un polígono de frecuencias o una ojiva.ata analysis. Con excepción de las gráficas de Pareto. Excel automáticamente determina el número de bins. MINITAB MINITAB tiene la capacidad de construir histogramas.ata analysis. Es posible construir un polígono de frecuencias polígono de frecuencia al seleccionar Line en el Chart Wizard. Existen diferentes opciones en esta caja de diálogo para establecer el número de clases. debe agregarse. Excel se refiere a las distribuciones de frecuencia como histogramas. El usuario tiene la opción de incluir una leyenda. modificar los . Del menú descendente seleccione . Para agregar . polígonos de frecuencia. Bajo Series. entonces haga clic en Labels. Después de hacer clic en OK se obtiene una distribución de frecuencia como salida con bins y frecuencia junto con una gráfica de histograma. Si . que deja al usuario con precisamente los porcentajes acumulativos o una ojiva. ojivas.[!ata analysis no aparece en este menú. seleccione Curnulative Percentage junto con . El usuario tiene la opción de incluir una leyenda. Después de construir una distribución de frecuencia. Ponga la ubicación de los valores sin procesar de datos en Input Range. cargue los datos para cada variable en una columna separada. a todas estas tablas y gráficas se tiene acceso al seleccionar !iraph en la barra de menús.Rin Range. Del menú que aparece. porcentaje. polígonos de frecuencia y ojivas se construyen en el MINITAB con el uso de la opción Histogram del menú descendente !lraph. deje esto en blanco. seleccione Frequency y seleccione l!. inserte la ubicación de columna de los datos sin procesar en el primer renglón bajo !lraph variables de la caja de diálogo Histogram.[!ata display. seleccione Options. ejes. determinar qué etiquetas usar. Si el usuario no especifica bins. Para tener acceso a Ja función D. Las cajas de diálogo de cuatro pasos son prácticamente las mismas que las empleadas para construir gráficas de barras verticales y polígonos de frecuencia. Seleccione Uata analysis del menú descendente Iools y seleccione Histogram de la caja de diálogo . Este agregado o módulo sólo se hace una vez. seleccione FQrmat Data Series. Seleccione Pie de este menú y siga las instrucciones en los cuatro pasos. excepto que en el paso 2 se debe seleccionar la ficha Series.44 ESTADISTICA EN LOS NEGOCIOS USO DE LA COMPUTADORA EXCEL Con el Chart wizard. De la caja de diálogo que aparece. Muchas de las técnicas de este curso se puede realizar en Excel con el uso de una herramienta llamada . Haga clic en OK (aceptar) y Analysis Too!Pak quedará agregado a la capacidad de Iools. Seleccione lnsert de la barra de menú. Si desea especificar los puntos finales de clase. Si desea una ojiva. En la caja de diálogo Add-jns que aparece. llenando la información apropiada. Para calcular la distribución de frecuencia. los datos deben ser acumulados primero cuando la distribución de frecuencia se esté construyendo al hacer clic en Cumulative Percentage en la caja de diálogo Histogram.) en otra columna. Haga clic en OK. En el Chart Wizard es posible modificar los títulos. Seleccione XY (ScatterJ de este menú y siga las instrucciones en los cuatro pasos. cargue las etiquetas (compañia. Para construir una gráfica de dispersión en Excel. La primera se llama Column. Para empezar. En Excel las clases se llaman bins (directorios).[!ata analysis.[!ata analysis. En el espacio junto a Gap IDdth. El Chart W1Z8rdse puede usar entonces para construir la ojiva al seleccionar gráfica Line. haga clic en . persona. si as! lo desea y determinar la ubicación final de la gráfica de dispersión. con Jo cual desaparece la brecha. Seleccione una de las opciones de salida. cargue los puntos finales de clase en una columna. seleccione Iools en la barra de menús de Excel. haga clic en Analysis ToolPak (no Analysis Too!PakVBAJ. luego seleccione Chart del menú descendente. seleccione Iools en la barra de menús.emove. seleccione el tipo de gráfica deseada. Histogramas. Es posible hacer múltiples gráficas al insertar ubicaciones en diversos renglones bajo !lraph variables. gráficas de pastel. y determinar la ubicación final de la gráfica de pastel. etc. En . Seleccione Column.Chart Output. Si desea una gráfica de histograma. Si tiene etiquetas. si as! lo desea. valor en dólares. ponga un cero o reduzca el número a cero. seleccione Add-jns en el menú Iools. y luego avance por las cuatro cajas de diálogo que siguen. Seleccione [nsert de la barra de menús. Para convertir una gráfica de barras verticales en un histograma al eliminar la brecha entre barras. ponga la ubicación de los puntos finales en . Además. Las gráficas de pastel se construyen al seleccionar Pi~ Chart del menú descendente Y. entonces seleccione BY variables in y ponga ahí la ubicación de las etiquetas. En la caja de diálogo Stem-and-leaf . En la caja de diálogo Qata labels. determinar el tipo de intervalos empleados y construir una ojiva. empiece por seleccionar Stat de la barra de menús. La salida contiene tallos y hojas pero además da una cuenta de frecuencia acumulada arriba y abajo del valor medio (que se muestra a la izquierda de la salida). seleccione !l_raph. etc. Si usted desea tener las etiquetas en una columna y los defectos en otra. colores o leyendas. seleccione Cumulative Frequency de la caja de diálogo {}¡!tions.raph. un histograma o para determinar frecuencia para una distribución de frecuencia. puede seleccionar !. escriba la ubicación de los datos y haga clic en OK. Para construir una gráfica de dispersión. dé la ubicación de la columna con todos los defectos que se presentaron. Utilice la opción !..Erequencies) en otra columna. haga clic en Show data labels. Para construir un pollgono de frecuencias. Esta opción agregará frecuencia a la gráfica. Para construir una ojiva. Es posible tener los defectos ya sea por nombre o con algún código. Casi todo lo esencial de una distribución de frecuencia se puede obtener al construir un histograma. se puede construir una distribución de frecuencias. seleccione frequency. Escriba la ubicación de las razones en 1abels y la ubicación de las frecuencias en . por ejemplo para ordenar las rebanadas de pastel. Del menú descendente Quality Tools seleccione fareto Chart. Las gráficas de tallo y boja se construyen al seleccionar Stem-and-leaf . explorar rebanadas.Erequencies. Para obtener una gráfica de dispersión (en lugar de gráfica de línea. Para construir una gráfica de Pareto... seleccione Quality Tools. del menú descendente !l_raph.. luego seleccione flot En la caja de diálogo flot bajo Graph variables.). .hart data in si los valores a usar al construir la gráfica de pastel están en una sola columna. las dos principales opciones son !.hart data in y Cbart table.hart defects data in. En la caja de diálogo Pi~ Chart. seleccione Symbol bajo Display en la porción Data display de la caja de diálogo. Existen otras opciones.CAPITULO2 TABLAS Y GRÁFICAS 45 ejes. etc. Graph 3. ponga la ubicación de la variable y en el primer espacio bajo Y y la ubicación de la variable x en el segundo espacio bajo X Es posible crear múltiples gráficas al llenar los espacios junto a Graph 2. Si tiene datos sin resumir. etc. De la caja de diálogo fareto Chart seleccione Chart defects table si usted tiene un resumen de los defectos con las razones (Labels) en una columna y la frecuencia de ocurrencia (. Utilice la opción Chart table si las categorlas están en una columna y los valores de frecuencia están en otra columna. A partir de estas frecuencia y los puntos finales de clases mostrados en la gráfica. Del menú descendente que aparece. En el espacio que aparece. La caja de diálogo {}¡!tions es especialmente importante para modificar el número de clases. al seleccionar Annotation de la caja de diálogo Histograrn y luego seleccionar Qata labeJs. 2. 46 . desviación estándar y desviación media absoluta en datos no agrupados. moda. desviación estándar y varianza en datos agrupados. Entender el sesgo. mediana. Calcular media. cuartil. percentil. medidas de variabilidad. S. medidas de forma y medidas de asociación. curtosis y gráficas de caja y bigote. 7. moda. Calcular la media. Calcular el coeficiente de correlación e interpretarlo. moda. Distinguir entre medidas de tendencia central. Diferenciar entre muestra y varianza de población y desviación estándar. cuartil. 6. Comprender el significado de desviación estándar como es aplicado al usar la regla empírica y el teorema de Chebyshev. con lo cual el estudiante puede: l. varianza.CAPÍTULO 3 Estadística descriptiva OBJETIVOS DE APRENDIZAJE El capítulo 3 se centra en el uso de técnicas estadísticas para describir datos. Comprender los significados de media. 3. rango. percentil y rango. mediana. 8. 4. con todo. El promedio de ciclo de lavado de una máquina hecha en Estados Unidos es de unos 35 minutos. "In Doing l. 35 mil millones de cargas de lavandería se ejecutan en Estados Unidos cada aiio. Los estadounidenses prefieren máquinas que se cargan desde arriba porque no tienen que inclinarse. determine si existe relación entre el ingreso de esa familia y la cantidad de lavanderfa hecha (en peso). Resuma los datos para que sea posible reportar resultados de este e~tudio. Los siguientes datos son el número de galones empleados por cada lavadora durante el ciclo de lavado. el promedio de máquina lavadora emplea unos 16. se lleva registro del peso de la ropa lavada por cada familia. Los europeos emplean máquinas más pequeñas que se cargan por el frente porque tienen espacios de vivienda más reducidos. Al & AIO. ¡está relacionada de alguna manera con el ingreso familiar? Supongamos que ocho familias de dos adultos y dos niiios se eligen al azar para un estudio. Hoy día. comparado con 90 en Europa. Se toman mediciones de agua en cuanto al número de galones usados por cada lavadora en un ciclo. pp. pero una investigación de esa industria muestra que el resultado es que hay ropa más sucia que en otros países desarrollados. y estas últimas máquinas son más grandes. l. los estadounidenses parecen resistirse a innovaciones de fabricantes de este equipo. La cantidad de lavandería hecha al año en una casa. el promedio de mujeres estadounidenses pasa de siete a nueve horas a la semana en una lavandería.galones de agua. Las estadísticas demuestran que una persona en Estados Unidos genera un cuarto de tonelada de ropa sucia cada año. Supongamos que la desviación estándar de un ciclo de lavado para una máquina de este tipo es de 5 minutos. 47 . 16 de mayo de 2002. en Europa esta cifra es de sólo 4 galones.Wall Srreet fournal. y se averigua su ingreso anual.aundry. Cantidad de lavandería (peso en libras) 1210 875 l 890 1450 Ingreso familiar (en miles de dólares) 42 31 2 040 110 1 330 660 1490 1950 60 68 45 56 72 93 Fuente: adaptado de Emily Nelson. 15 17 16 15 16 17 18 15 14 15 16 16 17 16 15 15 17 14 15 16 16 17 14 15 12 15 16 14 14 16 15 13 16 17 17 15 16 16 16 14 17 16 17 14 16 13 16 15 16 15 2. Cada segundo se inician 1100 cargas. De los siguientes datos de estudio.Estadísticas de lavanderías Según Procter & Gamble.Americans Cling to Outmoded Ways". ¡Dentro de qué rango de tiempo caen la mayor parte de ciclos de lavado de una de estas máquinas? 3. En un periodo de un año. El promedio de ciclo de lavado para una máquina hecha en Estados Unidos es de 35 minutos. Supongamos que se lleva a cabo un estudio de uso de lavanderías en 50 casas en Estados Unidos equipadas con lavadoras y secadoras. En Estados Unidos. Los estadounidenses parecen estar pasando más tiempo lavando de lo que pasaban hace 40 años. Preguntasgerenciales y estadísticas Prácticamente todas las estadísticas citadas aquí se obtienen de estudios o encuestas. Diversas compañías venden versiones nuevas y mejoradas de lavadoras y detergentes y. 00 $28. Del mismo modo. Para un conjunto con un número par de términos.00 19. La tabla 3. la industria del vestido produce camisas.1 talla".Si un conjunto de datos no es exactamente birnodal pero contiene dos valores que son más dominantes que otros.00 19. La organización de los datos en un conjunto ordenado (ordenación de los números de menor a mayor) ayuda a localizar la moda.el precio medio ofrecido y el precio ofrecido que se presenta con más frecuencia. trajes y muchos otros productos de vestido en tallas modales.50 15. algunos investigadores se toman Ja libertad de denominar al conjunto de datos como birnodal incluso sin un empate exacto para la moda.00 28. fabricantes de zapatos podrían producir zapatos de bajo costo en sólo tres anchos: pequeño.00. Para los datos de la tabla 3. Las medidas de tendencia central dan información acerca de la parte central. Precios de oferta para las 20 La moda se puede usar para determinar qué categoría se presenta con más frecuencia. la mediana.00 $11. La moda es una medida apropiada de tendencia central para datos de nivel nominal. las compañías pueden reducir costos totales del producto al limitar costos de preparación de máquinas.00 23. presentamos algunas medidas para datos no agrupados y agrupados.22 15. Moda La moda es el valor que se presenta con más frecuencia en un conjunto de datos. Las medidas de tendencia central no se concentran en el intervalo del conjuntode datos o en qué tan lejos están los valoresdesde los números del centro.00 24.Por ejemplo. vestidos.00 15.25 $19. Para estos datos. El siguientees un conjunto ordenado de valores de la tabla 3.00 7.00 21. el concepto de moda se usa con frecuencia al determinar medidas.00 15. de variabilidady de forma.00 22. Luego entoncesse dice que los datos son bimodales.00 11. En el mundo de los negocios. Este capítulo presenta medidas estadísticas.25 23.1 muestra precios ofrecidospara las 20 ofertas públicas iniciales más grandes en Estados Unidos en un año reciente.25 19. .00 43. la media. Por ejemplo. un histograma.25 Esta agrupación hace más fácil ver que 19. se puede usar una de las estadísticas presentadas para calcular la correlación y relación entre dos variables numéricas. la moda es $19. Por ejemplo. la mediana es el promedio de los dos números de en medio. Los conjuntos de datos con más de dos modas se conocen como multimodales.00 15.00 es el número que se presenta con más frecuencia. percentilesy cuartiles.00 14.Cz 48 ESTADISTICA EN LOS NEGOCIOS El capítuloZ describe técnicas gráficaspara organizar y presentar datos.1 MEDIDAS DE TENDENCIA CENTRAL: DATOS NO AGRUPADOS Un tipo de medida que se utiliza para describir un conjunto de datos es la medida de tendencia central.00 27. En consecuencia.00 25.00 25.1.00 Mediana La mediana es el valor medio de un conjunto ordenado de números.00 34. 7.00 24.00 19.00 27. o media. de un grupo de números. Al reducir el núme. un polígono de frecuenciasy una ojiva.00 21. que incluyen medidas de tendencia central. En el caso de empate para el valor que se presenta con más frecuencia. 3. las medidas de tendencia central pueden dar información como Jo es el promedio de precio ofrecido.00 porque el precio ofrecido que se presentó más veces (4) fue $19. mediano y grande. ro de medidas a unas cuantas medidas modales. seiún Securities Data. Cada medida de ancho representa un ancho modal de pies. la mediana es el número de en medio.00 22. Para un conjunto con un número impar de términos.Aun cuando estas gráficaspermiten que el investigador haga algunas observacionesgenerales acerca de la forma y dispersión de los datos. se hace una lista de dos modas.22 19.00 43.Esta talla es alguna medida modal para hombres de tamaño medio. El cálculo de estas medidas es diferente para datos no agrupados y agrupados. todas las camisas talla M en un lote dado se producen en Ja misma TABLA 3.1. Las medidas de tendencia central presentadas aquí para datos no agrupados son la moda. Además.00 27.00 15.00 34.50 27.00 19.00 19. tratamos de resumir 40 años de porcentajes de desempleo para Francia con una distribución de frecuencias. es posible obtener una comprensión más completa de ellos si se resumen mediante el uso de estadísticas. más grandes ofertas públicas iniciales eri un año reciente $14. Éste es la mediana. se calcula al sumar todos los números y a que la media aritmética tiene tanto uso. $116 000 y $122 000. 15 11 14 3 21 17 22 16 19 16 5 7 19 8 9 20 4 El investigador acomoda los números en un conjunto ordenado.1. Nótese que la que tiene un precio de $5 250 000 no entró en el análisis como no sea para contar como una de las 10 casas. Por ejemplo. Por esta razón. Supongamos que un investigador desea determinar la mediana para los siguientes números. Así. el precio promedio resultante de las 1 O casas originales serla de $635 000. los resultados serían los mismos. Las fórmulas para calcular la media siguen: un grupo de números. o sea el promedio de 19. o sea 15. Acomodar las observaciones en un conjunto ordenado de datos. que un corredor de bienes ralees desea determinar la mediana del precio de venta de JO casas que aparecen con los siguientes precios: $67 000 91 000 95000 $105 000 116 000 122 000 $148 000 167 000 189 000 $5 250 000 La mediana es el promedio de los dos términos medios. hallar el término de en medio del conjunto ordenado.medio.00 y 21. hallar el promedio de los dos términos de en medio.= -. si un conjunto de datos contiene 77 términos.5. el precio ofrecido mediano para las 20 más grandes ofertas públicas iniciales en Estados Unidos es $20. la mediana es el término 39. Una desventaja de la mediana es que no usa toda la información de los números. Esta característica es una ventaja. casi todos los exper- media.= 2 2 2 . Esto es: n + 1 77 + 1 78 -. el experto en estadística determina la mediana al promediar los dos valores de en.00. 14 y 15. la mediana para estos datos se localiza como (20 + 1)/2 o sea el término 10. Media La media aritmética es el promedio de dividirlos entre el total de ellos.= . Para un número par de términos. El valor resultante de mediana es 14. 3 4 5 7 8 9 11 14 15 16 16 17 19 19 20 21 22 Como el conjunto contiene J 7 términos (número impar de términos). El nivel de medida de datos debe ser por lo menos ordinal para que una mediana tenga sentido. Esta ecuación indica que la mediana está situada a la mitad entre los términos 10 y 11. Por ejemplo. Debido a que este conjunto de datos contiene 20 valores o n = 20. La mediana no resulta afectada por la magnitud de los valores extremos. si los precios de todas se promediaran. . Si se eliminara el número 22 'de la lista.).00. la mediana es el número de en medio. Este precio es una representación razonable de los precios de las 10 casas. la información acerca del precio especifico que se pide de la casa más costosa no entra realmente en el cálculo de la mediana. ingreso y edad. No obstante. o sea $119 000. Otra forma de localizar la mediana es hallar el término (n + 1 )/2 en un conjunto ordenado. Para un número impar de términos. PASO 3. Debido tos en estadística la Uaman simplemente La media poblacional se representa x. por ejemplo. 3 4 5 7 8 9 11 14 15 16 16 17 19 19 20 21 Ahora. la mediana es a veces la mejor medida de ubicación a usar en el análisis de variables como son costos de casas. Supongamos. el conjunto tendría sólo 16 términos. Si el precio de la décima casa fuera $200 000.CAPITUW 3 ESTADISTICADESCRIPTIVA 49 PASO l. para un número par de términos. con Ja letra griega mu(µ. La media muestra! se representa con poblacional y Ja media muestra! se dan en los recuadros que . más alto que nueve de los 10 precios originales. Este promedio es la mediana. Considere los datos de precio ofrecido en la tabla 3. terrruno 39 Esta fórmula es útil cuando deba manipularse un gran número de términos.5. porque valores grandes y pequei\os no influyen en forma desproporcionada en la mediana. PASO 2. Debido a que poblaciones y muestras son importantes en estadística. El algoritmo para calcular una media es sumar todos los números de la población o muestra y dividir entre el número de términos. 26 y 11 trabajadores cada una. No obstante. según Auto Renta/ News.6 11 5 El cálculo de una media muestra! utiliza el mismo algoritmo que para una media poblacional y producirá la misma respuesta si se calcula con los mismos datos. El número de trabajadores de la media poblacional en cada departamento es 18. para los fines de este texto: N Ex denota l:x.=--r=J N Sin embargo. es incorrecto calcular una media muestra! para una población o una media poblacional para una muestra. i=I Es incorrecto usar la media para analizar datos que no sean por lo menos del nivel de intervalo en una medición. ff .50 ESTADISTICA EN LOS NEGOCIOS MEDIA POBLACIONAL 1 MEDIA . PROBLEMA DE DEMOSTRACIÓN 3. N es el número de términos de la población 11 es el número de términos de la muestra. En el CD~ROM se incluye una explicación más detallada. µ. 24 13 19 Ex= y 26 ll 93 Ex 93 µ=-=-=18.) se utiliza por lo común en matemáticas para representar una suma de todos los números de una agrupación.6trabajadores. 13.1 A continuación aparece el número de autos en servicio en las principales compañías de renta de autos de Estados Unidos en un año reciente. 19. es necesario el uso de un slmbolo por separado para la media poblacional y para la media muestra!. MUESTRAL 1 11 11 La letra sigma mayúscula griega (I. Supongamos que una compañía tiene cinco departamentos con 24. Una definición más formal de la media es: N ¿x. Compañía Enterprise Hertz ANC Rental Group Avis Budget Dollar Thrifty U-Save Toyota Rent-a-Wreck Advantage Payless ACE Número da autos en servicio 460 000 350 000 322 000 220 000 146 000 78 000 51 000 15 000 12 000 12 000 12 000 B 000 8 000 • La matemática de las sumas no se estudia aqui. A continuación veamos el cálculo." De igual modo. 7 13 n La media es afectada por todos y cada uno de los valores. que es la mediana. Pasos para determinar la ubicación de un percentil l.1 1 1 percentil 86 1 • percentil 87 .=Ex= 1694000=130 307. porque valores extremadamente grandes o pequeños pueden dirigir la media hacia el valor extremo.CAPITULO 3 ESTADISTICA DESCRIPTI\">. Los percentiles son valores en escalón. el percentil 87 es un valor tal que al menos 87% de los datos están abajo del valor y no más de 13% están arriba del valor. También es una desventaja.!Jl .¡¡¡ijiiiiiiii~-... Organizar los números en un conjunto de orden ascendente.. él o ella todavía califican con sólo el percentil 87. Los percentiles se utilizan ampliamente para reportar resultados de pruebas.!:_(n) 100 donde: P = el percentil de interés i = ubicación de percentil n = número del conjunto de datos lj@'l.. La media es la medida de ubicación más comúnmente empleada porque utiliza cada renglón de datos en su cálculo. la mediana y la media. porque se requiere de 99 divisores para separar un grupo de datos en 100 partes. 2. como se ve en la figura 3. que es una ventaja. los resultados de estos exámenes se reportan en forma de percentil y también como calificaciones sin procesar. Calcular la ubicación del percentil (í) con: i=. Recuerde el análisis precedente de los precios de 1 O casas. En la mayor parte de los casos.1.6% de las calificaciones del examen de seguridad están abajo de la calificación de esa persona. el precio medio es más alto que nueve de las casas porque la de $5 250 000 está incluido en el cálculo. 51 Calcule la moda. el séptimo término es 51 000. n = 13.n) por ciento están arriba de ese valor. GRE o GMAT. Casi todos los estudiantes de facultades o universidad han tomado el examen SAT. El precio total de las 10 casas es $6 350 000 y el precio medio es $635 000. aun cuando más de 87% de las calificaciones son menores. Hay 99 percentiles. Solucl6n Moda: Mediana: Media: 12 000 Con 13 diferentes compañías en este grupo. porque el percentil 87 y el percentil 88 no tienen percentil entre ellos. Percentiles Los percentiles son medidas de tendencia central que dividen tm grupo de datos en 100 partes. A continuación se muestra un resumen de los pasos empleados para determinar la ubicación de un percentil. la mediana está situada en la posición (13 + 1)/2 = 7a. Si el operador de una planta toma un examen de seguridad y 87.pe:r:c. El número total de autos en servicio es 1 694 000 = Ix µ. Como los datos ya están ordenados.:n:t~ils·8. Percentiles en escalera 1-----------------------Íl. Específicamente. Si la media se calcula para las 1 O casas. La media utiliza todos los datos y cada renglón de ellos influye en la media. El n-ésimo percentil es el valor tal que al menos 11 por ciento de los datos están bajo ese valor y a lo sumo (100 . es una medida conocida y tiene propiedades matemáticas que la hacen atractiva para usarla en análisis estadístico inferencial. ACT. El tercer valor es 13. 19. La parte del número entero de 3. 106 109 114 116 121 122 O@i1¡tt1. 12. o más bajo. j = ~(1240) = 992 100 Como i = 992 es un número entero.4 100 Como i no es un número entero. 03. p _ (992 número 80 - PROBLEMA DE DEMOSTRACIÓN 3. 02 y 03• El primer cuartil..2. de modo que n Primero. separa el segundo cuarto de los datos del tercer cuarto. supongamos que el estudiante desea determinar el percentil 80 de 1240 miembros. 02 y Q3 para los siguientes números. 19 23 = 8 y P = 30. Los tres cuartiles están denotados como 01. de modo que 13 es el percentil 30. Si i es un número entero. Cuartiles primer un cuarto primeros dos cuartos primeros tres cuartos 125 129 . P es 80 y n es 1240. Primero. o sea 3.4 es 3. El valor de i + 1 es 2. divide los primeros tres cuartos de los datos del último cuarto y es igual al valor del percentil 75. organizamos los datos en orden ascendente: 5 12 13 14 17 A continuación. El segundo cuartil. 02 está ubicado en el percentil 50 y es igual a la mediana de los datos.4 + 1. a. A continuación. el valor del P-ésimo percentil está ubicado en la parte del número entero i + l. El percentil 80 es el promedio del número 992 y el número 993. ordene los números de menor a mayor. calcule la ubicación del percentil 80. calculamos el valor de i. Suponga que desearnos determinar los valores de 01. debe usarse el paso 3(b). 23. 28 i=~(8)=2. cuarto de los datos de los tres cuartos más altos y es igual al percentil 25. 13. Determine la ubicación de (a) o de (b).4.2 + 993 2 número) Determine el percentil 30 de los siguientes ocho números: 14. Estos tres cuartiles se muestran en la figura 3. 02.52 ESTADISTICA EN LOS NEGOCIOS 3. deseamos hallar el valor del percentil 30. 28. siga las instrucciones del paso 3(a). Por ejemplo. b. el P-ésimo percentil es el promedio del valor en la i-ésima ubicación y el valor en la (i + !)•va ubicación. Nótese que un percentil puede o no puede ser uno de los valores de datos. 5. 01. Cuartiles Los cuartiles son medidas de tendencia central que dividen un grupo de datos en cuatro subgrupos o partes. separa el primer. El tercer cuartil. 17: Soluci6n Para estos ocho números. Si i no es un número entero. El percentil 30 está ubicado en el tercer valor. 5. la mediana es el promedio de los dos términos de en medio. de los valores (106 y 109) son menores a 1115. Q2 =mediana= (1 l6+121) 118. Determine el primero. según Advertising Age. Organizeción publicitllri• Oficln• matriz Ingreso bruto en el mundo (Smillonff) WPP Group lnterpublic Group of Cos.5 2 Nótese que exactamente la mitad de los términos son menores a Q2 y la mitad son mayores a Q2• El valor de Q3 se determina con P75 como sigue: i=~(8)=6 100 Como i es número entero.5 2 El valor de Q3 es P75 = 123. Como el conjunto contiene un número par de términos. P75 es el promedio de los números sexto y séptimo. Nótese que un cuarto. (109+ 114) = 111. o dos. de los valores son menores a 123.5.3 Lo siguiente muestra ingresos de las principales organizaciones de publicidad del mundo. P25. con: paran =B.5. Pis se encuentra como el promedio de los números segundo y tercero.CAPITULO 3 ESTADISTICA DESCRIPTIVA 53 El valor de Q1 se encuentra en el percentil 25. 01 = P25 se encuentra con: i=~(16)= 100 4 . o seis. PROBLEMA DE DEMOSTRACIÓN 3. El valor de Q2 es igual a la mediana. i=~(8)=2 100 Como i es un número entero. F¡5 = (122+125) 123. segundo y tercer cuartiles para estos datos. Nótese que tres cuartos. n = 16.5 y dos de los valores son mayores a 123.5 2 El valor de Q1 es Pis= 111. Omnicom Group Publicis Communication Dentsu Havas Adversiting Grey Adversiting Cordination Communications Group Hakuhodo Asatsu TMP Worldwide Carlson Marketing Group lncepta Group OigitasA Tokyu Agency Daiko Adversiting Londres Nueva York Nueva York París Tokio París Nueva York Londres Tokio Tokio Nueva York Minneápolis Londres Boston Tokio Tokio 8 165 7 981 7 404 4 770 2796 2733 1 864 1 175 874 396 359 356 248 236 204 203 Solución Para 16 organizaciones publicitarias. 7 167 Calcular la media para los siguientes números: 7 3.8 243 444 524 199 682 44. reportados por AutoFacts. Q2 y Q3 para los siguientes datos: 16 3.4 345 3. Determine el percentil 29 para los datos.2 Determinar la mediana para los números del problema 3. Calcular la media y mediana. el percentil 55. unidad de Coopers & Lybrand Consulting. 02=874+1175=1 024.1 Determine 2 4 la moda para los siguientes números: 8 4 6 2 7 8 4 3 8 9 4 3 3.0 52. . la mediana es el promedio de los términos octavo y noveno.5 2 ~ = P75 se resuelve con: r=~(16l=12 100 ~se encuentra al promediar los términos doceavo y treceavo. P83. con 16 términos. Q1.1 770 3 783 PROBLEMAS 3. P47. 3.8 38.3 3.8 30. Q¡.6 40. 01 es el promedio de los valores cuarto y quinto desde abajo.5 609 5 28 29 13 17 20 11 34 32 27 25 30 19 18 33 Calcular P20.54 ESTADISTICA EN LOS NEGOCIOS Como i es número entero. o3-.1 78.1.3 Determinar la mediana para los siguientes números: 213 3.6 073 Calcular la media para los siguientes números: 17.5 31. = 248 + 356 2 01 302 02 = P50 = mediana.5 -2 5 o 9 -3 -6 -7 -4 -5 2 -8 Calcular el percentil 35.2 796+4 2 3. ¿Cuál de estas medidas es la más apropiada para resumir los datos y por qué? ¿Cuál es el valor de Q2? Determine el percentil 63 para los datos. Q2 y Q3 para los siguientes datos: 120 138 97 118 172 144 138 107 94 119 139 145 162 127 112 150 143 80 105 116 142 128 116 171 Los siguientes datos muestran el número de autos y camiones ligeros en un año reciente entre los principales fabricantes de autos en el mundo. Con estos datos. La mediana da información acerca de las ventas de la persona del medio. Calcular la mediana. Con el uso de medidas de variabilidad en conjunción con medidas de tendencia central es posible obtener una descripción numérica más completa de los datos.-mde $5 millones al año y otra sólo $150 000 al año? Las medidas de variabilidad proporcionan la información adicional necesaria para contestar esa pregunta. con una persona qne .l estas personas es de $1. Estas herramientas son medidas de variabilidad. P35. calcular la media. Morgan Chase (Nueva York) UBS (Zurich) HSBC Holdings (Londres) BHV AG (Munich) BNP-SG-Paribas(París) BankAmerica (Charlorte) ING NV (Amsterdam) 902 873 721 715 674 673 654 652 642 613 3. según la Air Transportation Association of America. ¿Cuál es el valor del tercer cuartil? Determine P11. . P.10 La siguiente es una lista del número de accidentes mortales por aerolínea comercial de vuelos regulares en un periodo de 17 años. una compañía tiene 25 vendedores en el campo y la mediana anual de Ymtb ?4r. Pss Y P61· 4 4 4 4 2 4 3 8 6 4 4 4 2 3 3 3.CAPITUlo3 Pabricante 55 Producción (en miles) General Motors Ford Motors Toyota Volkswagen Chrysler Nissan Honda Fiat Peugeot Renault Mitsubishi Hyundai BMW Daimler-Benz Daewoo 3_9 ESTADISTICA DESCRIPTIVA 7 880 6 359 4 580 4161 2 968 2646 2 436 2 264 1 767 1 567 1 535 1 434 1 341 1 227 898 La siguiente es una lista de los principales bancos del mundo clasificados por activos según American Banker. ¿Tienen o no tienen éxito estos vendedores como grup:Y. que describa: la 1füpersión de un conjunto de datos. investigadores de negocios pueden usar otro grupo de herramientas anahticas para describir un conjunto de datos.2 millones anualmente o varían mucho estas cifras. Pso y P93. No obstante.2 millones. pero ¿qué hav de !0$ ouos ftnciedcres~ ¿Todos venden $1. Activos (miles de millones de dólares) Banco Citigroup (Nueva York) Deutsche Bank (Frankfort) Bank of Tokio-Mitsubishi J. P20• P60.2 MEDIDAS DE VARIABILIDAD: DATOS NO AGRUPADOS Las medidas de tendencia central dan información acerca de puntos particulares de un conjunto de datos. la mediana y la moda. Por ejemplo. Q3. el rango intercuartil se utiliza en la construcción de gráficas de caja y bigote. Es una medida burda de variabilidad que describe la distancia a los límites exteriores del conjunto de datos.25 . rango intercuartil. El precio más bajo de oferta es de $7.1 .8 17. RANGO INTERCUARTII. valor de Z y coeficiente de variación.S 36. Exportaciones País Canadá México Japón Reino Unido Corea del Sur Alemania Taiwán Países Bajos Singapur Francia Brasil Hong Kong Bélgica China Australia ($miles de millones) $151. La observación de estas distribuciones muestra que una medida de variabilidad es necesaria para complementar el valor medio al describir los datos.$7.Q1• El rango intercuartil es especialmente útil en situaciones donde los usuarios de datos están más interesados en valores hacia el medio y menos interesados en los extremos. Los métodos de las medidas de variabilidad de cálculo difieren para datos no agrupados y agrupados.8 71.1 13. según la U. es el rango de 50% central de los datos y se determina al calcular el valor de <2J . Census Bureau. su aplicación como medida de variabilidad es limitada.7 16.9 12. Los siguientes datos indican los 15 principales socios de Estados Unidos por exportaciones de ese país a otros países en un año reciente.4 12. Un uso importante del rango es en aseguramiento de la calidad.0 24. Al describir un mercado de viviendas. Rango El rango es la diferencia entre el valor más grande de un conjunto de datos y el valor más pequeño. varianza. desviación estándar. Aun cuando por lo general es un solo valor numérico. más grande).S 20. éstos son afectados por los valores extremos. como se calcula con los valores que están en los extremos de los datos. Una ventaja del rango es su facilidad de cálculo.00 = $36. El rango de los precios ofrecidos se puede calcular como la diferencia de los valores más alto y más bajo: Rango = Más alto .00 y el más alto de $43.1 representan los precios ofrecidos para las 20 principales ofertas públicas inicialesde Estados Unidos en un año reciente. Además. los corredores de bienes raíces podrían usar el rango intercuartil como medida de precios de viviendas cuando describan la mitad media del mercado a compradores interesados en casas con valoresde rango medios.9 15.4 65.El rango intercuartil es el rango de valores entre el primero y tercer cuartiles.25. desviación media absoluta.0 15. donde el rango se emplea para construir gráficas de control. Por tanto.3 muestra estas tres distribuciones en las que la media de cada distribución es la misma (µ. Reflejaesos valores extremos porque se construye a partir de ellos.4 19.56 ESTADISTICA EN WS NEGOCIOS La figura 3.S.4 25.25 Rango intercuartil Otra medida de variabilidad es el rango intercuartil. En esencia. algunos investigadoresde negocios definen el rango como el par ordenado de números más grande y más pequeño (más pequeño. Los datos del la tabla 3.Más bajo = $43. Esta sección se concentra en siete medidas de variabilidad para datos no agrupados: rango. Una desventaja del rango es que. = SO) pero las variabilidadesdifieren. en productividad y calidad de trabajo. entonces P25 es el cuarto término desde abajo. Los teletrabajadores están relativamente satisfechos con su trabajo. La mayoría de ellos trabajan en impuestos {IT). Se estima que empicados que trabajan a dístaDcia pueden ahorrar a sus empleadores un promedio de SIO cada uno al disminuir el ausentismo y cansen-ar más txm po el trabajo.te. se encuentra que P75 es el término 12 desde abajo. 7..1 Al despejar Q3 = P75: i=~(l5)=11..3 El 50% medio de exportaciones de los 15 principales socios comerciales de Estados Unidos abarca un rango de 21. trabajan uno o dos dlas por semana fuera de casa..75 100 Como i no es un número entero.ijll"fjliJ+Ii!. adaptado de YouCanWorkfromAn)~ a>m .t. tiene entre 35 y 44 años de edad. es hombre. por lo general.htm.. = 50 ¡Cuál es el rango intercuartil para estos datos? El proceso empieza al calcular los cuartiles primero y tercero como sigue: Despejando Q1 = P25 cuando n = 15: 25 .25 100 Como i no es un número entero.. _ Estaclfsticasde telecomunicaciones Un estudio realizado .worhr rolummsul!OC ~h!ml. Jid.c~m/nct. disminución de costos en bienes ralees y que el trabajo se con sen-a por máS tiempo. . viajan en automóvil unas 18 millas al trabajo y ahorran casi 53 minutos de tiempo de viaje cada día de trabajo hábil en que laboran a distancia. El rango intercuartil es: Q3 .il·li!!.comñnfoccntcrrfacts.. . es casado y gana por lo menos $40 mil al año. ycwfa.!(ii[!. 21.. El teletrabajador típico vive en el Oeste o el Noreste. AT&T ahorra $3 mil anualmente por trXa3bajador y $25 millones al año en costos de bienes r2icrS por empleados que son de tiempo completo. Se estima que 30 millones de teletrabajadores estarán laborando en Estados Unidos para finales de 2004.. ~ Dcbunk Telework Mvths~ Na... De éstos. pero que sus trabajos interfieren menos con sus vidas personales. bienes ralees o administración de empresas..15. . Ioni Kislntt "A=w! Sar...SOUl"Il\ \ 5"i Tres distribuciones con la misma media pero diferentes dispersiones. Dos tercios de teletrabajadores expresaron más satisfacción en su trabajo y dicen que lo hacen más horas que quienes no trabajan a distancia. l\\rrm :!9 do< oad!re do< _ 1 m http://www.7% trabajan fuera de sus casas. Los costos de bienes raíces se pueden reduru de 25 a 90%.5% trabaja en centros de trabajo a distancia y 4. El ingreso medio para teletrabajadores es de S44 mil..2% trabajan en oficinas por satélite.nwfusion.Q¡ = 36. Los teletrabajadores.4 . Más de 40% de estas personas trabajan en más de un lugar.. i=-(15)=3. Setenta y cinco por ciento de quienes traba- jan en casa reportaron un ingreso cuantificable.CAPITULO 3 ESTADISTICA DE. Q¡ = P2s = 15.I = 21. 24.... cuando cambiaron de trabajos tradicionales en oficinas a trabajar a distancia..por Telework America patrocinado por AT&T en 2001 reveló que 28 millones de estadounidenses trabajan por computadora a distancia (teletrabajo). µ.. En promedio.1% trabajan de viaje. tiene educación universitaria.3 ($miles de millones) . Trabajar a distancia puede ahorrar costos para las empresas debido a que no hay ausentismo.. µ. No obstante. la desviación estándar y la desviación media absoluta. La tabla 3. respectivamente. Nótese que algunas desviaciones respecto a la media son positivas y algunas son negativas. varianza y desviación estándar Otras tres medidas de variabilidad son la varianza. el propietario podrla calcular una media. el total de estas desviaciones es cero. Supongamos que una pequeña empresa inició una línea de ensamble para fabricar computadoras.4. lo importante de la varianza y la desviación estándar está principalmente en su papel como herramientas empleadas junto con otros procedimientos estadísticos. ¡Qué estadística descriptiva podrla usar el propietario para medir el primer avance de producción? En un intento por resumir estas cantidades.r 58 ESTADISTICA EN LOS NEGOCIOS Desviación media absoluta.fa) Nthncro(x) Desviaciones de· la media para producción de computadoras l:x = s 5-13 = -8 9 9-13 = -4 16 16-13•+3 17 17-13 = +4 18-13=+5 1! I. 16. X 5 9 16 17 18 Ex=65 Ex 65 tt=-¡¡=5=13 ¡Cuál es la variabilidad en estas cinco semanas de datos? Una forma en la que el propietario comience a ver la dispersión de los datos es restando la media de cada uno de los datos. Este fenómeno se aplica a todos los casos. 16 17 18 . las desviaciones se utilizan casi siempre como herramienta para calcular otras medidas de variabilidad. Estas medidas no tienen sentido a menos que los datos sean por lo menos de nivel de intervalo. se presentan juntas.2 Dlrrild6eele la media (X .(x.2) -4 5 9 ~ 13 µ. Durante las primeras cinco semanas de trabajo. T~BLA 3. Se obtienen por medio de procesos similares y. Restar la media a cada valor de datos da la desviación respecto a la media (x . La varianza y desviación estándar se utilizan ampliamente en estadística. Un examen de desviaciones respecto a la media puede revelar información sobre la variabilidad de datos.2 muestra estas desviaciones para la producción de computadoras. Nótese que en la tabla 3.µ)=O 65 -8 Distancias geométricas desde la media (de la tabla 3. Aun cuando la desviación estándar tiene un potencial independiente.2 y en la figura 3. la suma de todas las desviaciones respecto a la media aritmética es siempre cero. 17 y 18 computadoras. La figura 3. Para un conjunto de datos dado.4 muestra que geométricamente estas desviaciones negativas representan valores que están abajo (a la izquierda) de la media y las desviaciones positivas representan valores que están arriba (a la derecha) de la media. por tanto. 19.). la producción es 5. Varianza Como los valores absolutos no conducen a una manipulación fácil. con lo cual es posible despejar la desviación media absoluta. 1 VARIANZA POBLACIONAL 2 E(x-¡1)2 u=---- N La tabla 3. este valor es 130. u2 TABLA 3. las desviaciones desde la media y el cuadrado de desviaciones desde la media. No obstante.. en el campo de pronósticos. Para la compañía de computadoras.8 =~= 5 26.2. una importante medida de variabilidad. Este método utiliza el cuadrado de las desviaciones a partir de la media. La desviación media absoluta para los datos de producción de computadoras es 4.8.µI N Con el uso de los datos de la tabla 3.4 muestra los números de producción original para la compañía de computadoras. Desviación media absoluta i La desviación media absoluta (MAD) es el promedio de los valores absol11tos de las desviaciones alrededor de la media para un conjunto de números.CAPITULO 3 ESTADISTICA DESCRIPTI\ LA SUMA DE DESVIACIONES RESPECTO A LA MEDIA ARITMETICA ES SIEMPRE CERO I(x- 59 µ)=o Esta propiedad exige considerar los modos alternativos para obtener medidas de variabilidad.tiene amplio uso en estadfstica. La varianza es el promedio del cuadrado de desviaciones alrededor de la media aritmética para un conjunto de números.0 . Debido a que se calcula con el uso de valores absolutos.3. la desviación media absoluta es menos útil en estadística que otras medidas de dispersión.65 I(x - µ) = o MAD = ~= n +4 Ijx24 5 µj = 24 = 4. Al dividirlo entre el número de valores de datos (5 semanas) se obtiene la varianza para la producción de computadoras. se usa ocasionalmente como medida de error. La varianza de población está denotada por u2.3 Desviación de media absoluta (MAD) para datos de producción de computadoras j%-I'! %-p. como se muestra en la tabla 3. el propietario de la compañia de computadoras puede calcular una desviación media absoluta al tomar los valores absolutos de las desviaciones y prornediarlos. expertos en matemáticas crearon un mecanismo alternativo para superar la propiedad de sumacero de desviaciones desde la media. DESVIACIÓN MEDIA ABSOLUTA MAD = Elx . s +8 9 -8 -4 16 +3 +3 17 +4 +4 !§ +S +5 l:x . Una forma obvia para forzar la suma de desviaciones para que tenga un total diferente de cero es tomar el valor absoluto de cada desviación alrededor de la media.. El resultado es la varianza. La sama del cuadradode las desviaciones alrededor de la media de un conjunto de valores -Ilamada suma de cuadrados de x y a veces abreviada como SS. µ)2 = 130 SSx-= !(x./N) y tomar la raif cuadrada de ese promedio.4 muestra la desviación estándar para la compañia que produce computadoras: v'26 o 5.4 Cálculo de la varianza y la desviación estándar de los datos de producción de computadoras X s 9 16 17 !! I. el resultado final se expre Es problemático interpretar la estadística con medí das en unidades cuadradas.1? El significado de desviación estándar se entiende más fácilmente por su uso. la desviación estándar utiliza la suma del cuadrado de desviaciones alrededor de la media (SSxl· Se calcula al promediar este cuadrado de desviaciones (SS. distinguirlas es importante porque ambas tienen amplio uso en estadística. La desviación estándar poblacional se denota con u. es posible entender la noción del concepto de desviación estándar al ver la manera en que se aplica.µ)2 = 130 varianza=u2=ss" =!(x-µ)2 =~=26. de desviaciones. mientras que la varianza se expresa en el cuadrado de esas unidades. considere.60 ESfADISTICA EN LOS NEGOCIOS Debido sa en términos a que la varianza de unidades se calcula desde el cuadrado de medida cuadradas. que se explora en la siguiente sección.x = 65 " --8" lx. Significado de desviación estándar ¿Qué es una desviación estándar? ¿Qué hace y qué significa lo que hace? La manera más precisa de definir una desviación estándar es al detallar la fórmula empleada para calcularla. Se utiliza como entidad separada v como parte de otros análisis. l. a Mattel Toys tratando de interpretar costos de producción en términos de dólares al cuadrado o medir la variación de producción de Troy-Bilt en términos del cuadrado de podadoras de pasto.1. Desviación estándar La desviación estándar es la una medida de variabilidad preferida. TABLA 3."' 64 -4 +3 +4 +5 !(x. por ejemplo para calcular intervalos de confianza y en pruebas de hipótesis (véanse los capítulos 8.0 N N 5 . Al igual que la varianza. por ejemplo. Cuando la desviación estándar y la varianza están estrechamente relacionadas y se pueden calcular entre si. La tabla 3. Por tanto. Una característica de la desviación estándar que la distingue de una varianza es que la desviación estándar se expresa en las mismas unidades que los datos sin procesar. varianza puede ser considerada como un cálculo intermedio en el proceso de obtener la desviación estándar muestral. ¿Qué significa la desviación estándar de 5. Dos modos de aplicar la desviación estándar son la regla empirica y el teorema de Chebysbev. DESVIACIÓN ESTÁNDAR POBLACIONAL a=~E(x~µ)z La desviación estándar es la raíz cuadrada de la varianza. Con todo. cuando se usa como medida descriptiva.µ)=O 16 9 16 ~ !(x . 9 y 10). .-=ieg1a empírica :iara una y dos iJeSViaciones estándar de precios oe gasolina CAPtruW 3 ESTADISTICA t>ESCKJPin:\ 61 68% -la +la Sl.50.08 y estuvieron norrnalmente distribuidos.66 (µ.42 :!: 2($0. también en el capitulo 6 se estudia con mayor detalle la distribución normal. como observa en la figura 3. REGIA EMPlR. o sea= $1.16 y $1. 95% están dentro de dos de5'713ciones estándar.16. Según la regla empírica.42 µ.SA.JCA Distancia desde la media µ:!::la µ :!:: 20' µ :!:: 30' Valores dentro de la distancia 68% 95% 99. para California. la regla empírica se aplica en muchas situaciones y se usa ampliamente. :!: 3u).58. Nótese que 68% de los precios de gasolina caen dentro de una desviación estándar~ de la media.34 Sl.08 $1. o tiene forma de campana. Alrededor de 95% debería caer dentro deµ.=$1. y casi 100% están dentro de tres desviaciones estándar.42 u =S0.=$1. Normalmente. La regla emp[rica se usa sólo para tres veces la desviación estándar: lo.# )dmerían caer entre $1. ~::'. o $1.34 y más o menos 169& de los precios deben ser mayores a $1. alrededor de 68% de los precios deber[an caer dentro deµ 1:. Supongamos también que los precios de gasolina regular variaron en el estado con una desviación estándar de $0. En el capítulo 6 se presenta un análisis detallado de otros números de valores cr.42 :!: 1($0. alrededor de 16% de los precios de gasolina deben ser menores a $1.58.26 $1.34 y $1.50 µ. El requisito de que los datos estén normalmente distribuidos tiene alguna tolerancia y la regla empírica por lo general aplica mientras los datos tengan forma aproximada de montículo. Supongamos que un informe reciente expresa que.08).42.08) = $1. distribución simétrica unimodal que tiene forma de campana (o montlculo).08 B A Regla empírica La regla empírica es una importante regla práctica que se usa para expresar el porcentaje aproximado que está dentro de un número dado de desviaciones estándar desde la media de un conjunto de datos.onco. por tanto.50.42 a =$0. de los valores de datos están dentro de una desviación estándar de la media. Casi todos los precios de gasolina regular (99. cerca de 68'!1. Si un conjunto de datos está normalmente distribuido. ~ la mayorfa de las características humanas como son la estatura y el peso. Como la distribución normal es símEtria. el precio promedio a nivel $atal de un galón de gasolina de tipo regular es de $1. si los datos están distribuidos normalmente. puede dividirse a la mitad de la moda que 16% se encuentre en cada cola de la <furriboción.42 $1. = = . Con base en la suposición de que los datos están aproximadamente distribuidos de manera aproximada. Más o menos 68% de los precios estarían entre $1. :!: 20' o $1.42 S0. Ezr. numerosos fenómenos están distribuidos en forma de campana..7% . alrededor de 32% están fuera de este rango.26 y $1. como se ve en b ~ 3. 20' y 30'. 5)2 = 0. Así. La figura 3. Según ésta.7% para la regla empírica. Aplicación del teorema de Chebyshev 'para dos desviaciones estándar µ. cerca de 16% debería estar arriba deµ. el teorema de Chebyshev dice que al menos 75% de todos los valores están dentro de ::!:2a de la media. ::!: ka.3(294)= 1365 . no todas las válvulas producidas tienen un peso exacto de 1365 gramos.l/k2 = J .882 = 483.lfk2 valores caerán dentro de ::!:k desviaciones estándar de la media. Debido a que la distribución normal es simétrica. Por ejemplo.5a.84. ::!: 2a._!_ v proporción de valores. Aun cuando el teorema de Chebyshev puede en teoría aplicarse a datos que están normalmente distribuidos. . ¿Dentro de qué rango caerían alrededor de 95% de los pesos de válvulas? Aproximadamente 16% de los pesos ¿serían mayores que cuál valor? Aproximadamente 0.75. casi 95% deberían caer entre 777 y 1953. sino que más bien se presenta en formato de fórmula y. debería estar abajo deµ.1/(2.± 2u = 1365 ± 2(294)= 1365 ± 588.r 62 ESTADISTICA EN LOS NEGOCIOS PROBLEMA DE DEMOSTRACIÓN 3. Aproximadamente 68% de los pesos deberían caer dentro deµ. cualquiera que sea la forma de una distribución. aplica la regla empírica. el porcentaje de valores dentro de tres desviaciones estándar de la media es por lo menos 89%. Teorema de Chebyshev La regla empírica aplica sólo cuando se sabe que los datos están normalmente distribuidos de manera aproximada. De hecho.1/22 = 3/4 = . es decir. En contraste. por tanto. De acuerdo con el teorema de Chebyshev. existe por lo menos: 1 .84 de todos los valores están dentro deµ. El teorema de Chebyshev no es una regla práctica.4 Una compañía produce una válvula ligera que está especificada para pesar 1365 gramos. . µ. se puede usar cualquier valor de k mayor a 1 (k > 1). ¿Qué utilizan los investigadores cuando los datos no están normalmente distribuidos o la forma de la distribución es desconocida? El teorema de Chebyshev aplica a todas las distribuciones cualquiera que sea su forma y por tanto se puede usar siempre que la forma de la distribución de datos sea desconocida o sea anormal. se puede aplicar con más amplitud. los pesos de las válvulas producidas están normalmente distribuidos con un peso medio de 1365 gramos y una desviación estándar de 294 gramos. 0.± 3u y 0.± 1u =1365 + 294 = 1659. El teorema de Chebyshcv expresa que por menos 1 .::!: 2.15%. como es la regla empírica. si k = 2.6 da una ilustración gráfica. la regla empírica es más conocida y se prefiere siempre que sea apropiado. la regla empírica expresa que si los datos están normalmente distribuidos 95% de todos los valores están dentro deµ. porque 1 .3u = 1365 . debido a imperfecciones en el proceso de manufactura.15% de los pesos ¿serían menores a qué valor? Soluci6n Debido a que los pesos de las válvulas están normalmente distribuidos. en contraste con 99. al menos 0. porque si k = 2 entonces 1 lfk2 = 1 . La mitad de esto último. TEOREMA DE CHEBYSHEV Dentro de k desviaciones estándar de la media. cualquiera que sea la forma de la distribución.3% deberían caer fuera de este intervalo.7% de los pesos deberían caer dentro deµ.5. Por desgracia.± 1uy 32% debería caerfuera de este intervalo. casi 95% de los pesos caerían dentro deµ. Como se usa una fórmula para calcular proporciones con el teorema de Chebyshev. Casi 99. Suposición: k > 1 Específicamente. 9 años.1/k2 de los valores está dentro de µ ± ka. Aplique el teorema de Chebyshev para determinar dentro de qué rango de edades caería al menos 85% de las edades de trabajadores. Solución Como las edades no están normalmente distribuidas. una de las propiedades de un buen estimador es ser no sesga¡io.5 63 En la industria de la computación.58ude la media. Para µ = 28 y u = 5.85 de los valores están dentro de ±2. según reporta el Pubtu: . Como 85% de los valores están dentro de este rango.9 años de edad o entre 15. La varianza muestra! y la desviación estándar muestra! utilizan n . porque usar n en el denominador de la varianza muestra! resulta una estadística que tiende a subestimar la varianza de población. que es una propiedad deseable en estadística inferencia!. Empresa PriccWaterhouse McGladrey & Pullcn Dcloitte & Touche Andcrscn Worlwide Coopers & Lybrand 800 Seidrnan Número de socios 1062 381 1 719 1673 1 277 217 La varianza muestra! y desviación estándar muestrales se pueden calcular cae: . no es correcto aplicar la regla empírica y por tanto el teorema de Chebyshev debe aplicarse para contestar la pregunta. sea: 1 1 -1(2 = . usar n .1 y 40. El principal uso para varianzas rnuestrales y desviaciones estándar son como estimadores de varianzas poblacionales y desviaciones estándar. Si bien el estudio de las propiedades de buenos estimadores está fuera del alcance de este texto. VARIANZA E(x-x)2 =---- MUESTRAL s2 DESVIACIÓN ESTÁNDAR MUESTRAL s= ~E(x-~)2 n-1 n-1 A continuación aparece una muestra de seis de los principales despachos de contadores en Es:aOas Unidos y el número de socios relacionados con cada empresa. El teorema de Chebyshev expresa que al menos una proporción de 1 .'\ll==~ Repon. Población contra varianza muestra! y desviación estándar La varianza muestra! se denota por s2 y la desviación estándar muestra! por s.1 en el denominador en lugar de n.667 k = 2.15 = k2 .85 o sea 85% de los valores están dentro de 28 ± 2.1 le permite ser un estimador no sesgado.58(5) = 28 ± 12.85 Al despejar k se obtiene: 1 k2 = 6. Un histograma de edades de empleados profesionales con esta firma revela que los datos no están normalmente distribuidos sino que están amasados en los veintes y que pocos trabajadores tienen más de 40 años. Mientras que usar n en el denominador de la varianza muestra! lo hace un estimador sesgado. Debido a esto.CAPITULO 3 ESTADISTICA DESCRIPTIVA PROBLEMA DE IOEMQSTRACIÓN 3. con una desviación estándar de cinco años. la edad promedio de empleados profesionales tiende a ser más joven que en muchas otras profesiones de negocios.58 El teorema de Chebyshev dice que al menos 0. Supongamos que el promedio de edad de un profesional empleado por una compañía de computadoras en particular es de 28. el cálculo de la varianza muestra! y desviación estándar difiere ligeramente del cálculo de la varianza poblacional y la desviación estándar. al menos 0. 97 La varianza muestra! es 405 734. Antes de que se usaran las calculadoras.11 E(x-x)2 = 2 028 672.83 6 E(x .(Ex)2 COMPUTACIONAL PARA VARIANZA Y DESV1ACI0N ESTANDAR <12= <1= FORMULA COMPlITACIONAL PARA VARIANZA 52 MUESTRALY DESV1ACI0N ESTANDAR = .x)2 2 028 672. en las fórmulas originales para varianza y desviación estándar. Para situaciones en las que la media ya está calculada o se da..J405 734. FORMULA Ex2.79 382 134.(Ex)2 N y Al sustituir de estas expresiones equivalentes.84 s2 =---= n-1 5 s= 405 734.51 701959. este método por lo general era más rápido y fácil que usar las fórmulas originales.15 49 359.64 ESTADISTICA EN LOS NEGOCIOS X 1062 381 1719 1673 1277 217 Ex= 6329 (x-x)2 51.41 454 046.(Ex)2 n n-1 s=f1 Estas fórmulas de cálculo breve utilizan la suma de los valores x y la suma de los valores x2 en lugar de la diferencia entre la media y cada valor y desviaciones calculadas.¡.57 = 636.97.87 441 121.¡ N N Ex2 . obtenemos las siguientes fórmulas de cálculo breve.µ)2 = Ex2 . Algebraicamente: E(x. las formas alternativas de estas fórmulas son: (12 Ex2-Nµ2 s2 Ex2 -n(x)2 n-1 N .f1 = . Fórmulas de cálculo breve para varianza y desviación estándar Existe un método alternativo para calcular varianza y desviación estándar. que a veces se conoce como método de cálculo breve o método breve.57 y la desviación estándar muestra! es 636.84 x = 6 329 = 1 054.57 . incluyendo el número sentencias por mes. el propietario de la compañia que inicia la producción de computadoras puede calcular una varianza poblacional y desviación estándar para los d tos de producción.5 = 37. la varianza y la desviación estándar para estas cifras. 5. Calcule la desviación media absoluta. como se reporta en la primera columna de las siguientes tablas. x'- X 55 100 125 140 60 Ex=480 s 2 = . Solud6n La investigadora calcula la desviación media absoluta.5.98 A continuación..5 y s = ~ MAD = = 37.5 5 Calculos de fórmula de cálculo breve de varianza y desviación estándar para datos de producción de computadoras 25 9 81 16 256 17 289 324 !! "Ix= 65 ~ . utiliza fórmulasde cálculo breve para despejar 52 y s para comparar los resul!Mb.CAPITULO 3 ESTADISllCA DESCIUP'T1\:\ 65 r • TABLA 3.) PROBLEMA DE DEMOSTRACIÓN 3.6 Es posible medir la efectividad del fiscal de un distrito judicial por medio de varias vari bles.1 "2 = = !!!. el número de casos manejados por mes y el úmero total de años de sentencias por mes. s= 3 025 10 000 15 625 19 600 3 600 Ex2 = 51 850 (480)2 51 05o--4 = .4. como se ve en la tabla 3. 975 975 (65)l 5 "" 975-845 5 5 u=v'Í6 .. Una investigadora utiliza una muestra de cinco fisc es de distrito en una ciudad y determina el número total de años de sentencia que cada fiscal g ó contra acusados durante el mes pasado. = 26 5 Con el uso del método de cálculo breve. la varianza y la desviación estándar para estos datos en la forma siguiente: lx-Xj X 55 100 125 140 ~ ___§Q.5 4 4 .8 5 5 s2 = :10 = 1 442. I:x=480 x= 41 4 29 44 I:lx-Xj = 154 I:x = º 48 n 5 (x-x)2 1 681 16 841 1 936 1 296 I:(x-x )2 = 5 770 =96 154 = 30./1 442. (Compare estos resultados con los de la tabla 3..98 51 850-46 080 5 770 =--=1442. 3.00 y z = +2. el valor sin procesar (x) está arriba de la media. 21/2% {1/2 del 5%) están abajo del valor de 30. 99. 71y62.00) 95% de los valores están entre 70 y el valor (x = 30). = 64. el valor sin procesar (x) está abajo de la media. z=x-µ a 1 VAWRESz Para muestras: x-x Z=-- S Si un valor z es negativo. Valores z Representan el número de desviaciones estándar que un valor (x) está arriba o abajo de la media de un conjunto de números cuando los datos están normalmente distribuidos.00 son aproximadamente 68% de los valores. Para calcular un coeficiente de variación para estos precios.84.40 y a = 4.7 muestra cómo el valor de 70 está dos desviaciones estándar arriba de la media (z = +2. Entonces 9"'1/1% de los valores están abajo del valor de 70. el cual seria (x = 70) que está 20 unidades arriba de la media. La figura 3. primero determinarnos la media y desviación estándar: u. 68.00 son aproximadamente Entre z = . de modo que el valor zes: z= 70-50 =+2. El tema de los valores z se estudian con más detalle en el capítulo 6.00 son aproximadamente Entre z = -2.5% µA 64.84 CVA =-(100)=--(I00)=. Por ejemplo.40 .075=7. ¡Cómo se interpreta el valor z? La regla empírica expresa que 95% de todos los valores están dentro de dos desviaciones estándar desde la media si los datos son aproximados y distribuidos en forma normal. que está dos desviaciones estándar abajo de la media o = = (30-50)/10 = -2. El coeficiente de variación es: aA 4. Entre z = -1. supongamos que un experto en estadística desea determinar el valor z para uno de 70. Si el valor z es positivo.00. Como 5% de los valores están fuera del rango de dos desviaciones estándar desde la media y la distribución normal es simétrica.00 y z = + 3. Como el valor z indica el número de desviaciones estándar que tiene un valor individual de datos respecto a la media. La desviación estándar muestra! obtenida por ambos métodos es 37.00 y z = + 1. la regla empírica se puede expresar también en términos del valor z.66 ESTADISTICA EN LOS NEGOCIOS Los resultados son los mismos. COEFICIENTE DE VARIACIÓN CV=~(lOO) µ El coeficiente de variación esencialmente es una comparación relativa de una desviación estándar con su media. El coeficiente de variación puede ser útil al comparar desviaciones estándar que han sido calculadas a partir de datos con diferentes medias. 64. Coeficiente de variación El coeficiente de variación es un estadístico dado por la razón entre la desviación estándar y la media expresada en porcentaje y se denota como CV.98 o sea 38 años.00 10 Este valor z significa que 70 está dos desviaciones estándar arriba de la media.7% de los valores. 95% de los valores. Supongamos que cinco semanas de precios promedio para la acción A son 57. para un conjunto de datos que está normalmente distribuido con una media de 50 y una desviación estándar de 10. Al utilizar el valor z es posible transformar la distancia bruta de un valor de la media en unidades de desviación estándar. 03.233 = 23.84 que podría no representar tanto riesgo como la desviación estándar de $3. es decir.00. Encuentre la varianza poblacional.11 Un conjunto de datos contiene los siguientes siete valores: 6 2 4 9 3 5 a. El coeficiente de variación da un método opcional de interpretar el valor de la desviación estándar. 3. Por otra parte. ¿Qué puede prevenir el coeficiente de variación sobre el riesgo de una acción.. La acción B tiene un coeficiente de variación que es casi tres veces el coeficiente de variación para la acción A. pero si el precio cae por abajo de lo que el inversionista compra.00 X =70 z = +2. que el precio de la acción fluctúa en forma desordenada. . por tanto.B ·º 3 3 13 (100) = . Por esta razón. La media de la acción Bes 13. A veces los investigadores financieros utilizan el coeficiente de variación. 17. Supongamos. No obstante. Un inversionista que compre a precio bajo y vende a precio alto puede obtener una buena ganancia. en contraste. El coeficiente de variación deja ver el riesgo de una acción en términos del tamaño de la desviación estándar con respecto al tamaño de la media (en porcentaje).03 para la acción B.3% a partir de la media. Imaginemos una acción con un precio que nunca cambia. la desviación estándar o ambos.3% La desviación estándar para la acción B es 23. Encuentre el rango.CAPITULO 3 ESTADISTICA DESCltlP'Il\'A 61 !1@1!¡1-ii . 8. Con la desviación estándar como la medida de riesgo. ya que no hay variabilidad en el precio. el precio promedio de la acción A es casi cinco veces más que el de la acción B. que no hace la desviación estándar? Supongamos que los precios promedio de una segunda acción. d. b.00 con una desviación estándar de 3. B. que el uso del coeficiente de variación como medida de riesgo indica que la acción B es más riesgosa. c. El coeficiente de variación se puede calcular para la acción B como: CV8 = us (100) = P. Dos desviaciones estándar desde la media X µ.2 PROBLEMAS 3. La opción de usar el coeficiente de variación o la desviación estándar para comparar desviacioaes estándar múltiples es cuestión de preferencia. el propietario de la acción tendría una pérdida potencial. como medidas de riesgo. Encuentre la desviación estándar poblacional. Porcentaje de descomposición de estadísticas. =50 z =O =30 z =-2. sobre estas mismas cinco semanas son de 12. la cantidad invertida en la acción A alcanza la desviación estándar de $4.00 La desviación estándar es 7 . 15 y 13.5% a partir de la media. la cual tiene un precio promedio de sólo $13. un inversionista no corre el riesgo de perder dinero porque el precio bajó. la acción A es más riesgosa sobre este periodo porque tiene mayor desviación estándar. los inversionistas utilizan medidas de variabilidad como la desviación estándar o el coeficiente de variación para determinar el riesgo de una acción. Cuanto mayor sea la variabilidad es mayor el potencial de pérdida. Encuentre la desviación media absoluta. 6 d. 3. Compare los resultados.68 ESTADISTICA EN LOS NEGOCIOS Encuentre el rango intercuartil f. ¡al menos qué proporción de los datos estarán dentro deµ.15 Utilice su calculadora o computadora para hallar la varianza poblacional y desviación estándar poblacional para los siguientes datos: 123 090 546 378 392 280 179 601 572 953 749 075 303 468 531 646 3. c. Encuentre el rango. e.17 Según el teorema de Chebyshev.12 Un conjunto de datos contiene los siguientes ocho valores: 4 o 3 5 2 9 4 5 a. k = 2 b. ¡Qué fórmula fue más rápida de usar? ¡Qué fórmula prefiere usted? ¡Por qué piensa usted que la fórmula de cálculo breve se conoce a veces como la fórmula de "método breve"? 3. Encuentre la varianza muestra]. Encuentre la desviación estándar poblacional con el uso de la fórmula de cálculo breve. Encuentre el rango intercuartil.13 Un conjunto de datos contiene los siguientes seis valores: 12 23 19 26 24 23 a. Encuentre la desviación estándar poblacional con el uso de la fórmula que contenga la media (la fórmula original).16 Determine el rango intercuartil de los siguientes datos: 44 18 39 40 59 46 59 37 15 73 23 19 90 58 35 82 14 38 27 24 71 25 39 84 70 3. c. k = 1. d.2 3. k = 3. Encuentre la desviación estándar muestral. k = 2. 3.18 Compare la variabilidad de los siguientes dos conjuntos de datos al usar tanto la desviación estándar como el coeficiente de variación: Conjunto 1 de datos Conjunto 2 de datos 49 159 82 121 77 138 54 152 .14 Utilice su calculadora o computadora para encontrar la varianza muestral y desviación estándar muestra! de los siguientes datos: 57 88 68 43 93 63 51 37 77 83 66 60 38 52 28 34 52 60 57 29 92 37 38 17 67 3. b.:!: ka para cada valor de k? a. Encuentre el valor z para cada dato e. b.5 c. Encuentre la desviación media absoluta. Si 68% de los tiempos de~ están entre 40 y 46 minutos. ¡cuántas desviaciones estándar desde la media incluirían pw lo menos 80% de los valores = 3.S. d. Encuentre el rango. ¡entre cuáles dos números caería aproximadamente 68% de los valores? ¡Entre cuáles dos números caería 95% de los valores? ¡Entre cuáles dos valores caería 99. Si la media de los números es 38 y la desviación estándar es 6. 3. g. c. Encuentre la desviación media absoluta. b. proporcionada por Marketing lntelligence Service. ¡cuál es el valor de la desviación estándar? Suponga que 99.S minutos. Encuentre la desviación estándar poblacional. Determinar el rango intercuartil.IS de b tiempos de ensamble están entre 35 y 51 minutos y la media es todavía de 43 =~~sena ahora el valor de la desviación estándar? Suponga que el tiempo necesario para ~ o=-a pieza de mueble no está normalmente distribuida y que el tiempo medio de ~ es :. d. Determinar la desviación media absoluta. Si la media de los números es 125 y la desviación estándar es 12. ¡Cuál es el coeficiente de variación para esta muestra? 3.24 El tiempo necesario para ensamblar una pieza particular de mueble con experiencia DIXmalmente distribuida con un tiempo medio de 43 minutos. Determinar la varianza. Revlon Garden Botanika Philip Morris Procter & Gamble Nestlé Paradiso Tsumura lnternational Grand Metropolitan Número de nuevos productos 768 429 323 306 286 262 215 172 162 148 145 a. f. es una lista de las compañías con los más nuevos productos en un año reciente. c. Encuentre el valor z para Nestlé. b. ¡qué proporción de valores caería entre 26 y 50? ¡Qué proporción devalores caería entre 14 y 62? ¡Entre cuáles dos valores caería 89% de los valores? 3. Compañia Avon Products L'Oreal Unilever U. ¡Cuál es la desviación estándar si al menos 77% de los tiempos de ~ csún 24 y 32 minutos? = .7% de los valores? 3. Encuentre el rango intercuartil. Encuentre la varianza poblacional. ¡Cuál es el valor z para la empresa que tiene seis profesionales? f.19 Una muestra de 12 pequeños despachos de contadores deja ver los siguientes números de profesionales por oficina: 7 10 9 14 ti 8 5 12 8 3 13 6 a. e.CAPl11JLO 3 ESTADISTICA DESCllIPTIU S 3.20 La siguiente.23 Según el teorema de Chebyshev. Encuentre el coeficiente de variación. e.22 Algunos números no están normalmente distribuidos. Determinar la desviación estándar.21 Una distribución de números tiene aproximadamente la forma de una campana. 70 ESTADISTICA EN LOS NEGOCIOS 3. ¿Qué se puede usar para representar los valores de datos? El punto medio de cada intervalo de marca de clase se utiliza para representar todos los valores en un intervalo de clase. Indonesia 118 Ouawa 120 Montreal 130 Halifax. La media para datos agrupados se calcula entonces al sumar los productos del punto medio de clase y la frecuencia para cada clase y dividir esa suma entre el número total de frecuencias. Francia 137 Bangkok. Media Para datos no agrupados. MEDIA DE DATOS AGRUPADOS donde: i = el número de clases f= frecuencia de clase N = total de frecuencias .25 Los ambientalistas están preocupados por las emisiones de dióxido de azufre a la atmósfera. Italia. Alberta 111 Jakarta. la media se calcula al sumar los valores de datos y dividir entre el número de valores. A continuación aparece una lista de las 10 ciudades menos costosas con sus respectivos costos de gastos de viaje. los valores especificas son desconocidos. Trate esta lista como una muestra. Ontario 109 Emonton. El número de dias por año en que se exceden los limites de emisión está normalmente distribuido con una desviación estándar de 4.0 ellas. El número promedio de dlas por año en el que los niveles de dióxido de azufre excede de 150 miligramos por metro cúbico en Milán.26 La Runzheimer Cuide publica una lista de las ciudades menos costosas en el mundo para agentes viajeros. Con datos agrupados. ¿Qué porcentaje de los años promediaría entre 21 y 37 dias de exceso de emisiones de dióxido de azufre? ¿Qué porcentaje de los años excederla de 37 dias? ¿Qué porcentaje de los años excederla de 41 dias? ¿En qué porcentaje de los años habría menos de 25 días con exceso de emisiones de dióxido de azufre 3. Por tanto. Ciudad Gastos de viaje ($) Hamilton. Manitoba 133 Bordeaux. A continuación aparece la fórmula para la media de datos agrupados. las medidas de tendencia central y variabilidad para datos agrupados deben calcularse de la moda diferente a las de datos no agrupados o sin procesar. Thailand 137 3. Montreal. Este punto medio es valorado por la frecuencia de valores en ese intervalo de clase. · Medidas de tendencia central Aqui se presentan dos medidas de tendencia para datos agrupados: la media y la moda. Utilice esta lista para calcular el valor z para Bordeaux.3 MEDIDAS DE TENDENCIA CENTRAL Y VARIABILIDAD:DATOS AGRUPADOS Los datos agrupados no dan información acerca de valores individuales. Nova Scotia 132 Winnipeg. Ontario 97 London. es 29. Edmonton y Hamilton. 6 Distribución de frecuencias de os porcentajes de desempleo en Francia Intervalo de clase Frecuencia I-rncnor de 3 16 3-menor de 5 s-menor de 7 4 --menor de9 3 9-menor de 11 Ll-menor de 13 9 6 il La tabla 3. De nueva cuenta.6 proporciona la distribución de frecuencias de los porcentajes de desempleo de Francia de la tabla 2. Para hallar la media de estos datos.2. f. Medidas de variabilidad Aquí se presentan dos medidas de variabilidad para datos agrupados: la varianza y la desviación están. Recuerde que como cada intervalo de clase fue representado por la marca de clase en lugar de los valores reales. El valor de 'if se puede determinar al sumar los valores de la columna de frecuencia.¡ 40 . o la marca de clase. Ambas medidas tienen fórmulas originales y de cálculo breve.. la media de grupo es sólo aproximada .i 12 7.menor de 9 9./M = 250 .25. La clase modal es el intervalo de clase con la frecuencia más grande.:\ TABLA 3. Entonces. dar.W donde: f = frecuencia M = punto medio de clase N = 'if o frecuencias totales de la población µ.menor de 7 4 4 11. 16.f(M-µ)2 a-----N N a=.7 contiene los cálculos necesarios para determinar la media de grupo. FORMULAS PARA Fórmula original VARIANZA POBLACIONALY DESVIACIÓN ESTÁNDARDE DATOS AGRUPADOS 2 \(ersión de cálculo breve L.. !. Por tanto. Sumar estos valores de fM da el valor de 'ifM.11.CAP!TuLo 3 ESTADlsnCA DESCIJPiI\'.7.7 es 2. Para calcular 'ifM. el intervalo de clase 1-menor de 3 contiene la frecuencia más grande. A continuación multiplicamos cada una de estas marcas de clase por la frecuencia en ese intervalo de clase._(y !..JM 250 µ=--=-=6.menor de 3 Frecuencia (!) Marca de clase (M) 3. la clase modal es 1-menor de 3. la moda para la distribución de frecuencias mostrada en la tabla 3. La tabla 3.menor de 11 fM 32 16 ~f= N= 40 '2:. debemos determinar primero los valores de M. = media agrupada para la población TABLA 3. El porcentaje de desempleo modal es 2 por ciento.menor de 5 5.7 Cálculo de media agrupada Intervalo de clase 1.~f.25 '2:.menor de 13 6 24 8 24 9 10 90 . Moda La moda para datos agrupados es la marca de clase de la clase modal. La marca de clase de esta clase modal es 2. resultando en JM. necesitamos !. Con el uso de los datos del cuadro 3. la desviación estándar es la raíz cuadrada de la varianza. La media de grupo para los datos de desempleo es 6. lS 0.8 Cálculo de varianza agrupada y desviación estándar con la fórmula original /M M-p /(11-1'>1 I M l-menorde3 16 2 32 -4.25 S.980 .063 10.189 9. En cualquier caso. = (M-p)'A ~ 289. los cálculos son como sigue: Para la fórmula original.25 'i. los cákulos se muestran en la tabla 3.5 = 15. 144 72 fM= 250 40 'i.75 33J>63 Intern1o de da. I/(M .838 "= Vl5.98%.9.063 9.f o total de frecuencias de la población µ.e 11-menor de 13 .00S ./M2-('i.. f TABLA 3.8.5 = 633.fM)2 2196.! 12 5.menor de 11 9 10 90 3. = media agrupada para la muestra Por ejemplo.6.838 (cuadrado de porcentaje) y la desviación estándar es de 3.(Z50) =----~n~. JCM -e>2 N =~ 40 = 15..--~40~ u= \ FÓRMULAS PARA 2 3-menordrS 11. Al igual .063 0.126 S-menorde7 4 6 24 -0.menor de 13 VARIANZA MUESTRALY DESVIACIÓN ESTÁNDAR DE DATOS AGRUPADOS fMZ fJl l-menorde316 864 fW = 2196 2 40 = 2196-1562.n IJM= 250 If-N= 40 µ= .838 = 3.9 Cálculo de varianza agrupada y desviación estándar con la fórmula de cálculo breve 32 2 4 8 5-menorde7 4 6 24 7.. Si los datos se tratan como población.r=--72 ESTADISTICA EN LOS NEGOCIOS 1 TABLA 3.!2!:m.75 3.567 .25 18.520 250 =-=6.µ)l = 633.838 40 40 15.838 = 3.f 4Q 'i.meoorde9 3 8 24 192 9-mmorde 11 9 10 90 900 6 12 f=N= u n 64 32 . la varianza de los datos de desempleo es de 15. El método para determinar a2 y u al usar la fórmula de cálculo breve se muestra en la tabla 3.063 3-menorrkS 2 4 8 -2.75 14.980 Fórmula original s2 Versión de cálculo breve 2 = E/(M-x) n-1 s=N donde: f= frecuencia M = punto medio de clase N = I.252 7-meoordc9 3 8 24 1.063 126. calculemos la varianza y desviación estándar de los datos agrupados de desempleo en Francia como una distribución de frecuencias en la tabla 3. • PROBLEMA DE DEMOSTRACIÓN 3.menor de 40. la marca de clase se utiliza para representar todos los valores en un intervalo de clase. este cálculo es sólo aproximado.5 27.99 f(M-Xl2 1 039.5 37.16 -3.79 140.menor de 20.16 -8. Si esta situación no ocurre.menor de 50 6 22 35 29 16 8 4 2 Soluci6n La media se calcula como sigue: Clase 10.menor de 45.menor de 15.-Primero.58 =57. entonces la varianza y desviación estándar son sólo aproximaciones. que es fa moda agrupaaa.menor de 25 25.menor de 40 40. usamos la fórmula original Clase 10.menor de 15 15.5 37.menor de 35 35.0 95. moda.0 X= EfM = 3130 = 25.menor de 45 45.=:: :H(M-W= 6910.5 17.84 16.menor de 20 20.0 170.CAPITULO 3 ESTADISTICA DESCRIPII\':\.5 con una frecuencia de 35.::: 1 13. varianza y desviación estándar en los siguientes datos muestrales: Intervalo de clase Frecuencia 10.menor de 50 M 6 22 35 29 16 8 4 2 U= n·= 122 12.menor de 30.5 47.19 66.Js1..59 476.66.0 385.65 98.5 520. Debido a que la estadística agrupada se calcula por lo general sin conocer los datos reales.3.5 32.5.menor de 20 20.menor de 25.5 17.16 1.56 M-x (M-X)2 -13.5 32.84 6. Este método puede o no ser aproximado.5 42.5 Ef(M-x)2 52 = n-1 s = .5 27.59 9.19 283.84 173.menor de 30 30.5 797.66 Ef 122 La media agrupada es 25.menor de 30 30.5 42.menor de 35 35. '3 que con el cálculo de la media agrupada. La marca de clase en este caso es de 22.5 47. La varianza y desviación estándar se pueden encontrar como se muestra a continuacio.99 3.5 22.0 HM=3130.!3': =-=.11 121 :: :L:iii! .menor de 25 25. dependiendo de si el valor promedio en una clase está en el punto medio.84 21.5 22.5 fM 75.39 46.7 Calcule la media.menor de 40 40.menor de 45 45. 7~ 1121.menor de 15 15.84 11.14 1 464.98 349. La clase con la frecuencia más grande es 20-menor de 2.menor de 35.menor de M 15 20 25 30 35 40 45 50 H=n= 6 22 35 29 16 8 4 2 122 12.0 300.0 787. La moda agrupada se puede determinar si se encuentra la marca de clase del intervalo de clase con la frecuencia más grande.11=7. 29 Determine la varianza poblacional y desviación estándar para los siguientes datos con el uso de la fórmula original: Clase f 20.6 1.0 2.menor de 40 40.0 IfM= 3130.5 797.menor de 6 6.menor de 4 4.menor de 30 30.56 s2 12.menor de 12 12.50 17 718.0.5 42.menor de 80 7 11 18 13 6 4 .04 121 = 57.50 (3 130l2 122 121 6 910.11 La varianza muestra! es 57 .27 Calcule la media y la moda para los siguientes datos: Clase f O.3 PROBLEMAS 3.5- fM2 937.8 2.00 7 225.00 4 512.menor de 2.0 170.menor de 60 60.11 = 7 .5 27.menor de 50 6 22 35 29 16 8 4 2 U= n = 122 ¿.25 16 900./57 .menor de 1.56.50 IfM2 = 87 212.2.5 22.menor de 45 45.0 95.5 fM 75.2 220 ISO 90 110 280 3. M Clase 101520253035- menor de 15 menor de 20 menor de 25 menor de 30 menor de 35 menor de 40 40. fM2 _ (E fM)2 n = n-1 5 = .5 47.menor de SO SO.menor de JO JO.0 385.75 21 931.menor de 14 39 27 16 IS 10 8 6 3.menor de 2.menor de 2.0 787.5 520.4 2.50 6 737.28 Calcule la media y la moda para los siguientes datos: f Clase 1.6. usamos la fórmula de cálculo breve.5 32. 3.menor de 3.5 17.menor de 70 70.8.74 ESTADISTICA EN LOS NEGOCIOS A continuación.0 87 212.0 300.00 11 250.11 y la desviación estándar es 7 .4.menor de 8 8.5 37.menor de 2 2. Calcule Ja varianza. Calcule la desviación estándar.32 Los siguientes datos representan el número de citas de negocios hechos por intervalo de 15 minutos. para una compañia de jardinería: Número de citas frecuencia con que ocurren O-menor de 1 !-menor de 2 2-menor de 3 3-menor de 4 4--menor de 5 5-menor de 6 31 57 26 14 6 3 a. está clasificada por grupo de edad. Tennessee.CAPITULO 3 ESTADISTICA DESOUl"rro rs 3. c. como se ve en los siguientes datos: Gru~deedad 18-menor de 24 24--menor de 30 30-menor de 36 36-menor de 42 42-menor de 48 48-mcnor de 54 54--menor de 60 60-menor de 66 66-menor de 72 Frecuencia 17 22 26 35 33 30 32 21 15 a. por solicitud telefónica. 3. c. Calcule la media de los datos. Calcule la varianza. Calcule la desviación estándar. b. . Calcule la moda. d. Clase 5-menor de 9 9-menor de 13 13-menor de 17 17-menor de 21 21-menor de 25 f 20 18 8 6 3.30 Determine la varianza muestra! y desviación estándar para los siguientes datos coa el uso de b fórmula de cálculo breve. Calcule la moda. b.31 Una muestra aleatoria de votantes ea Nashville. d. Calcule la media de los datos. . Calcule la desviación estándar.8 no tiene sesgo porque es simétrica. Calcule la media de los datos. En ocasiones los maestros universitarios se refieren a una distribución de calificaciones como sesgada. El sesgo se presenta cuando una distribución es asimétrica o carece de simetria.10 muestra una distribución que está sesgada a la derecha o positivamente sesgada. examinamos dos medidas de forma. Sesgo Una distribución de datos en los que la mitad derecha es una imagen reflejada de la mitad izquierda es simétrica. con base en información del US Departrnent of Agriculture. d. ¿Cómo se compara la respuesta con estos datos agrupados? ¿Por qué podrlan ser diferentes? Número de granjas por estado f O-menor de 20 000 20 000-menor de 40 000 40 000-menor de 60 000 60 000-menor de 80 000 80 000-menor de 100 000 100 000-menor de 120 000 16 II 10 6 5 3. examinamos las gráficas de caja y bigote. La media calculada desde los datos originales no agrupados es de 37 816 y la desviación estándar es de 29 341. c.34 La distribución de frecuencias que se muestra representa el número de granjas por estado para 49 de los 50 estados. La parte sesgada es la parte larga y delgada de la curva. b.9 muestra una distribución que está sesgada a la izquierda o negativamente sesgada y la figura 3. Un ejemplo de una distribución simétrica es la distribución normal o curva de campana. sesgo y curtosis.76 ESTADISTICA EN LOS NEGOCIOS 3. Calcule la varianza. además. 3. En esta sección. La distribución en la figura 3. Determine el número promedio de granjas por estado a partir de estos datos. la cual se presenta con más detalle en el capitulo 6. La figura 3. Calcule la moda.4 MEDIDAS DE FORMA Las medidas de forma son herramientas que se pueden usar para describir la forma de una distribución de datos. Muchos investigadores usan distribución sesgada para denotar que los datos están dispersos en un extremo de la distribución y acumulados en el otro extremo. con lo cual quieren decir que pocos estudiantes calificaron en un extremo de la escala de calificaciones muchos calificaron en el otro extremo. La siguiente distribución de frecuencias se elaboró a partir de estos datos para un año reciente: Número de pasajeros que llegan y salen (millones) Número de aeropuertos 20-menor de 30 30-menor de 40 40-menor de 50 50-meoor de 60 60-menor de 70 70-menor de 80 8 7 1 O 3 a.33 La Air Transport Association of Arnerica publica datos sobre los aeropuertos de mayor movimiento en Estados Unidos. Una distribución en forma de campana o normal con la media.3 = +o. Aquí presentamos uno de estos coeficientes. mediana y moda El concepto de sesgo permite entender la relación de la media. mecliana y moda para diferentes tipos de sesgo. más sesgada será la distribución. Nótese que si la distribución es simétrica..73 Como el valor de Sk es positivo. la distribución es positivamente sesgada.CAPITULO 3 ESTADlsnCA DESCIUPll\:\ ~bución simétrica 1 i @¡!fil• ~elación de media. Si d valor de S¡ fuera negativo. la distribución sería negativamente sesgada. no tiene sesgo.3. la media y la mediana son del mismo valor y por tanto el coeficiente de sesgo es igual a cero. conocido como coeficiente de sesgo o de Pearson.11 muestra la relación de la media. La figura 3. porque la media es afectada por todos los valores. por ejemplo. Coeficiente de sesgo Al experto en estadística Karl Pearson se le da el crédito de idear por lo menos dos coeficientes de sesgo que se pueden usar para determinar el grado de sesgo en una clistribución. mediana y moda. El coeficiente de sesgo se calcula como: sk = 3(29. el cual compara la media y mediana en vista de la magnitud de la desviación estándar.26) 12. . COEFICIENTE DE SESGO O DE PEARSON donde: Sk = coeficiente de sesgo Md =mediana Supongamos. En una distribución unimodal (distribución con un solo pico o moda) que esté sesgada. la moda es el vértice (punto más alto) de la curva y la mediana es el valor del medio. todos en el centro de la distribución.a desviación estándar de 12. que una distribución tiene una media de 29. La media tiende a estar ubicada hacia la cola de la distribución. mediana y moda. una mediana de 2" rm. incluyendo los extremos. Cuanto mayor sea la magnitud de S¡. "lediana y moda Distribución sesgada a la derecha o sesgada positivamente Distribución sesgada a la izquierda o sesgada negativamente ~=® Mediana Moda (a) Distribución simétrica (no hay sesgo) Mediana Mediana (e) Positivamente sesgada (b) Negativamente sesgada Sesgo y la relación de la media. : Gráfica de caja y bigote l. se traza desde la bisagra inferior de la caja hacia afuera del valor de los datos más pequeño. Estos puntos extremos de caja ( Q1 y Q3) se conocen como las bisagras de la caja. encerrando asl no sólo la mediana sino también 50% de los datos. entonces pueden construirse cercas exteriores: Q1 .S•IQR\ 3. El cuartil superior ( Q3) 4. Un segundo bigote se traza desde la bisagra superior de la caja hacia afuera del valor de datos más grande. el rango intercuartil se utiliza también fuera de la caja.3. Un bigote. La gráfica se construye con el uso de una caja para encerrar la mediana.0·IQR Q1 Mediana Q3 3. Otras veces son valores tan diferentes de otros valores que no deberían ser considerados en el mismo análisis como el resto de la distribución. Gráficas de caja y bigote Distribución leptocúrtica Distribución platicúrtica Otra forma de describir una distribución de datos es mediante el uso de una gráfica de caja y bigote. La mediana (Q2). No obstante. el valor del rango intercuartil (IQR) se calcula con Q3 . 5. Los valores de datos fuera de la corriente principal de valores en una distribución se ven como resultados aislados. Las cercas interiores se establecen como sigue: Q1 Q3 - + 1. El cuartil inferior ( Q1).78 ESTADISTICAEN LOS NEGOCIOS Curtosis FIGURA 3. aquí. 3. Desde los cuartiles inferior y superior.5 · IQR hacia afuera desde los cuartiles inferior y superior están lo que se conoce como cercas interiores. o segmento de recta.12 Tipos de curtosis La curtosis describe la cantidad de apuntamiento de una distribución.5 · IQR Si los datos caen más allá de las cercas interiores. La caja de la gráfica se determina al localizar la mediana y los cuartiles inferior y supeDistribución mesocurtica rior en un continuo.Q1• El rango intercuartil incluye 50% de los datos y debe ser igual a la longitud de la caja. pero a veces se presentan debido a errores de medición o registro. es un diagrama que utiliza los cuartiles superior e inferior junto con la mediana y los dos valores más extremos para describir gráficamente una distribución. El valor más grande de la distribución. Entre estos dos tipos hay distribuciones que son más "normales" en su forma como las mesocúrticas. Una gráfica de caja y bigote. las que son planas y dispersas como distribuciones platicúrticas.13 muestra las características de una gráfica de caja y bigote. 2. Las distribuciones que son altas y delgadas se conocen como distribuciones leptocúrticas.0 · IQR La figura 3. l. Estos tres tipos de curtosis se ilustran en la figura 3.5 · IQR 1.0•JQR . El valor más pequeño de la distribución. La gráfica de caja y bigote se determina a partir de cinco números específicos.12. Los valores de la distribución de datos que estén fuera de las cercas interiores pero den- UM'1¡t+HF• ll1sagra Bisagra i. La caja se traza alrededor de la mediana con los cuartiles inferior y superior ( Q1 y Q3) como los puntos extremos de la caja. Los resultados aislados pueden ser simplemente los valores más extremos de un conjunto de datos. unas rectas conocidas como bigotes se prolongan desde la caja hacia los valores de datos extremos. a veces llamada gráfica de caja. Esta caja se extiende hacia fuera desde la mediana a lo largo de un continuo hasta los cuartiles inferior y superior. A continuación.0 · IQR Q3 + 3. A una distancia de l. entonces el 50% medio está sesgado a la izquierda. Estos valores son resultados aislados extremos. Las bisagras de la caja están situadas en los cuartiles inferior y superior. Si la mediana está ubicada en el lado derecho de la caja.14 Gráfica MINITAB de caja y bigote TABLA 3.5 Q3 + 3 · lQR = 80.11.5(11. Un asterisco se imprime entonces para cada valor de datos ubicado entre las cercas interior y exterior para indicar un resultado aislado leve. como se muestra en la tabla 3.14 es la salida impresa MINITAB de una computadora para esta gráfica de caja y bigote.5(11.IO La figura 3.5) = 69 .5 81 74 70 62 81 73 69 62 60 ro 50 Datos de tibia 90 .3 · IQR y Q3 + 3 · IQR. La ubicación de la mediana en la caja puede relacionar información acerca del sesgo de 50% de los datos. un investigador de negocios puede hacer un juicio acerca del sesgo de los valores exteriores.69 = 11.5) = 80.5 = 34. Datos para gráfica de caja y bigote 71 76 70 82 74 87 79 79 74 62 82 64 72 65 63 74 68 80 75 73 81 85 62 73 81 84 n 71 73 84 64 68 73 72 82 81 69 65 71 69 FIGURA 3. =69 Qz = mediana = 73 68 OJ = 80. uno de los principales usos de ar.5 + 34. Para construir una cerca exterior.CAPITULO 3 ESTADISTICA DESCRIPm . Los valores que estén fuera ~ bs cercas exteriores se conocen como resultados aisladosextremos. calculamos Q1 .As]. Los valores fuera de las cercas exteriores se indican con un cero en la gr:lfica.5 + 3(11.25 = 97.5 = 115.3 · IQR = 69 . que es 87. Al examinar la longitud de los bigotes a cada lado de la caja. es relativamente fácil determinar los valores del cuartil inferior (Q1).5 desde el cuartil superior.5 · IQR = 69 - 1. Otro uso de las gráficas de caja y bigote es determinar si una distribución es sesgada.75 y Q3 + 1.5 .0 TABLA 3.34. Si la mediana está ubicada en el lado izquierdo de la caja.Q1 = 80. La distribución de 50% de los datos está sesgado a la derecha.a gráfica de caja y bigote es identificar resultados aislados.5 82 74 71 81 74 71 64 63 IQR = Q3 .10 para construir una gráfica de caja y bigote. entonces el 50% medio está sesgado a la derecha.5 + 1.75 Los bigotes se construyen al trazar un segmento de recta desde la bisagra inferior hacia afuera del valor de datos más pequeño y un segmento de recta desde la bisagra superior hacia afuera del valor de datos más grande. Una vez organizados los datos en un conjunto ordenado. La cerca inferior se construye con: Q1 - 1. que es 62 y del valor más alto. A partir de éstos. entonces los datos exteriores están sesgados a la derecha y viceversa.5) = 80. Si el bigote más largo está a la derecha de la caja. porque la mediana está más cerca de la bisagra inferior o izquierda. En algunas gráficas de caja y bigote generadas por computadora. La mediana está situada dentro de la caja a distancias de 4 desde el cuartil inferior y 6.25 = 51. Los bigotes se construyen hacia afuera del valor más bajo. Vamos a utilizar los datos la tabla del cuadro 3.5 + 17. 69 y 80.5 · IQR = 80.11 tro de las cercas exteriores se conocen como resultadosaislados leves.17. los bigotes se trazan a los valores de datos más grandes y más pequeños dentro de las cercas interiores. el valor del rango intercuartil se puede calcular. la mediana y el cuartil superior (Q3). Un examen de los datos muestra que ninguno de los valores de datos de este conjunto de números está afuera de la cerca interior.11 Datos en conjunto ordenado con cuartiles y mediana 8i 80 73 69 85 79 73 68 84 84 79 73 77 72 82 76 72 65 82 75 71 65 64 Q. como sigue: Q1 .5) = 69 .5.3(11. 39 Construya una gráfica de caja y bigote con los siguientes datos y conteste si. se analizaron con el uso de estadística descriptiva. Analice el sesgo de la distribución de edades si la edad media es 51. Un investigador observa a los clien- tes y estima sus edades. ¡Cuál es el significado del coeficiente? 3. si las acciones de dos lineas aéreas suben y bajan de una manera relacionada.80 ESTADISTICAEN LOS NEGOCIOS 3. Lógicamente. En este capitulo analizamos sólo una medida de asociación.36 Un hotel local ofrece bailes de salón los viernes por la noche.40 Suponga que le pide a un grupo de 18 consumidores que conserven una bitácora de sus prácticas de compra y que los siguientes datos representan el número de cupones empleados por cada uno en el periodo anual. Calcule el valor del coeficiente de Pearson y estudie su significado. ¡está sesgada la distribución de datos? 540 690 503 558 490 609 379 601 559 495 562 580 510 623 477 574 588 497 527 570 495 590 602 541 3. Utilice estos datos para calcular un coeficiente de Pearson. Haga una lista de la mediana. 81 68 70 100 94 47 66 70 82 110 105 60 21 70 66 90 78 85 3. El volumen medio anual en dólares para estas empresas es de 5 millones 510 mil dólares. ¡está sesgada la distribución de estos precios de acciones? Si es así. los puntos extremos para las cercas interiores y los puntos finales para las cercas exteriores. ¿cómo? 3. Si el valor de mediana es $33 y la moda es $21.37 Los volúmenes de ventas de las principales empresas de corretaje de bienes rafees en Estados Unidos. En la industria del transporte. Q1. ¿en qué medida? las edades de usuarios de Internet obtenidas de una muestra. 3. ¡hay una correlación evidente entre el precio del transporte y el peso del objeto que se envía?.38 Supongamos que los siguientes datos son 41 15 31 25 23 21 22 22 24 18 30 20 19 19 16 23 27 38 34 24 19 20 29 17 23 3. la mediana es de 3 millones 190 mil dólares y la desviación estándar es de 9 millones 590 dólares. Correlación La correlación es una medida del grado de relación de variables. los precios de dos acciones de la misma industria deben estar relacionados. Q3. el análisis de correlación puede proporcionar un valor numérico que represente el grado de relación de los dos precios de acciones en el tiempo.4 PROBLEMAS 3. la correlación y lo hacemos así sólo para dos variables numéricas.5 MEDIDAS DE ASOCIACIÓN Las medidas de asociación son estadísticas que proporcionan información respecto a la relación de variables numéricas. Puede ayudar a que un investigador de negocios determine. para un afio reciente. por ejemplo.35 En cierto dJa el promedio de precios al cierre de un grupo de acciones en la bolsa de Nueva York es $35 (al dólar más cercano). Use los datos para construir una gráfica de caja y bigote. ¡el . ¿Está sesgada la distribución? Si es así. ¡estos datos contie- nen resultados aislados? Y si. Para una muestra de pares de datos. Analice el sesgo de la distribución de estos datos y señale cualquier resultado aislado. la edad mediana es 54 y la edad modal es 59. b) representa moderada correlación negativa. Es un número que varia de -1 a + 1. .Z= 619207 Ixy =21 115. en los costos de embarque que esúA '.815 (720.. ¿qué tan fuerte es la correlaEconomics ción entre el índice de precios al productor y el porcentaje de desempleo? En ventas al menudeo.00 ción positiva entre dos conjuntos de números.22). pero como prácticamente siempre manejan datos 7.00 51076 50625 1 743. número de competidores.(92.205 55.1 denota una perfecta correlación negativa. TABLA 3.99 58081 1928. Un valor r de .43 221 Existen diferentes medidas de correlación.49 49729 1 712. Un valor r de + l denota una perfecta rela241 12 8. a los investigadores les gusta despejar p. de amplio uso. ¿están las ventas relacionadas a la densidad de población... e) representa moderada correlación positiva.03 233 11 241 12 a.34 51076 1896.42 1 715. cantidad de publicidad. en parte. tamaño de la tienda.68 El estadístico r es el coeficiente de correlación de Pearson.45 55225 54289 1870..(2725) 2' 12 12 l .48 222 2 8.207) .13 Cálculo de r para el ejemplo de Economics .217 58.03 senta la fuera de la relación entre las variables. estadístico inglés que ideó varios coeficientes de corre7.93)(2n5) l = . la selección de las cuales depende principal7. 223 7. En el ideal.00 I.67 8 honor a Karl Pearson (1857-1936). d) representa fuerte correlación positiva (e) no contiene correlación.125 64. lo cual indica una relación inversa entre dos variables: cuando una se hace más grande.59 226 9 235 10 8.. 8.68 223 7 7.75 50176 1 702.59 226 9 lación junto con otros importantes conceptos de estadística.12 COEFICIENTE DE CORRELACIÓN DEPEARSON L:(x . TABLA 3..760 58.07 10 de la correlacián lineal entre dos variables.590 64.63 6 cuando los datos son ordinales.67 226 8 7.43 221 7. Un valor r de O significa que no existe relación lineal entre dos variables.07)r= r 1112 55.93 I1•2ns (21 115. nombre que recibe 'en 226 7. 224 5 7.982 58.220 "T 48841 1642.56 49284 1808.15 representa cinco diferentes grados de correlación: a) representa fuerte correlación negativa.93)2~ (619. u otras variables? 7.07 (92. ¿qué variables están relacionadas a las ventas de una tienda en particular?. En economía y finanzas. que repre233 11 8. ¿qué tan fuertes son las correlaciones.y) La figura 3.75 225 4 muestrales..flJ Esta medida es aplicable sólo si ambas variables analizadas tienen al menos un nivel de intervalo de datos.000 ~-720..CAPITULO 3 ESTADISTICA DESCmP'I1U precio y la distancia muestran alguna relación?.000 60._ lndlice Dla s T ----------------------------7.. El término res una medida 235 8.x)(y.64 51076 1 733.00 226 3 7. El capítulo 17 presenta una medida de correlación que se puede usar 223 7.60 224 5 7.oo Ix• 92.' U:s decisiones de precios pueden estar basadas.829 57.40 49n9 1 701.75 225 4 7.63 223 6 7.608 65.48 222 mente del nivel de datos que se analice... la otra se hace más pequeña.latos para el ejemplo de correlacionados con otras variables.07 8.481 64.03 1660.063 57. esta sección introduce un coeficiente de correlación muestra! r.00 226 el coeficiente poblacional de correlación. ·. •...... INDICEFUTUROS Pearson correlation of INTEREST RATE and FUTURES INDEX z 0. . ·:.. . · .. . ·.. . ·'..·. . .. . .. •• 'f . .. . ... ·. .... . e) Prácticamenteno hay correlación (r = -0. . . : . ·... ... "..-. -.815 . . . .. .. . .. . 1 0.. . Cinco correlaciones a) Fuertecorrelación negativa (r = -0. :... . d) Fuertecorrelación positiva (r = ..... ·. ·.. .· . . . ... .. ·. .518) : . . .. . . . ... ... . . ... . ..~-:.004) . .815 1 Salida MINITAB Correlaciones:TASA DE INTE~..·.. i: :·.933) •'.... . 1 • • ·.. '. . . . .~···.82 ESTADISTICA EN LOS NEGOCIOS U@l¡fii@.. h'fll!. ..·:.. ·. .. . .909) e) Moderada correlaciónpositiva(r= . . : ••• .. ..• • . . ... . . .: . ~:· . . . .. ·' .. . .. • • s: • I• .... . .. ·..Mi.. ... .· ... _..... Salida Excel y MINITAB para el ejemplo de Economics Salida Excel A 1 2 lnterest Rata 3 Futuras lndex = b) Moderada correlación negativa (r -0. :.. .... ·.674) B e lntarast Rata Futuras lndex ·... . .... '• .: .. .· . 9 52. es posible calcular un coeficiente r. por 100 empleados de varias industrias en tres años recientes. Con el uso de los siguientes precios de la acción Delta y la acción Southwest. los precios de acciones se han redondeado al décimo más cercano: Delta Southwest 47. La figura 3.4 52.42 Determine el valor de r para Jos siguientes datos: X y 158 296 87 110 436 349 510 301 322 550 3.4 50. ly. 3.5 PROBLEMAS 3.41 Determine el valor del coeficiente de correlación.1 3.Sall"m \ 13 ¡Cuál es la medida de correlación entre la tasa de interés de fondos federales y el índice de futuros de mercancías o productos? Con datos como los que se muestran en la tabla 3.4 16.6 52. junto con el sobrante (en millones de dólares) que la compañía tenla en activos en esos estados: Estado Alabama Colorado Florida !llinois Maine Montana Dakota del Norte Oklahoma Texas Reclamación $1425 Sobrante $277 273 100 915 120 l 687 259 234 40 142 25 259 57 258 31 894 141 Utilice los datos para calcular un coeficiente de correlación r. un analista muestreó seis dias de actividad del mercado accionario.6 15.13. En análisis de correlación. el coeficiente de correlación se calcula como se ve en la tabla 3.815) representa una relación positiva relativamente fuerte entre tasas de interés e índice de futuros de mercancias o productos en un periodo de 12 dias.6 15. .45 El National Safety Council publicó los siguientes datos sobre porcentaies de inci<lmc:ía.6 15. calcule el coeficiente de correlación. por lesiones mortales o que hacen perder tiempo de trabajo. El examen de la fórmula para calcular un coeficiente de correlación de Pearson deja ver que los siguientes valores deben obtenerse para calcular r: Ix.Iy2.3 15. para determinar la cornbción entre reclamaciones y sobrantes.12 y que representan b valores de tasas de interés de fondos federales e índices de futuros de mercancías o productos para una muestra de 12 días.CAPITUW 3 ESTADISnCA DE. El valor r obtenido (r = 0. Para este ejemplo. para los siguientes datos: X y 4 6 7 11 14 17 18 12 13 8 7 7 21 3. no importa cuál variable se designe x y cuál se designe y.43 En un esfuerzo por determinar si existe alguna correlación entre el precio de acciones de aerolíneas. 3. r. Ixy y n.7 18. lx2.16 muestra salidas de Excel y MINITAB para este problema.44 Los siguientes datos son las reclamaciones (en millones de dólares) por prestaciones de BlueCross BlueShield para nueve estados.l 46. Para mayor comodidad. ly. Para mayor comodidad. no importa cuál variable se designe x y cuál se designe y.4 52. El valor r obtenido (r = 0.1 3. el coeficiente de correlación se calcula como se ve en la tabla 3. Con el uso de los siguientes precios de la acción Delta y la acción Southwest. lx2.6 15.5 PROBLEMAS 3.6 15. 3.6 15. En análisis de correlación. por lesiones mortales o que hacen perder tiempo de trabajo. los precios de acciones se han redondeado al décimo más cercano: Delta Southwest 47. calcule el coeficiente de correlación. r.3 15.45 El National Safety Council publicó los siguientes datos sobre porcentaies de inci<lmc:ía.9 52. 3. un analista muestreó seis dias de actividad del mercado accionario.13.Sall"m \ 13 ¡Cuál es la medida de correlación entre la tasa de interés de fondos federales y el índice de futuros de mercancías o productos? Con datos como los que se muestran en la tabla 3. Ixy y n. por 100 empleados de varias industrias en tres años recientes. para los siguientes datos: X y 4 6 7 11 14 17 18 12 13 8 7 7 21 3. . La figura 3.44 Los siguientes datos son las reclamaciones (en millones de dólares) por prestaciones de BlueCross BlueShield para nueve estados.42 Determine el valor de r para Jos siguientes datos: X y 158 296 87 110 436 349 510 301 322 550 3.16 muestra salidas de Excel y MINITAB para este problema.4 16.6 52.41 Determine el valor del coeficiente de correlación.Iy2.815) representa una relación positiva relativamente fuerte entre tasas de interés e índice de futuros de mercancias o productos en un periodo de 12 dias.12 y que representan b valores de tasas de interés de fondos federales e índices de futuros de mercancías o productos para una muestra de 12 días.l 46. Para este ejemplo.43 En un esfuerzo por determinar si existe alguna correlación entre el precio de acciones de aerolíneas.7 18. es posible calcular un coeficiente r.4 50. El examen de la fórmula para calcular un coeficiente de correlación de Pearson deja ver que los siguientes valores deben obtenerse para calcular r: Ix. junto con el sobrante (en millones de dólares) que la compañía tenla en activos en esos estados: Estado Alabama Colorado Florida !llinois Maine Montana Dakota del Norte Oklahoma Texas Reclamación $1425 Sobrante $277 273 100 915 120 l 687 259 234 40 142 25 259 57 258 31 894 141 Utilice los datos para calcular un coeficiente de correlación r. para determinar la cornbción entre reclamaciones y sobrantes.CAPITUW 3 ESTADISnCA DE. 18.9 10 11 112 J.50 DATOS DE PRODUCCIÓN DE COMPUTADORAS 1 z 3 4 5 e 7 e .6 ESTADÍSTICA DESCRIPTIVA EN LA COMPUTADORA Tanto MINITAB como Excel dan extensas estadísticas descriptivas.f fM• Salida Excel para el problema de producción de computadoras ESTADISTICAS DESCRIPTIVAS Variable N Mean Computer 13.74 2. también pueden producir estadísticas descriptivas múltiples.46 Metales no ferrosos 1.69 Química .00 17.7009 32. la media.00 5 Variable Computer Mini. la varianza muestral y el rango. la desviación estándar rnuestral.46 .62 .j A Mean Standard error Median Mode Standard devianon Sample variance Kurtos1s Skewness Ranga Msn1mum Max1mum Sum Count B 13 2.18 3. y Q1 y Q3 (de los cuales se puede calcular el rango intercuartil). MINITAB y Excel también tienen la capacidad de calcular el coeficiente de correlación r.72 .52 .00 Median 16. 5.00 Comunicaciones Calcule r por cada par de años y determine cuáles años tienen mayor correlación.00 Q¡ Q.90 .92 2.r 84 ESTADISTICAEN LOS NEGOCIOS Industria Año! Año2 Textil .81 Maquinaria 1.00 Alimentos 3. La figura 3.7112 -0. entre otras cosas.73 4.17 Gobierno 5. la mediana.63 . 7. la moda.80 1.00 Ma. el mínimo y máximo (que se pueden usar para calcular el rango).ximum 18. La función de estadística descriptiva en cualquiera de estos paquetes de computadora proporciona mucha información útil acerca de un conjunto de datos. Aun cuando cada paquete de cómputo puede calcular estadísticas individuales como lo es una media o una desviación estándar. La salida de estadísticas descriptivas de Excel para los mismos datos de producción de computadoras se ve en la figura 3.mum.43 4.10 Servicios 2.29 3.17 muestra una salida MINITAB para las estadísticas asociadas con los datos de producción de computadoras presentados anteriormente en esta sección.70 2. La salida MINITAB contiene.50 1. la mediana.00 TrMean 13. la desviación estándar muestral.8096 13 5 18 65 5 stoev SE Mean 5.5495 16 N/A 5.5 -1.48 Año3 . La salida de Excel contiene la media.55 . rna11i!llE• Salida MINITAB para el problema de producción de computadoras ifüll.03 2. 3.89 2. Si los datos no están normalmente distribuidos. Los resultados se ilustran en las figuras 3. los hogares con menores ingresos todavía hacen 11 Max1mum 18 12 Sum 774 cantidades relativamente grandes de lavandería y los de ingresos más altos a veces hacen menos 13 Count 50 lavandería.48 minutos.0000 95% de intervalo de confianza para Mu 15. Un examen de los datos y el mínimo y máximo revelan que 100% de los datos en realidad caen dentro FIGURA 3. Este resultado indica que es probable alguna correlación entre los dos conjuntos '.0000 ._Q.78 galones y 19. Según la regla USO DE AGUA empírica.174 2 Standard error que al menos 75% de los tiempos deberían caer entre 2S y 4S minutos y 88.264 7 Kurtosis 0.9% debería caer 16 3 Median 16 4 Moda entre 20 y 50 minutos. La 6 9 Ranga tendencia parece ser que las casas con más altos ingresos hacen cantidades de lavandería 10 M1nimum 12 más grandes. Por ejemplo.20. muchas de las estadJsticas descriptivas presentadas en este capítulo se pueden aplicar a estos datos. el tiempo medio de ciclo de lavado es 3S minutos con una de Excel desviación estándar de cinco minutos. el teorema de Chebyshev deja ver 0.19 de estos límites.19 y 3. La aplicación del teorema de Chebyshev a la media y desviación estándar muestra que por lo menos 88.0000 18. 68% de los tiempos caerían dentro de 30 y 40 minutos.83G' 95% de intervalo de confianza para Mu 1 Media Desviación estándar Varianza Sesgo Curtosis Variable N 15.18 galones.0000 15.233 galones.4800 1. podemos aplicar la regla empírica.CAPfTULo 3 ESTADISTICA DESCRJPTIVA 85 Estadísticas de lavandería Las estadisticas descriptivas presentadas en este capítulo son excelentes para resumir y presentar conjuntos de datos en formatos más concisos.0 95% de intervalo de confianza para Mediana 95% de intervalo de con"ianza para Sigma l.52 -5.723. Si de manera aproximada los tiempos de ciclo de lavado están normalmente distribuidos. La gráfica MINITAB y las medidas de sesgo muestran que los datos están ligeramente sesgados a la izquierda.48 galones con una desviación estándar de 1.3E--01 0.5363 95% de intervalo de confianza para mediana 16. 9S% de los tiempos caeA B rían dentro de 25 y 45 minutos y 99. Variable: uso de agua Estadística descriptiva Prueba de normalidad Anderson·Darling A cuadrado 1. 16.52 6 Sample variance calcula un coeficiente de correlación sobre los datos del Dilema de decisión. No obstante. hfüll¡tiij1.O 1 15. se encuentra r de 0. sin embargo. en algunos casos. La moda es también 16 galones. Con el uso de Excel y/o MINITAB.2329 1.000 MINITAB 12 1 13 14 15 1 16 1 18 17 1 1 J IS. SO 1 Mean 15.0000 1. 1.5 15.0299 15. La media es 16 galones con un rango de 6 galones (12 a 18).598 Valor P 0. El primer cuartil es 15 galones y el tercer cuartil es 16 galones. Estas salidas de computadora muestran que el promedio de uso de agua es 15. no es una correlación perfecta ni es una correlación muy fuerte.7% de los tiempos de lavado caerían dentro de 20 Y.0000 16. Estadística descriptiva Según el Dilema de decisión.531 8 Skewness de datos.233 5 Standard deviation ¿Está la cantidad (peso) de lavandería correlacionada con el ingreso familiar? Si se 1.0000 .9% de las mediciones deben caer entre 11.1296 1 16. la pregunta 1 de las preguntas gerenciales y estadJsticas del Dilema de decisión reportamedidas de agua para SO casas en Estados Unidos.263785 50 Mínimo Primer cuartil mediana Tercer cuartil máxima 12. Algunos ejecuUpodrian pensar que entre más caliente sea el día más personas las rentarén. La media aritmética es el promedio. las medidas de tendencia central son útiles para describir datos porque comunican información acerca de las partes más centrales de los datos. Todoslos derechos reservados en el mundo. no la temperatura. los datos son bimodales.. Si dos valores empatan para la moda. Richard Lamm. Una rae. Además. Los tres cuartiles son Q1.. Las medidas de variabilidad son herramientas estadísticas empleadas en conjunción con medidas de tendencia central para describir datos. que es el cuartil más bajo. ya que tienen vacaciones por lo general en verano en casi todos los paises cuando las temperaturas son mú álidas. que es el cuartil de en medio e igual a la media. las medidas más comunes de tendencia central son las tres m: moda. •Ala L Ollm. los percentiles y cuartiles son medidas de tendencia central. de variabilidad y medidas de forma. Por ejemplo. lo cual significa que se requiere de 99 percentiles. la media pocii:4• desordenadamente grande o pequeña debido a valores extremos. Del mismo modo. Los percentiles dividen un conjunto de datos en 100 grupos. Dow Iones & Company. las medidas de variabilidad dan una descripción de datos que las medidas de tendencia central no . A. y Q3. Q2. mediana y media. La mediana es el término medio de un conjunto ordenado de números que contienen un número impar de términos. la audiencia no tendrá nociones de la variabilidad de los datos. es mejor uaar cua&esquiera medidas que sean neceíarias para presentar una imagen "completa" de los datos.la mediana es el promedio de los dos términos medios. La realidad es que lo hacen cuando los estudiantes salen de vacaciones para evitar que dejen de asistir a la escuela. las medidas de tendencia central y medidas de variabilidad se calculan de manera diferente para datos no agrupados y agrupados. Para un conjunto con número par de términos.The Wall Street Journal. la~ ele la media impide una imagen que incluya estos valores. Esta característica hace de la mediana una medida más útil y apropiada de ubicación al reportar elementos como son el ingreso. puede ser que el calendario escolar sea el que provoque que las furgonetas se renten. Los conjuntos de datos pueden ser multimodales. El uso de la moda puede causar qpe el receptor de la información se concentre sólo en valores que ocurren con frecuencia. ~ores no éticos podrian tratar de presentar sólo la medida descriptiva que lleve la imalJl!D ele los datos que desean que la audiencia vea. la moda es el valor que se presenta con rnás frecuencia en un conjunto de datos. Los cuartiles dividen datos en cuatro grupos.CONSIDERACIONES ~TICAS UD cuerpo ele datos a una audiencia. "l'llople l'atleml/Odds and !!neis·. El ex gobernador de Colorado. No es profaiooal ni ~ sacar conclusiones de causa y efecto sólo porque dos variables están n:lacionadas.lnc. si un investigador presenta sólo la media. B 1 Rcimprno con permlle 4e 1" . Una mediana no resulta afectada por la magnitud de valores extremos. SlrM """"'1l O 1992. además.ha de calor en enero no necesariamente genera más rentas. La media poblacional y la media muestra] se calculan de la misma manera pero se denotan con simbolos diferentes.. edad y precios de casas. p. Una fuerte correlación no necesariamente indica causa y efecto. Al limitar las medidas descriptivas ~ el iimstigador de negocios puede dar a la audiencia sólo parte de la imagen y puede 8C9f la forma en que el receptor entienda los datos. "• Es más probable que las personas lleguen a este tipo de conclusión si los investigadores dan estadísticas descriptivas incompletas o confusas. la moda se emplea en negocios para determinar tamaños. La fórmula (n + 1)/2 especifica la ubicación de la mediana. A la media aritmética la afecta cada valor y es influenciada por valores extremos. en cambio. RESUMEN Las medidas estadísticas descriptivas incluyen medidas de tendencia central. Por ejemplo. se menciona como autor de la frase de "los demógrafos son académicos que pueden demostrar estadísticamente que el promedio de personas en Miami nace cubano y muere judío . La media aritmética se utiliza mucho y por lo general es lo que los investigadores citan cuando usan la palabra media. suponga que el número de furgonetas rentadas aumenta con la temperatura. Entre otras cosas. los investigadores 4!ticos usarAn cualquiera y todos los métodos que presentan la imagen más informativa y más completa posible de los datos. 29 de )UDIO de 19'12. Por tanto. que es el cuartil superior.l menos una medida de variabilidad suele ser necesaria cuando menos con una medida de ~ central para que la audiencia comience a entender q~ aspecto tienen los datos. Según el teorema de Chebyshev. Este valor va de -1 a +l. La varianza es el promedio del cuadrado de desviaciones alrededor de la media. estas medidas son sólo aproximadas para datos agrupados porque los valores de los datos reales sin procesar son desconocidos. Dos medidas de forma son el sesgo y la curtosis. La raíz cuadrada de la varianza es la desviación estándar. En general. el cuartil inferior y el cuartil superior. Una distribución alta y delgada se conoce como leptocúrtica. La correlación bivariada puede lograrse con varias medidas diferentes. Estas medidas incluyen la media. Una medida de sesgo es el coeficiente de Pearson. TÉRMINOSCLAVE birnodal desviación estándar medidas de tendencia central coeficiente de correlación ( r) medidas de variabilidad regla empírica coeficiente de sesgo desviación media absoluta (MAD) rango intercuartil mesocúrtica sesgo coeficiente de variación ( CV) gráfica de caja y bigote moda suma de cuadrados de x correlación leptocúrtica multimodal teorema de Chevyshev cuartiles media aritmética percentiles valor z curtosis mediana platicúrtica varianza desviación desde la media medidas de forma rango . dado como porcentaje. Es la diferencia entre los valores más grande y más pequeño. La curtosis es el grado de apuntamiento de una distribución. aplica a cualquier distribución. existe poca o ninguna correlación. Puede dar información acerca del sesgo y resultados aislados. La regla empírica aplica sólo si los datos son una distribución en forma de campana. tiene utilidad limitada. rango intercuartil y coeficiente de variación para datos no agrupados. Una de las medidas más elementales de variabilidad es el rango. La regla empírica y el teorema de Chebyshev son enunciados acerca de las proporciones de valores de datos que están dentro de varias veces la desviación estándar desde la media. Es especialmente útil para comparar desviaciones estándar o varianzas que representan datos con medias diferentes. El teorema de Chebyshev también delinea la proporción de valores que están dentro de un número dado de desviaciones estándar desde la media. desviación media absoluta. La parte sesgada de la gráfica es su parte larga y delgada. de Pearson. Es igual al rango de 50% de los datos. La desviación media absoluta da la magnitud de la desviación promedio pero sin especificar su dirección. Para valores r cercanos a cero. sin embargo. Una distribución plana es platicúrtica. El rango intercuartil es la diferencia entre los cuartiles tercero y primero. y una distribución con un apuntamiento más normal se dice que es mesocúrtica. y prácticamente todos los valores están dentro de tres desviaciones estándar de la media.1 es una correlación negativa perfecta. Noventa y cinco por ciento de todos los valores están dentro de dos desviaciones estándar a cualquier lado de la media. moda. pero hav creciente interés para el uso de MAD en el campo de pronósticos. dos o tres desviaciones estándar de la media para un conjunto de datos. Una gráfica de caja y bigote es una representación gráfica de una distribución. está alargada en una dirección o la otra. Se emplea con mayor frecuencia que la varianza como medida independiente. Aun cuando el rango es fácil de calcular. La desviación media absoluta (MAD) se calcula al promediar los valores absolutos de las desviaciones desde la media. En este capítulo se presenta sólo un coeficiente de correlación: el coeficiente de correlación. al menos 1 1 / k2 valores están dentro de k desviaciones estándar de la media. Algunas medidas de tendencia central y algunas medidas de variabilidad se presentan para datos agrupados. r. La desviación estándar se comprende mejor al examinar sus aplicaciones para determinar en dónde están los datos en relación con la media. La varianza se utiliza ampliamente como herramienta en estadística pero se emplea poco como medida independiente de variabilidad. desviación estándar. De acuerdo con la regla empírica. El sesgo es la falta de simetría en una distribución. La gráfica se construye al usar la mediana. El valor z representa el número de desviaciones estándar que un valor está desde la media para datos normalmente distribuidos. También es una herramienta muy usada en estadística. aproximadamente 68% de todos los valores de una distribución normal están dentro de más o menos una desviación estándar de la media. El coeficiente de variación es una razón entre una desvíación estándar y su media. varianza. La regla empírica revela el porcentaje de valores que están dentro de una. La des+iación media absoluta tiene uso limitado en estadística. la otra variable tiende a decrecer. Estas medidas incluyen el rango. varianza y desviación estándar. Un valor r de + 1 es una correlación positiva perfecta y un valor r de . Si una distribución está sesgada.CAPITULO 3 ESTADISTICA DESCRIPTIVA 87 pueden dar: información acerca de la dispersión de los valores de datos. La correlación negativa significa que a medida que una variable aumenta en valor. (E/M)2 11 n-1 Coeficiente de Pearson E/M2 .(y-y)2 (L:xL:y) L:xy---11 .Ex 11 Ex2.(E/M)2 N N Varianza muestra! 52 n-l r= Lx2 .l Coeficiente de variación a=~ CV=~(IOO) µ Lx2 ..(Ex)2 52 5 2 Coeficiente de correlación de Pearson = E(x-x)2 = 11 n-1 -11(x)2 = Ex211-I L:(x-x)(y-y) JE(x-xh:.(EJM)2 N N N Desviación estándar poblacional (agrupada) 5= Ef(M-x)2 = n-1 EJM2 .88 ESTADISTICA EN LOS NEGOCIOS FÓRMULAS Media poblacional (no agrupada) Ex Desviación estándar muestra! 11=-¡:¡ Media muestra] (no agrupada) -x=.(Ex)2 N N a Rango intercuartil !QR Varianza muestra] (agrupada) u=~ Media agrupada Ef(M-x)2 E/M n-1 11agrupada= N 2 = n-1 Desviación estándar muestra! (agrupada) Varianza poblacional (agrupada) a = Q3-Q1 Ef(M-µ)2 EJM2 .(Ex)2 Desviación media absoluta MAD= Elx-µI N E(x-µ)2 Ex2-11(x)2 11-I Teorema de Chebyshev N Ex2_ (Ex)2 l-- N u2 11-I 5= Varianza poblacional (no agrupada} u2 11 5= 1 k2 N Valoresz Ex2 -Nµ2 N Desviación estándar poblacional (no agrupada) x-µ z=-u a=J. Si el lector modifica los datos en esta forma. según el Petroleum Intelligence Weekly. Utilice estos datos poblacionales para calcular la media y la desviación estándar. Para reescribir las respuestas y que sean correctas para los datos originales.. . el rango intercuartil y el rango para estos datos. Intel es un cercano segundo lugar. 11 388 11 019 AFLAC 6 796 6 552 6 498 6101 5 563 5 414 5 390 5 033 4 541 Diebold McDonald's Coca-Cola Lucent Technologies Home Depot Clayton Homes RPM Cisco Systerns Promedio de circulación Periódico Calcule P10. Suponga que para una muestra de 30 hogares seleccionados. mediana. cuartiles inferior y superior y rango intercuartil para estos datos. moda. Compañía ExxonMobil Royal Dutch/Shell China Petrochemical Petroleos de Venezuela SaudiArabian Oil BP Amoco Chevron Petrobas Texaco Petroleos Mexicanos(Pemex) National lranian Oil Capacidad (miles de barriles pordia) 6 300 3 791 2 867 2 437 1 970 1 965 1661 1 540 1 532 1 520 1 091 a. Q. de nuevo mueva el punto decimal a la derecha seis lugares en las respuestas. puede ahorrarse trabajo si se modifican los datos moviendo el punto decimal seis lugares a la izquierda (por ejemplo. mediana. .49 Editor & Publisher lntemational Yearbook publicó una lista de los principales 10 periódicos de Estados Unidos. Para la siguiente lista de las acciones más cotizadas en clubes de inversión.50 Mostramos las compañías con mayor capacidad de refinación de petróleo en el mundo. como se muestra aqui. Supongamos que una muestra de 40 familias mostró la edad de la primera persona registrada en la siguiente forma: 42 29 3( 38 55 27 28 33 49 70 25 21 38 47 63 22 38 52 50 41 19 22 29 81 52 26 35 38 29 31 48 26 33 42 58 40 32 24 34 25 l8 Según la National Association of Investment Clubs PepsiCo es la acción más cotizada en los clubes de inversión. Q3. rango. P30. ya que cuenta con l 388 clubes que poseen acciones de PepsiCo. Número de clubes que poseen acciones PepsiCo Intel Motorola Tricon Global Restaurants Merk &Co. Las cifras son los promedios de circulación diaria de lunes a viernes. P90.Pso' Q¡. 1 --¡ 4 880 se convierte en 1.seguido de Motorola. Como los números son grandes.CAPITULO 3 ESTADISTICA DESCRIPTIVA 89 ROBLEMAS COMPLEMENTARIOS aleulo de estadísticas -16 En el censo de Estados Unidos en 2000 se pidió a cada familia informar respecto a las personas que vivían en cada hogar. Utilice estos datos poblacionales y conteste las preguntas.47 En el censo de Estados Unidos en 2000 se pidió la edad de cada persona. rango y rango intercuartil.77488). P60. calcule la media. el número de personas en cada una se reportó como sigue: 2 3 2 6 4 2 3 2 2 4 2 5 2 3 2 8 3 3 2 2 2 3 Calcule la media. ¿Cuáles son los valores de la media v la ~ Compare las respuestas y exprese cuál 'prefiere como medida de situación para estos datos y por qué. Compañía 3. 9 863 9 168 8 687 Wall Street Journal USA Today New York Times Los Angeles Times Washington Post (New York) Daily News ChicagoTribune Long lsland Newsday Houston Chronicle Dallas Morning News diaria 1 762 751 1692666 1 097 180 1 033 399 762 009 704 463 661 699 576 345 546 799 495 597 3. la media y desviación estándar resultantes serán correctas para los datos modificados. Q3. 00 es considerablemente diferente que una desviación estándar de $5.55 Los analistas financieros gustan de usar la desviación estándar como medida de riesgo para una acción.5 años. los investigadores de mercado necesitan concentrarse en las edades de los radioescuchas atraídos a formatos particulares. Calcule el coeficiente de sesgo de Pearson para estos datos.menor 3~ menor 35. Cuanto más grande es la desviación en el precio de una acción con el tiempo.00 por acción y mostró una desviación estándar de $5. ¿entre cuáles tiempos estarían 68. antiguas.00. Cuando se pidió informar cuántos empleados trabajan ahora en su operación de ventas por televisión.5 años.7 años y la media es 7. 3. Suponga que la desviación estándar de tiempo empleado en el trabajo es 27 minutos.7% de las cifras? b. Calcule el coeficiente de Pearson y comente Número de empleados que trabajan en ventas por televisión sobre el sesgo de esta distribución. Calcule la media.menor 5~ menor de 20 de 25 de 30 de 35 de 40 de 45 de 50 de 55 . Por ejemplo.7% de los tiempos son entre 1 y 14 años. country y western. Supongamos que la acción Y cuesta un promedio de $84. 95 y 99. 3. En esta situación. Los formatos para el radioescucha incluyen música contemporánea para adultos. una desviación estándar de $5. Al estudiar audiencias. ¿Cuáles son la media y edades modales de radioescuchas de mayor edad? b. No obstante. varianza muestra! y desviación muestra! estándar. Supongamos que un investigador de mercado estudió una muestra de 170 radioescuchas y estaciones de música antigua y obtuvo la siguiente distribución de edades. Supongamos que la acción x cuesta un promedio de $32.56 La Polk Company reportó que el tiempo promedio de un auto en las carreteras de Estados Unidos recientemente es de 7 . Calcule la desviación estándar para estos datos. ¿aproximadamente cuál porcentaje de los tiempos estaría entre 359 y 479 minutos? a. Si 99.53 Una agencia de investigación realiza un estudio demográfico a 90 compañías de ventas por televisión para determinar el tamaño de sus operaciones.57 Según un informe de Human Resources. las mejores 40. b.40 en los últimos 60 días. ¿Cuáles son la varianza y desviación estándar de las edades de radioescuchas de mayor edad? 3. considerando el potencial de una mayor desviación estándar de precio. Si la distribución de tiempo empleado en el trabajo tiene aproximadamente la forma de una campana. clásica y jazz.90 ESTADISTICA EN LOS NEGOCIOS e. rap.S. álbumes de rock. b. Department producción 10 principales bustible of the Interior de minerales. desviación media absoluta.54 Determine el coeficiente de correlación de Pearson para los siguientes datos. mediana y moda. c.45 en los últimos 60 días. Calcule el rango. d. Valor (millones de dólares) California 3 350 Nevada 2 800 Ar izo na Texas Florida Michigan Georgia Minnesota Utha Missouri 2 550 2 050 1 920 1 670 1 660 1 570 1 420 1 320 Número de compañias 32 16 13 10 19 a.menor 2~ menor 25. X Y84 1 10 9 6 457 5 3 2 9 Pruebe sus conocimientos Frecuencia 3.00 por acción y mostró una desviación estándar de $3.menor 4~ menor 45. Calcule la media y moda para esta distribución. 3.51 El U. El analista de la agencia organiza las cifras en una distribución de frecuencias. los precios promedio de algunas acciones son considerablemente más altos que el precio promedio de otras. ¿Entre cuáles valores caerían 95% de los tiempos ? a. Utilice el coeficiente de variación para determinar la variabilidad para cada acción 9 16 27 44 42 23 7 2 3.00 en una acción de $10. 3. Si la forma de la distribución de tiempos se desconoce. mayor es el riego de invertir en la acción. a.52 El mercado para quienes escuchan música por la radio es diverso. rango intercuartil.00 en una acción de $40. estados en Estados Estado publica A continuación de producción ~menorde20 2~ menor de 40 4~ menor de 60 6~ menor de 80 8~ menor de 100 cifras sobre aparecen mineral los no com- Unidos. un trabajador en los paises industrializados pasa un promedio de 419 minutos al día en el trabajo. Supongamos que la distribución de tiempo de los autos en las carreteras es aproximadamente en forma de campana. las compañías dieron respuestas que variaban de 1 a 100. Edad 15. un coeficiente de variación podría dar intuición sobre el riesgo. Dibuje una gráfica de caja y bigotes. ¿cuál es la desviación estándar de tiempos? Suponga que la desviación estándar es 1. 3 42.4 63. publicadas por el World Almanac: Pals Albania Bulgaria Croacia Alemania Hungría Polonia Rumania Bosnia y Herzegovina PIB per calpita (USS) 1 650 4300 5 100 22 700 7 800 7 200 3900 1 770 a. LA Puerto de Plaguemines. los 20 principales puertos de Estados Unidos. CA Norfolk Harbor.0 69.45 Calcule el coeficiente de correlación de Pearson para determinar la intensidad de la correlación entre estas dos variables. Comente sobre la intensidad y dirección de la correlación. Calcule la media y desviación estándar para Hungria.9 51.5 45.93 4.60 ¡Qué tan fuerte es la correlación entre la tasa de inflación y los rendimientos de bonos a 30 años de la tesorerla? Los siguientes datos publicados por Fuji Securities se dan como pares de tasas de inflación y rendimientos de bonos de la tesorería para años seleccionados en un periodo de 35 años: Rendimiento de bonos Tasa de inflación a 30 años 1. ¡Hay resultados aislados? d. Utilice un coeficiente de variación para comparar las dos desviaciones estándar. ¡cuánto y por qué? ¡Cuál de estas medidas de tendencia central utilizaría usted para describir estos datos? ¡Por qué? 3.25 5. Rumania y Bosnia y Herzegovina.4 42. Las siguientes son cifras de PIB per cápita para ocho de estos países europeos. . seguido por el Deutsche Bank. TX Ba ton Rouge. ¡Cuáles son ellos y por qué piensa usted que son resultados aislados? 3. LA Corpus Christi. Construya una gráfica de caja y bigote para estos datos. TX Nueva York. NY y NJ Nueva Orleáns. clasificados por tonelaje total (en millones de toneladas) fueron como sigue: Puerto Lousiana del Sur. LA Ciudad de Texas. TX Mobile. c. de los costos de viáticos en Moscú están entre S3íl y $459. PA Baltimore.25 9.CA Valdez.AK Pitsburgh.05% 3. el salario promedio anual de un trabajador en Detroit. Francia. empresarios estadounidenses necesitaban una mejor idea del mercado potencial de esa región. LA Houston. El resul~do de la estadística descriptiva de Excel es una lista dd total de activos variables (millones de dólares] para estos 100 bancos. Si se desconoce la forma de la distribución de costos de viáticos de un agente viajero en Moscú y si 83% . c. LA Long Beach. Calcule la media y desviación estándar para Albania. TX Beamount. Suponga que se desconoce la forma de la distribución de los costos de viáticos diarios de un agente viajero en París.23 2. es $35 748.3 a.7 62.7 87. Michigan. FI Lake Chales.5 50. ¡cuál es la desviación estándar? Interpretaciónde salida 3.68 6. analícelos y describa con sus propias palabras lo que puede deducir de los activos. Cuando empezaron a abrirse nuevos mercados. Estudie la forma de la distribución desde la gráfica.4 52. Estos datos reportan que el promedio de viáticos diarios para un agente viajero en París.62 3. ¡Cuál es el valor de la desviación estándar? El promedio de viáticos en total para un agente viajero en Moscú es $415.3 40. es $349. MN y WI Los Angeles.27 8. MD Total de toneladas 214. Trate los datos como poblacionales.63 American Banker compiló una lista de las principales 100 compañías banqueras del mundo según el total de sus activos.AL Duluth-Superior. Croacia y Alemania. 3. Bulgaria.57 8.3 37.2 158. Suponga que un trabajador pasa 400 minutos en el trabajo.5 60. Polonia.61 De acuerdo con el US Army Corps of Engineers. Suponga que la mediana del salario anual para un trabajador de este grupo es $31 369 y la moda es $29 500. VA Filadelfia.53 7. ¡Cuál seria el valor Z y qué le dirfa al investigador? l.17 4. pero que 53% de las cantidades por viáticos están entre $317 y $381. ¡Está sesgada la distribución de salarios para este grupo? Si es así. b.57% 2.58 Durante la década de 1990. Encabeza la lista el Bank of Toho-Mi15Ubishi.01 10.9 53. PA Tampa. b.8 39.27 12. se esperaba que los negocios mostraran mucho interés en paises de Europa central y oriental.59 Según la Bureau of Labor Statistics.5 78.62 Runzheimer International publica datos sobre costos de viaje de negocios en el extranjero.8 133.00 4. 3.CAP(TUWJ ESTADISTICA DESCRIPTIVA 91 c.7 49. .1!132 15 ütadlttica detcriptiva 9.66 La Compctith"' Media Reporting and Publishm lnformation Bureau compiló una füta de 10) principales 25 anunciante.a Tn= . lnc.' los mis grandes empleadores. en Estado> Unid°' p. propW. 3 Standard enor Mecloan 5 Mode Standard devlat>on 7 Slmllle vanance Ku:IOS<S 8 Skewness 10 Rango 11 Mn:mum 12 Maiamum 13 Sum 14 Counl dantes del mercado hts¡WtO. E&tudie esta d resultado y resuma los gutos de los 25 principales anuncimto.1851 50 .w59S8 723681 ~túimo 22269)4 {[]- 35 25 .mz¡g 84331Ml 41 l.l • • l.mS6 • 1 1400000 Princi~2S~ 1 2 ~DODOD .: lOS l'-'EGOCIOS .8S60 :U.anil múimo 9~ ck intcn'IJo ck confimu pan IA 6. p¡)abr»: Vuül>k Top2H s 9480.50 S. 1833271304 2 Mean 1 1 10 1 1 -136067 QI 484600 87213 Q2 .. A 1 1 TopWootdBenb 2134oon Mean 12972 00 Standard error 1&CS73 Med:an NIA Mode 129720 Standafd dovia:'°" ~VIN!IC:e 16827278273 KurtOS13 105 118 Skewness Ranoe 615029 76891 Mnrnum E!l1920 Maxmum 21349677 Sum Count 100 2 .825C 1.HH:>C 15767( 13!>Wt 64302 COO! 413481027! 0. de publicidad para cada compaAb (en miles de dólares) ~analizó con la función de estadisueas dncriptivu numéricas de Mf:-:ITAB }"$U función de gráfica de caja.-.t2S 4.92 ESTADISTICA E. A ..ira estas compañlas .1 • 1 ~ E"'lllOYen Oublde of the Unlted s-l. Con d estudie de los resultados realice un anili· sü con lo que ha aprendido aceres del numero de empleados p.6214 17.5288 Top 2SA ~· 1 400000 1 1 1 1 s 6 1 7 1 1 8 1 1 9 1 25 712i02 6IJ82J ~tinimo .las.f6 di. Estudie los resultados y describa Jos pstos di.is N Mlnimo PrimaawtiJ median.:u. al~ 7 S60 5..2996 2561()j 12589. con su.64 Hispanic Business.625 40.ilo reciente. compiló una lista de los principalc:s anunciantes que cuhivan d mercado hispmo.ira un a.. A comlnuacién apam:m estos datos.64SS ). Estos datos (míllonn di.65 En ti mundo I<' encuentran numerosas y grandes compar. amba> K muestran a continuación. con oficinas matrices fucra de Estados Unido»..75 8.00 Scsp> Cunas. El número de empleados rara .' t'StOS ~ anun\"ariahk:~ Media Dnviación~ \'uunz. K' anJlizó con la función de otadl$lica descriptiva de Excel.' dóbm) K' introdujm>n en una hoja de alkulo Ml~ITAB y K' analiuron mediante b función de t'Swlistica dcsaipm-a grifica. 3 • • 5 7 8 10 11 12 13 . El total de guto. ). I 200. Como los llena· dos de la. Calcule el coeficiente de variación para cada tipo..li poderosa y efectivamente utilice el •ÍStcma de distribución mas eficaz y penetrante del mundo. Census.8 onzas) en \'olgogrado. Diet Coke.li de mil millones de Coca-Cola.. Payroll Expenditures (ga•to• de nómina) y Personnel (personal) para la base de dato• del hospital. Sprite. 4. Otra es que fuera de E.1 200. variabilidad y sesgo. Algunas botella) pueden contener mb liquido )'otras menos..b f. muestrea 1 SO botellas y las pruebas en cua::::o ~ &s.2 200. Suponga que los siguientes datos son las mediciones de llenado de una muestra al var de SO botellas.2 200.u de Coca-Cola.icil a medida que caen barreras politica> y se superan dificultades de transporte.2 200.1 199. Cn labon:onci.9 199. Rusia. La botella .2 200.jon.3 199. razones es que e•tá aumentando el ingreso desechable. un promedio de m.4 199. Considere medidas de tendencia central. productos de Coca-Cola se consumen en todo el mundo.3 200.CAPmJlO J ~TA. Los multado.f 200. Coca-Cola empicó 25~ de crecimiento por volumen en Rusia.0 200. culturas y noticias alrededor del mundo crea oportunidades de mercado. Todos los días. la compañia piensa que continuará creciendo internacionalmente. Una de esta.9 200. variabilidad y sesgo. la compañia tiene el sistema de producción y distribución más grande del mundo para bebida> g3SCOi3> y vende más del doble de refrescos que su m. ¿Cuál es la medía de ?\e\\· Capital Expenditures? (Cuál es la mediana de 'ew Capital Expendilures? ¿Cuando compara la medía y la mediana cuál es su análisis! 2.9 200. ¿Cuálc• variables tienen mayor correlación y cuáles tienen menor? CASO: COCA-COLA SE HACE PEQUEÑA EN RUSIA la Coca-Cola Company es el vendedor número uno de bebida> gaseosas en el mundo. Análisis l. Con la base de datos financiera estudie Eamings per Share (ganancias por acción) para Tipo 2 r 7 (compañias de productos químicos y compañia> pttroquimicas).920 Mediana 20.8 2.003 Q. Suponga que otra planta de Coca-Cola e<.4 199.8 200 .t. volumen de limado.003 Variable Botella F ::-\ 150 Variable Bottlla F Mtnimo 19.e vende en 12 cenuvos.2 200.I 199.6 199. Por varias razone>.3 200. Para la base de datos del mercado de acciones "describa" la variable Dollar Value.7 200. el mundo cs más joven.4 199.8 199.o junio de 1999 Coca-Cola Rusia introduio una botella de Coca-Cola de 200 mi (unas 6. compare l~~ dos se ve.6 200. Fanta y otro.9 200. F.3 199.2 199. botella son poco comunes.I 200. Ourpatient \'isih. Utilice la base de datos de manufactura. Births (nacimiento ).in de la especificación de 200 mililitro>. Parte de la 11U>ión de la compañía o para que Coca-Cola mantenga la marca m.6 199.3 200.9 200. u~ la base de dato' de hospital para construir una gráfica de caja y bigote para nacimientos.2 199. lnclu}-a medidas de tendencia central.5 199. Debido a la variabilidad de maquinaria para embotellar es probable que cada botella de 200 mi de Coca-Cola no con- tenga exactameme 200 mi de liquido.i trabajando el proceso de embotellado? 200..b cercano competidor.5 200. Admj. de las estad cripti''ll> se obtuvieron en MTNlTAB y Exccl EsaCa breve resumen para los supervisores acerca dd Estadlsticas descriptivas: llenado de botellas Media 20.6 200.9 199. Esta estrategia fue exitoq para Coca-Cola en otros paí~. Produzca una matriz de correlación para l~ variables Beds (camas].7 200. que la hace accesible a casi todo>.9 199.1 200. Pensando en instalacicne» de ho pitales y obstetricia comente por qui! la gráfica de caja y bigote puede verse corno l.005 ~táximo 20.6 200.tados Unido• y Europa.5 200.7 200. Otra ra1ón es que compartir ideas. Utilice las t«nica> presenta· da. en una campaña para vender Coca-Cola a sus clientes más pobres.. Con base en este analisis.4 199.985 Desvíadén cstáncW 0.~ en este capitulo para describir la muestra. incluyen· do un aumento de 18% en ventas de caj. Los producto de Coca-Cola se venden en mas de 200 patsb en el mundo. Además. .al azar. En 2001. . ¿Qu~ encontró? 3.DbTICA DESCIUl'JlH 3 ANÁLISIS DE LA BASE DE DATOS eoeficientes y comente.090 TrMtdia 20. 19. un ingeniero de producción desea probar alguna> de la\ botellas de lo> primeros lotes de producción para determinar qué tan cerca e>t. Total Expenduures (gasto• totales).S 199. lle· gar a mercado> mundiales o m. India por ejemplo.8 200.6 200.0 201.2 200.i llenando hoce- Uas tradicionales de 20 onzas de líquido.02. ¡cómo cst. coa-<Ola. ttcnia> presentadav en este capuulo. Haga clic para leyendas en la primera fila. . cstad1sti~ descripti''OI> presentadas en este capuulo mediante el uso del comando De-criptive Smi>ti~.~de lntm-.:uní.nz. a1 hU¡rJi-. Est•disticu dncriptivas Excd puede tener acceso a '"ria. Avis Adjun 111 Ruui. eo<a·<Ola. USO DE LA COMPUTADORA EXCEL Excel puede analiur dato> al usar varia.. p.0071 0..0300 200091 ~lcdWia S.hunl El inform< anual 2001 dt Tbe <:oa·Cola Company w . ~ importante hacer clic en la caja de Summary Stltistics que e>t~ en la parte inferior izquierda para que Excel mdu)'a un amplio rango de medidas descriptivas. adaptado dr "Cokr. de la. Comience por seleccionar Jools de la barra de menús Excel.C>l 1 199200 19...html.Wda de Eiicd 1 per1 Mu .. Adwrr111n1 Aft..015 -0085 o 170 1992 20090 3000416 150 Fuente.Viaclón mandar V1ríena Sesgo Curtosis V1ri1ble N 199! 1 IY9S 1 IY. En el menú descendente seleccione J2ata A.Jo& <. Haga clic '' lo dato> 50n agrupado> por columna o fila.9977 -.".01598 150 Minlmo Primer cuertil medi1n1 Tercer cuartil m6ximo 20. s11ío \\<b Coca·Cola a1 bnpJ/www.a ~ 1 Bottle ñlls A 2 .01 1 200028 0..00•8 20..<oml imaton/onnualttpottl!OOlfmda. En la aia de diálogo de anafüjj de datos seleccione la opción Descriptive St1tistics lnrroduzca el rango de lo> dato> a describir.000 1 20.romlhom<.010 ' 20...5 Mean 3 SW>dlrd error Med'8ll Mode 6 StandarO devia:ion 7 8 9 10 11 12 13 14 :>ama& vanance Kuttosos Sl:ewroess Ranos M.nornum MalOITIUITl Sum Coon: 95"'.0268 7.de intervalo de confi1nz1 pera Sigma 95% de 1ntervalo de confianza per1 Mediana 20.6E-02 1.005 19. de la.588 V1lor P O 123 Medi1 O.98 1 20. S de julio de 1999.>tiou descriptivas. !S. .09E-O• -8.Variable: llenado de botellas Pruebl de normelidad Anderaon·01rling A cuadrado 0..0208 200898 95% de intervalo de conl11ni1 19 9985 00239 1 !0. Tiene un comando particularmente poderoso que genera muchas C">tadí.nalysis. : 20003 0002 20005 20 004 0027 0001 1.....-2...9851 20. mediana. seleccione Display Descriptive Statistics y aparece una caja de diálogo. Boxplot of data y Graphical swnmary.. Obtendrá una caja de diálogo de t>tad1>lic:u vln procesar que es prácticamente idéntica a la caja de diálogo de c.-ad~ en una fila. Aparece la caja de diálogo column stausucs. Para hacer este.:d tiene un comando Uamado Rank and Percennle que ordena los dato. El proceso se inicia con la selección Je . es capaz de ejecutar mucha.ífui> de dato. entonces el resultado incluirá el tamano muestral. mínimo. y gráfica.1adística. el primer y el tercer cuartil.. & posible encontrar un elemento Row S1atisLÍC> m el menú descendente Cale.alida como la que se muNra en el caso de C:O. E.alida incluye ta. lei. En el menú descendente que aparece. F.u y para lcycn~ en la primera fila. por ejemplo agregar un mulo..i. suma y cuenta. Dd menú descendente. en columna.h adelante en el texto. )CICC· cione Data Analysis. o fil. Seleccione Rank and Pereenríle. 1 . seleccione Iools de la barra de menú de Excel.CAPtn!IO) [' TADISTICA DESCRIPTT\'A 9S El resultado incluye media.I resaltado incluir. Tendrá entonces la oportunidad de hacer clic en una caja que desea trasponer hacia X y l'. Aparece una caja de diálogo de rango y percennl. Para tener acceso a este comando. Grifica de caja y bigo1e ~ povible producir una gráfica de caja y bigote si se selecciona Graph en la barra de menús. Siga los mismos pasos que los empleado.i los elementos que solicite. mediana.. Dotplot of data. una gráfica de caja otra salida que se explicará m. desviación estándar. desviación ~y varianza maestral: ademas. tarra• presentadas en este capitulo. de la. seleccione Basic Stati5tics Del menú descendente de estadísticas básicas. obtendrá una . seleccione el comando !:olumn Sta· tistics. daros esl.-a Cola \Obre ti llenado de botella. \'ariu opcicnes gráficas.ango y pereentil ú. moda. Si usted hace die en QK. . mínimo. MINITAB Ml~ITAB \\'indo-. En ti menú descendente que aparece. ~ dan en la caja de diálogo del fondo. La salida resultante es una gráfica de caja y bigote con un asterisco que representa resuhados aislado>. rango.in ul 1.i de dato• sin procesar. tendrá varias opciones más de salida que relativamente se explican por si solas. IR. lnrroduzca el rango de dato.>.. Introduzca la ubicación de variable en Y.. Seleccione IQRange Box bajo Oispla)'. incluyendo e. Aparece la caja de diálogo de an. percenules. úselo si su. Histogram of data with . una medida de curtosis.Stat en la barra de menús. seleccione Boxplot del menú )' aparecerá una caja de dialogo de boxplot (gráfica de caja. de caja. Estadisticas de columna Las cstadisticas de columna se pueden obtener al sel~ciorur el comando Cale en la barra de menú> ~11!\'TTAB \1 Del menú descendente. e de eliminar la estadistica que usted desea calcular Introduzca la columna con los datos.tad1stica. ~11:-=tTAB da un numero considerable de las técnicas cstadistica. Sin embargo. maximo. . asigna rangos y da salida a lo. lntroduzca el número de columnas que de-ea anali7ar..logo. ~ta .. Si usted selecciona ~raphical summary.oormal curve. seleccione 011tions en la parte inferior de la caja de di. con e•tadi>1icas en columna para obtener una ~id. media. Una opción particularmente útil es trasponer la gráfica dela moda que los bigotes queden paralelos al eje X. funciones bajo QJida tabular más un histograma con datos sobrepuestos ron una curva normal. si usted selecciona la opción Graph . Las opciones incluyen Histogram of data.s men ''"nadas en este capitulo. maxímo. descriprin.stadfsticas descriptivas Mtdiantc el U\O del comando Descripnve Statistics. i::ia de -esgo. Haga die ~i los datos están en columna. con lo cual podrá: 1. Resolver problemas con el uso de leyes de probabilidades. 3. 2. Seleccionar la ley de probabilidades apropiada para usar en la resolución de problemas. 4.CAPÍTULO 4 Probabilidad OBJETIVOS DE APRENDIZAJE El principal objetivo del capítulo 4 es ayudar al estudiante a entender los principios básicos de probabilidad. Comprender las diferentes formas de asignar probabilidades. incluyendo Ja ley de Ja suma. de unión. 96 . conjuntas y condicio- nales. Comprender y aplicar probabilidades marginales. la ley de la multiplicación y la ley de probabilidad condicional. Revisar probabilidades con la regla de Bayes. 5. junto con otras instituciones.íl e la probabilidad de que C$3 persona sea rm er . ¿Cu. ¿cu. Si de una compañía diente >< selecciona al azar un 1rabaiador. A~ y Roben 11. Hoy dla. ¿c:WJ es la probabilidad de que \'il)'il a una mujer dado que ese traba~r es dd área tknica? ¿Es esta discriminación contra trabajadores técnico hombre>' ¿Qu~ úctorcs podrían entrar en la concesión del bono que no sea la selección al aur? 3.Faírnns. ¿Cuál es la probabilidad de que una pcnom profesional sea la ganadora? 4.Igualdad de género en el lugar de trabajo La Ley de Derechos Civiles fue firmada y oficializada en las leyt) de Estado Unido> en 1964 por el presideme Lyndon Johnson. ¿Cual es la probabilidad de que el ganador <ea un hombre o una oficmista' (Cuil es b probabi· lídad de que el ganador sea una mujer y en administración? Supon? que d ?Dador es hom· bre. Uno de ello es el Titulo VII. Foky. MA. Una de las disposiciones del Titulo VII hace ilegal el rechazo a contratar una persona con base en el género de e. Sd«b:¡ ~ dcln.n diariamente Se reunió una pequeña parte de 10> da10> de recursos huma· no> de una compañia cliente.ti es la probabilidad de que el trabajador sea mujer? Si 1 per· sona gerencial se selecciona al azar.ta ley. Si el bono se concede al azar.la sus prácticas de contratación de personal o cómo sabe cuándo están dentro de limites aceptables? '¿Cómo pueden "probar"su caso individuos o grupos que sienten que hao sido victimas de prácticas ilegales de contratación? ¿Cómo puede un grupo demostrar que sus miembros han sido "adversamente impactados" por prácticas discriminatorias de conrratacién de una compañia? Las estadísticas tienen uso generalizado en acciones de discriminación de empleo y por compailias que tratan de satisfacer lo.. Suponga que se ha expresado alguna preocupacién 1(831 porque un número desproporcionado de per-onal gerencial de una compañia cliente son hombre>. POR GENERO Cimero Tipo de posición G<rcnaal Proíc. oqundo cd.ional ncníco Oficini>u Total Masculino Fmimino Total 8 3 11 31 13 4-4 S2 17 69 9 22 31 100 SS ISS Preguntas gerenciales y estadísticas 1. DATOS DE RECURSOS HUMANOS DE UNA COMPAÑÍA CLIENTE.. ( Rtaclin¡.1992).íl es la probabilidad de que sea del grupo técnico] l'Ucntt:: mlorlN(i6n de la UOC aoh¡uda de Riclunl O.Qut factores podrían entrar en la aparente discrepancia entre probabilidades! 2.a persona. ¿cu.. Suponga que a una persona del área técnica se le otorga un bono especial este año.Aplica a todos la. Cantidades importantes de dato> de recursos humanos se anotan y analiu. que está relacionado e pecíficamenre con la discriminación del empleo. Suponga que en una fiesta anual feriada el nombre de un empleado de la compa!tia dit'lltt se sacara al azar para ganar un viaie a Hawai. Adcbso11· \\<dty l'llblishing Company. E. lineamiento de la EEOC. de la Equal Employmenl Opportunity Commission (EEOC) y el Titulo Vil. empleadores con más de 15 empleados.. los procedimiento de contratación de una compañia deben e-otar dentro de la previsión y estructura de los lineamiento. ¿Cómo defiende una compal\. 97 . resultó en vañ0> "utulos" que abordaron la discriminación en la sociedad estadounidense a varios niveles. que fue enmendada en 1972. calcular una ti. a pan ir del valor estadistico. el anafüta realiza el proceso inferencial bajo incertidumbre pero. tomar una muotra de una población. durante qué tiempo. en el Dilema de decisión o comparar varios desgloses de sus empicados (por e1ni. . Buena parte del anáfuü csta®tico n infcrencial.1 INTRODUCCIÓN A LA PROBABILIDAD En el capitulo 1 vuno) la diferencia entre otadistica descriptiva e inferencial.En la industria de la banca. ¿cuále) son lo. Recordemos que la 01adis1ica inferencial comprende.. edad. En el caso de un edificio alto.TADISTICA e: l05 SEGOCIOS En negocio>. o bien.i¡mar una probabilidad de obtener lo) resultados. ¿Cuándo debe cambiarse! ¿Cu. es importante conocer la vida de una parte mecanizada r la probabilidad de que pueda fallar durante cualquier tiempo para proteger a la compañia de fallas mayores.. se puede asignar una probabilidad a la posibilidad de un resultado . La figura 4. por ejemplo la manufactura y la aeroespacial. género. l. Los resultados son dudosos. Supongamos que un inspector de control de calidad selecciona al azar una mue tra de 40 bombi · llas déctric3) de una población de bombillas de marca X y calcula el numero promedio de horas que ilumman las bombilla) de muestra. bs probabilidades se usan directamente en arnas indu.il es la probabilidad de que un sistema contra incendios funcione cuando sea necesario. la industria de seguros utiliza probabilidades en cuadro.a industria de lo. entre otros) a las proporciones de la población general de la cual se contratan empicados.::argos y pagos. En otras industrias. el inspector puede asignar un valor de probabilidad a este estimado.l) adelante en este texto.tadistica 'Obre la muestra e inferir. actuariales para determinar la probabilidad de cienos resultados rara ntablc.ec1os del nuevo presidente para hacer que funcione bien un departamento! rnpuot3) a o~ pre- w gunw son inciertas.1 representa ole proceso. si tiene instalado equipo superfluo? Quienes se ocupan de negocio) deben manejar a diario ~tas)' milo de preguntas semejantes.Este capitulo trata de aprender cómo determinar o asignar probabilidades. al aplicar reglas y lcyc>. mencionado. el espe.tifa satisfacen los lineamientos de la EEOC del gobierno. 4. pro)j. Al comparar las cifras de la compañia con la> de la población general. Como la) bombillas que M! analiun son sólo una muestra de la población.1.unud<• (Oll <1tadiitM «rrobabdidaJ de confianza • ~1unmul1"'°1 . •i continúa. Con el u-o de las técnicas que )C verán m. Probabilidad en el proceso de estadística inferencial Par!m<tro . puede con frecuencia a.b. ¿cu. los juzgados podrían estudiar la. probabilidado de una compañia que al azar contrata cieno perfil de empicados de una población dada. t:na manera de determinar si las práctica) de contratación de una rompa. el numero promedio de horas que iluminan las 40 bombillas puede o no estimar con predsién d promedio para todas 13) bombillas de la población.emplo.18 ."ialista estimad número promedio de hora) que iluminan a la poblaá6n de bombillas eléctri(3) de marca X a partir de: esta información muestral.. [email protected] o la probabilidad de que b válvula funcione mal dentro de la semana siguiente? . Por ejemplo. del parámetro correspondiente de la población. En muchas de estas suuaciones.triL' y aplicacione industriales. Al aplicar las k)n presentadas en este capítulo. Por t. jucgoo emplea valores de probabilidad para esubleeer . r la probabilidad o la base para la cstadi)tka inferencial.:n tarifas especíñcas y coberturas.98 e. Como gran parte de olas pregunta) no timen respuestas definidas. la mayor parte de la toma de decisiones involucra la incertidumbre. la toma de decisícnes se basa en la incertidumbre. Adcmú. un gerente de operaciones no sabe si una \'álvula de la planta va a funcionar mal o continuar funcionando. La razón para hacerle a)í es que el valor del parámetro e) desconocido: debido a que es desconocido. para asignar probabilidade.t> de N resultado> de la población podnan po-iblemente tener atributo t). resultados de las. que es 1111 pro.J. seguro que el evento ocurra. MtTOOO CUSICODE A~IG~ PROBABILIDADES P(E)= 11.h alto de cualquier probabilidad es l. Si ninguno de lo. si una eornpañta tiene 200 trabajadores y iO son muieres.. están diciendo que la probabilidad de para mañana e' . nunca puede ser mayor que 1' (no m.. propias no negativas o valores decimales no nrptm>5 menores o iguale> a 1. 2) el método de frecuencia relativa. y 3) probabilidado subietiva< l. con el metodo clásico. se ba.) y el número de elementos de la población (N).se putdtn determinar ante» dtl experimento.V re uhado Por ejemplo.n't!:t:l oaun6 tn ti pasado di1·idido entre el 11úmm1 rora/ de oportunidades para qut ocu"ª· . valores de probabilidad se pueden convenir en porcentajes <i se multiplican por 1 l.iquina A siempre produce 40% del numero total de este producto. la probabilidad de que ocurra un evento se determina como la razón entre el numero de elementos de una población que contengan el evento (11. Como 11. e. la probabilidad" a \ O. la probabilidad de seleccionar al az. la~ probabilidades son fraccione. a:a=xlo pronostican 60% de probabilidad de Uu\·ia para matlana. N donde N • número total posibte de resultado. Si la probabilidad de que ocurra un resultado es 1. e. Cuando asignamos probabilidades con el uso del método clasico.:aoqut produc« rcs11/111dos. RA.60. las probabilidades se pueden determinar a priori.\'. tres maquinas fabrican un determinado producto.04. Por e¡rmplo. el valor m. y un evento.ar una muieres 70/200 = .35. La probabilidad m. la probabi/.m meteorólogos reportan a \'CCe~ probabilidades del clima en forma de porcentaje. de un experimento 11. • el número de re ultados en los que el evento ocurre de . Con este método. esto es. Diez por ciento de los aruculos producidos por la maquina A son defectuoses.CAPITULO 4 PROl!ABIUIW) 42 99 MÉTODOS PARA ASIGNAR PROBABILIDADES tres métodos de asignar probabilidades son l) el método clásico.t> pequeña posible es O. Si los productos terminado> se mezclan bien respecto a cuál máquina los produjo y <i uno de esto• producto> se selecciona al azar. Esto es P(E) = n. el método se conoce como método clásico de asignar probabilidades Este método comprende un experimento. un resuhado de un experimento. en una planta en particular.()) Método clásico de asignar probabilidades Cuando se asignan probabilidades con base en leya y reglas. y es -eguro que el evento no ocurra. Por ejemplo.\" posibilidades tiene la característica deseada. el método clasico de asignar probabilidades nos dice que la probabilidad de que la pieza ha1-a sido producida por la maquina A y este defectuosa es 0. La m. Frecuencia relativa El método de frecuencia rclaLi~-.ufde qut ooum 1111 event» o ig1111/ al 11úmco dr •-rus que. Esta probabilidad se puede determinar incluso antes que la pieza ~ muestreada porque..1. Lo.'iGOOE PROBABWDADES o ::5 P\El ::5 1 Entonces.i en datos hmóricos acure:cbdos. que c. 4. La probabilidad subjetiva también puede ser una forma potencialmente útil de aprovechar la experienda. los médicos a. que pueden ser analizado. de registros de la compañta mue tran que en el pasado el proveedor em·ió a 13 compal'lla 90 lores y lo. Les datos reunido. Experimento Como ya ~ diio antes. Por ejemplo. la probabilidad por frecuencia relativa para el embarque posterior cambiarla a 11/91 • . asignar una proba· bilídad lógica de que un avión en panicular tendrá cieno tipo de dificultad mecánica. La probabilidad subjetiva se puede us.ECUEl\ClA IWATIVAOE OCUJl. tiene conocimiento de la política árabe. La estructura de la pro· babilidad proporciona un marco común dentro del cual se pueden explorar los temu de probabilidad.3 ESTRUCTURA DE LA PROBABILIDAD En el e tud10 de probabilidad o útil crear un lenguaje de término y simbolos. • Muestrear una de cada 200 botellas de salsa de 1omate de cierta linea de producción )'pe. con cáncer y medir su mejoría. Ejemplos de experimentos orientados a negocios. pero en otras la probabilidad <ubjeti\-a puede potencialmcnte dar probabilidades pre<:1>as. y gerente. en la acumulación de conocimiento. en lo libro. experimentados en la toma de decisiones. Por el método de la frecuencia relativa de ocurrencia. el método subjetivo e>tá basado en oca. un método científico aplícado a la probabilidad.. un ~rimcnto es 11n proctse q11t produo: m11/1ados.. rcchaz. la probabilidad de que los inspeetores rechacen el siguiente lote c. inspectores rechazaron 1 O de ellos.tá basada en reglas o leyes sino en qué ha ocurrido en el pasado.ione. Un director que ha programado muchos de estos embarque. A vece. • Auditar una de cada 10 cuenta.12.REl\CIA La frecuencia relativa no c. ·rodo s11bjtllll() dt asignar probabilidad ará basado en la imprtsi6n o inruiciJn de la person« que drtmnma la probabilidad. Aun cuando no c. Un mecánico experimentado de una aerolínea puede. Probabilidad subjetiva El .1r para capitalizar con base en los antecedente de rrabajadore. .11 Si el siguiente c. conocimiento e intuición de una persona y usar todo esto para pronosticar la ocurrencia de algún evento. de cad. estadísticameme. y ademá> c.t mes durante 10 anos. La probabilidad subjetiva proviene de la intuición o razonamiento de la persona. con resultado. por lo general. • Probar nuevos medicamento> en muestras de paciente.ignan probabilidades subjetivas a la esperanza de vida de personas que padecen cáncer. A veces es ~lo una suposición. podrían incluir lo siguiente: • Entrevistar a 20 consumidores seleccionados al azar y preguntarlo qué marca de aparato electrodomésnco prefieren. 10190 o Sta .ar el contenido. para detectar cualquier error • Registrar el promedio industrial Dow lenes el primer tune.100 ESTADISTICA EN LO) l'EGOCIOS PROBABWDAD Número de veces que ocurrió un evento Número total de cponunidades para que ocurra el evento POR FR.ido.td precisa de que el embarque se pueda hacer a tiempo. una compañía desea determinar la probabilidad de que •m inspectores \'ayaD a rechazar el siguiente lote de materias primas de un proveedor. Supongamos que a un director de transporte de una companta petrolera se le pide la probabilidad de obtener un embarque de petróleo de Arabia Saudita a Estados Unidos en ~lo tres semanas. comprensión y experiencia almacenada y procesada en b mente humana.tá consciente de que las condiciones climatológicas y económicas actuales pueden dar una pro· babilid. CAPft'UUH PROllAllILID...0 101 Evento Debido a que un evento es un rc.sultaJo de un expenmento, el experimento define I~ posibilidades del evento, Si d experimento e muestrear cinco boteilas que salgan de una linea de producción, un evento podria ser obtener una botella defectuosa )' cuatro buenas. En un experimento de tirar dado>. un evento podria ser tirar un número par y otro evento podria ser tirar un número mayor de dos. lo> evento> se denotan con letras mayúsculas; las letras imyú>CUias cursivas (por ejemplo, A )' E1, E2, ••• ) represenran el caso general o absrracto y las ma)'Ú~uW tipo Romanredondas (por ejemplo, H y T para cabezas y colas [cara o cruz J) denotan C0$3) y personas específicas. Eventos simples Los cn:111os qr..: ne St' puedan separar o drscompo11cr en otro» eventos se Uaman eventos simples Lo> eventos simples se denotan con letra.\ minúsculas [p. ej. c1, c2, e), ... 1. Supongamos que el ezpenmento e> tirar un dado. lo> eventos <imples para este experimento son tirar un 1 o tirar un 2 o tirar un J, etcétera. Tirar un numero par o un evento, pero no e> un evento elemental porque el número par puede descomponerse en los eventos 2, 4 y 6. En el experimento de: tirar un dado. hay~ eventos imples ( l, 2, J, .f, 5, 6}. Tirar un par de dados resulta en 36 posibles eventos simples ( resultados), Por cada uno de los seis evento> <imple> posibles al tirar un dado, hay seis posibles C:\"Cnt0> simples en el tiro del segundo dado, como se describe en el día· grama de árbol de la figura -1.2. La tabla 4.1 contiene: una lista de esto' 36 re ultados, En el experimento de: tirar un par de: dado-, otros eventos podrían incluir resultados talo como do> números pares, una suma de: 10, una suma mayor de cinco, y otro>. l'o obstante, ninguno de estos eventos es un evento elemental porque cada uno se puede descomponer en vario> de los eventos simples mostrados en la tabla .f. l. TABLA 4.1 Todos los posibles eventos s:mplos en el tiro de un par de é.3tos !espacio muestrall 1.1 4,1 5;1 (6Jl (1.2) (4.2) (5,1) (6.2) (4.J) 15.J) (6.)) (l.J) (2,3) (1,4) (2.4) (3.4) (4,4) (5,4) (6.4) (l.S) (2.S) (3.S) (4.S) (S.S) (6.5) (1,6) (2,6) (),6) (4,6) (S,6) (6.6) Posibles resultados de tirar un par de dados &nito> ..un un dodo (6) 2 E...,.tos C011 un scpmdo dado J6 102 bTADhTICH.-.; LO> :-;EGOCIO) Espacio muestra! l:n t'p•cio muestral es una lina complet« dt to;loJ los evento» mnplt; para un expenmmto. La t.ibla 4.1 o un espacio muestra! para tirar un par de dados, El espacie maestral para el tiro de: un wlo dado es 11. 2. 3, 4 ,5, 6). El espacio mue:.tral puede avudar a encontrar probabilidades, Suponga que un experimento o tirar un par de dado>. ¿Cu.il es la probabilidad de que el dado sume 71 Un examen del espacio muestral que se ilu$tra en la tabla .f. l deja ver que son seis resultndos en lo> que la suma del dado ea 7-1(1,6), (2,5),(3,4),(-1,3), (5,2).16.1))-cn el total posible de J6cvcnto,s1mplc.en el espacio muestral. Al usar t>ta información, podemo concluir que la probabilidad de tirar un par de dados sumen 7 o 6136, o $ta .1667. Sin embargo, el uso del esp.1C10 muesrral para determinar probabilidades es engorroso y dificil de manejar cuando el espacio rnuestral e• grande. Por tanto, lo> experto> en t>tad1•tica utilizan otro' métodos m.1< dicientes para determinar probabílidade . • Uniones e intersecciones La not•ción de conjunto , e decir, el u.'IO de llaves para agrupar numeras, se utilíu como hertamienta rnnb6lica pura 11mants t inttr~11t5 en e-te capitulo. la unión de X. r se forma al romb111i1r tltmentas dt ambo.1 ron¡1111tos y$(' denota X u r. IJn elemento se d.i.ifrca en la unión de x. r si C>t~ ra sea en X o en Yo tanto en X como en r. la expresión de unión X U r se puede traducir en X o r. Por ejemplo. $i: X= (1,-1,7,91 y }' m /2.3.-1.5.6) xu r-11.2.3.4.5.6.7,91 Kóte.e que todo. lo. valores de X y todo. lo. valoro de re.un en la unión: sin embargo, ningu· no de lo> \<l10rQ aparece mh de una vez en la unión. En la figura -1.3, la región sombreada del diagra· ma de \'enn denota la unión. Una intersección se denota X n r. Para da.;íficarsc en la intersección. un demento debe e tar tanto en X como en r. La intersección conucn« /oj elementos co1111mc.1 dt ambo; conjuntos. Por tanto, el -imbolo de interseccién. n, se lec a veces como y, La intersección de X. Y se lec como X y Y. Por ejemplo, vi: X= ft,-1,;,91 y l' • /2,J..1.5,61 xn Y•!-11 :-:ótesc que sólo el valor de -1 es común a lo> do. conjunto X y Y. La intersección e> m.í> cxdu'i"a que la unión r por tanto es igual O (por lo general) más pequeña que la unión. los elementos deben ser carscten tico' tanto de X como de r para da)ificar. En I~ figura 4.-1, la región sombreada denota la iotcn«ción. FIGURA 4.3 Una unión FIGURA 4.4 Una intersección Eventos mutuamente excluyentes Do' o mas eventos son mutuamente excluyentes 'i la ocurrencia de un t>·tnto impide q11t ocurra ti otro evemois}. Sta característica 'itt· nifica que los eventos mutuamente excluyentes no pueden ocurrir en forma ,iJnultánca y, por tanto, no uenen intersección. La "anablc "género" presenta do, resultados mutuamente excluyentes, masculino y femenino: un empicado seleccionado al uar para que S<"a parte de un estudio es hombre o muier, pero no puede ser ambos. Una piva manufacturada estj defectuosa o C>t! bien: la pieza no puede estar defectuosa )" bien aJ mismo tiempo porque "bien" yªdcfcctuOA· son categorías mutuamente excluyentev, En una muestra de productos manufacturados, el evento de seleccionar un pieza defectuosa es mutuamente exclusiva con el evento de seleccionar una pieza no dcfectuo'-1. Suponga que un edificio de oficinas c:)t~ a la venta y dos compradores potenciales le ponen predo al edificio, !'o es posible que ambos lo compren, por lo cual el evento de que el comprador A compre el edificio es CAPITUL04 PROBABIUD.\D 103 mutuamente excluyente con el evento de que el comprador B compre el edificio. Al tirar una moncd.J., el que caiga can o cruz es un evento mutuamente excluyente. La persona que lance al aire una moneda verá o cara o cruz. pero nunca ambas. En el uro de un par de dados. el evento (6, 6), mulas, es mutuamente exclusivo con el evenro ( 1, 1) ojo de víbora, Obtener mula. y ojos de \1bora en el mismo tiro de dados es imposible. La probabilidad de que se presenten dos eventos mutuamente excluyc:ntQ al mismo tiempo es cero, ~L''TO XyY :TUAME.''TE Dll.l1YfXTES P(Xí'I Y)• O Eventosindependientes Dos o mh eventos son eventos independientes ~¡laocurrencia o no ocurrtnda dt 11no dt los evento» no af«ra la ocurrtnda o no ocurrtnda dtl otro n·tnto(s). Cienos experimentos, por ejemplo tirar dados, dan eventos independientes: cada dado es independiente del otro. Que )a!ga un 6 en el primer dado no inOu)e en el segundo dado. Los~ al aire de moneda. siempre son independientes entre si. El evento de que salga cara en el primer tiro al aire de una moneda es independiente de que salga cruz en el segundo tiro. En general se piell.\a que ciena. caracterísricas humana. son independientes de otros C\CntO•. Por ejemplo, es probable que ser zurdo sea independiente de la posesién de una tarjeta de eré· dito. E. probable que •i una pe~na u.a lentes o no. esto es independiente de la marca de leche que prefiera. )lfuchos experimemos que utiliun selección aleatoria pueden producir evento. independientes o no independientes. En e.to• experimento>. lo• resuhados son independientes si el muestreo se hace con reemplazo; es decir. despub que cada elemento se seleccione y se determine el resultado, el elemento se reintegra a la población y la población " revuelve, En t'Sta forma, cada tiro se hace independiente del tiro prevro. Suponga que un inspector selecciona al azar tomillo. de un depósito que contiene 5% de pi~ defectuosas. Si el inspector muestrea un tomillo defectuoso y lo Tegm.1 al depósito, en el segun· do saque todavía habrá 5% de piezas defectuosas en el dcpó)ito sin considerar el hecho de que el primer resultado fueran sido pieza defectuosa. Sí el inspector no regresa la pieza en el primer saque, la segunda pina no es independiente de la primera; en este caso. quedan menos de 5% de piezas defectuo~ en la población. Por tanto. la probabilidad del segundo resultado o dependiente del primero. Si X e Y son independientes, se utiliza la siguiente notación. PIX)Y) • PIXJ y PO'IX) • P(Y) P(X)}') denota la probabilidad de que X ocurra dado que Y ha ocurrido. Si X y Y son independientes, entonces la probabilidad de que X ocurra dado que Y ha ocurrido e. exactamente la proN!lilidad de que X ocurra. Saber que Y ha ocurrido no afecta la probabilidad de que ocurra X porque X Y son independientes. Por ejemplo, PI prefiera Pep>ilpcrwna co derecha l • P( prefiere Pepsí) porqut g una persona co derecha o es zurda es independiente de la preferencia de la marca. Eventoscolectivamente exhaustivos Una li ta de "en tos colectivamente exhaustivos contiene todos los posibltS tltrnmtos sunpla experimento, En consecuencia, todos los espacios muestrales son listas colectivamente ~La ti.ta de posibles resultados por tirar un par de dados, contenida en la tabla 4.1, es una bu cXJl~:q.. mente exhaustiva, El espacio muestra! para un experimento se puede describir como um to> que son mutuamente excluyente. y colectivamente exhaustivos, Los eventos de espKJO se traslapan o intersecan, y la lista está completa. Eventos complementario s El complemento de un "coto .A se denota como A', que se Ice no A. Todos los non:::s experimento no m A comprtndtn su complemento. Por qemplo, si al tirar un dado d ~A R • doe2 l 04 ESTAD1STICA E,-.; LOS SEGOCIO~ en el número par, el complemento de A esú teniendo un número impar. Si el evento A se detiene en el número 5 al tirar el dado, el complemento de A tendría 1, 2, J, 4 o 6. El complemento de A contiene cualquier parte del espacio muestral que el evento A no contenga. como muestra el diagrama de Venn de la figura 4.5. PROBABIUDADDEL CO\fPl.EMENl'O P(A') DEA =1 - (A) Suponga que 32% de lo$ empleados de una compaMa tienen grado universitario, Si un empleado se selecciona al azar de la c:ompailla, la probabilidad de que la persona no tenga grado universitario es 1 - .J:? • .68. Suponga que 42% de todas las piezas producidas en una planta se moldean en la maquina A r J 1 % en la máquina B. Si al azar se selecciona una pieza, la probabilidad de que fuera moldeada. no por b máquina A ni por la máquina Bes de 1 - .73 • .27. (Suponga que una pieza se moldea ~lo en una máquina.) Conteo de posibilidades En ~llc:a, es posible usar un conjunto de técnicas y reglas para contar el número de resultados que pueden ocurrir para un experimento en partic:ular. Algunas de estas reglas y técnicas pueden delinear d tamaAo del espacio muestral. AquJ se presentan ttñ de estos métodos de conteo. La regla de conteo mn Suponga que un cliente decide comprar un auto nuevo de cierta marca.Las opcioaes para el auto induym dos motora difercnto,cinco colores diferentes de pintura y tres paquetes del interior Si existe cada una de esus opciones con cada una de I~ otras, ¿de cuántos autos diferentes podría escoger el cliente! Para determinar C\tc número. podemos usar la regla de conteo m". lAR.EGlADE CO~"TtO..,, Para um opaación que se puc:da hacer en m formu )' una sq¡uncb o¡><ración que se pueda hacer en n !onms. w dM operaciones pueden ocurrir, en orden, en mn form.u. bta ~la se pu~ atcnckr a ~ con ucs o más operaciones. Con el 11$() de la regla de conteo mn podemos determinar que el comprador del auto tiene disponibk$ (2) (5)(3) ., JO diferentes combinaciones de motor, color de pintura e interiores del auto. St:p0r.p que un investigador desea iniciar un diseüo de invotigación para estudiar le» efectos del sfncro (M, F), estado civil (soltero, divorciado, casado) y clase económica (baja, media y alta) en la frecuencia de compras de boleto) de avión por año, El inve tigador iniciarla un diseño en el que se toman 1 S muestras diferentes para representar todo) los grupo) posible generados por estas caracteruticas del cliente, . Número de grupos • (Género) (estado civil) (clase económica) • (2) (J) (J) • 18 grupo) Muestreo de una población con reemplazo En el segundo método de conteo, el muestreo den elemento) de una población de tammo N con reem- plazo darla: (N)• po$ibilídad~ FIGURA 4.5 Donde: El complemento del evento A N = tamallo poblacional A' " = tamaño mucstral Por ejemplo, cada vez que se tire un dado que tenga seis lados los multados son independientes (con reemplazo) del tiro ante· rior, Si un dado se tira tm vece. en sucesién, ¿cuántOi resultados CAPITIJLO 4 PROBIJ!ll.JD.U> IOS diferentes puede ocurrir? Esto es, ¿cuil es el tanullo del espacio muestrsl para este experimento? El tamatlo de la población, N, c. 6. lo. sris lados dd dado, ~1.1mo• muestreando tres tiros de dados. n .. 3. El opado muestra! es: (]\.')~ - (6)3 - 216 Suponga que en una lotería se ucan seis números de lo. dígitru del O al 9, con reemplazo (10) dígitos $C pueden usar otra \'C7). ¿Cuántas agrupaciones diferente• de sch números se pueden ucar? N es la población de 10 números (0 al 9) y ne el tamaño rnuestral, sri$ números, (N)• • (10)6 • 1000000 Esto o. ¡existe un millón de números de seis dig11os! Combinaciones:muestreo ~e una población sin reemplazo El tercer mttodo de conteo ua combinaciones que muestrea n elementos de una pobladón de tamallo N sin reemplazo y se obtiene: NI ,.e,.= (,\'} =---n n!(N-11)! • po.íbilidades. Por ejemplo, suponga" que una pequeñe empresa de abogado. tiene 16 empleados y tres de ellos han de ser seleccionados al v.ar para representar la compaJ\ia en la reunión anual de la American Bar A,.(~iation. ¿Cuánta. diferentes combinaciones de abogad()) podrían set enviadas a la reunión? Esta situacién no permite muestrear con reemplazo porque tres diferente. abogado. .crán seleccionados para asistir. Este problema se resuelve con el uso de combinadones: N • 16 y n • 3, así que: 16! 111C. = 16C3 =--=560 • 3!13! Un total de 560 combinaciones de tres abogados podrian seleccionarse para representar la firma. (.1 PROBLEMAS 4.1 Un proveedor remitió un lote de ~is piezas a una compeñía, tres de la. cuales estaban defectuosas, Suponga que el cliente dccidíó seleccionar al azar do. pía.a) r probarla. para ver si tenían defeetos. ¿Qut tan grande es un c:.pado muestra! con el que esti trabajando potencialmente el cliente? Haga una li>ta del espacio. Con el uso de la lista del espacio maestral, determine la probabilidad de que el diente seleccione una muestra con exactamente un defecto. 4.2 Dado X• 11. 3, 5, 7, 8, 9). r • 12. 4, 7, 91 y Z.,. { r, 2, 3, 4, 71, resuelva lo siguiente. •· xuz-_ b. xnr-_ c. xnz•_ d. xu ruz-_ e. n Y nz=_ (X u Y) n g. (Y n Z) u ex n Y) • _ h. x o r - _ i. YyX•_ 4.3 Sí una población consta de lo números pares positivos hasta 30 y si A • (:Z. 6, 12, 24 • (~es A! 4.4 El 5i~tema telefónico 800 del scrvicio a clientes de una compallla est~ instalado de modo que quien llama tiene sei.\ opciones. Cada una de estas seis opciones lleva a un menú con cuatro opaotlCl-o Para cada una de estas cuatro opciones existen tres opciones más. Para cada una de esas un opciones están presentes otras tres opciones. Si una persona llama al número 800 pidiendo IJUda, ¿cuántas opcione en total son posibles? 4.5 Un recipiente contiene seis piCU5. de la~ cuales dos están defectuosas v cuatro son acqiubles. 51 tres de ta. seis pieza. se seleccionan del recipiente. ¿qut' tan grande es el csp300 muntraP. (CWI regla de conteo utili76 usted y por qu~? Para este espacio maestral, ¿cuil es la probabilid.ld de que exactamente una de Lu tres pi~'US muestreadas sea defectuosa! x c. z •_ U» dígit~ se pueden repetir en el número de serie. la probabilidad de que una persona posea un Ford o un Chevrolet.ia nene 20 empleados. Debido a la individualidad y variedad de problemas de probabilidad. matrices de probabilidad e intuición. Esta probabilidad se calcula al di. La información conocida o dada se escribe a la derecha de la línea vertical del enunciado de probabilidad.. leyes de probabilidad. La probabilidad de unión se denota P(E1 U E2).idir el número de pro· piewios de Ford entre el número total de propietarios de autos. al~nas técnicas aplican más fácilmente en cierta> •ituacionc. La probabilidad conjunta de los eventos E1 y E2 se denota como P(E1 n E2). deben ocurrir ambos eventos. la persona sélo debe tener al menos uno de esto auto .:n ejemplo de probabilidad condicional es la probabilidad de que una persona posca un Chevrolet dado que ella posee un Ford. l. Por lo general una probabilidad marginal se ca!nda al divídir algún subroral entre d entero. y luego se determina el número de propietarios de Chevrolet fuera de propietarios de Ford. Esta probabilidad se calcula al dividir el número de penoms que usen lentes entre el número total de personas. En el ejemplo do: propietario) de auto>. Otro ejemplo c. Un cuarto tipo es Ja probabilidad condicional que se denota por P( E1 1 E2 ). w probabilidades condicionales se calculan al determinar el número de elementos que tienen un resultado que se obtuve de algun subtotal de la población. DE UNIÓN. CONJUNTAS Y CONDICIONALES En este capitulo presentemos cuatro tipos parnculares de probabilidad. En una compar\Ja. donde E1 y E2 son dos eventos. Un segundo tipo de probabilidad es la unión de dos eventos. Un segundo ejemplo de probabilidad conjunta e.7 Una pequer\a compatl. de probabilidad. ¿Cuántos numeres de serie diferentes son posibles! <t. Una persona llena I°' requisitos para la unión al ser hombre o ser oficinii. De nuestros cuatro tipo> de probabilidad. Las probabilidades con· dicionales comprenden el conocimiento de alguna información pm·ia. que m otra. ~lo la probabilidad condicional no tiene la población total como su denominador. las posibilidades se reducen . la probabilidad de que una persona sea hombre u oficinista c.4 PROBABILIDADES MARGINALES. ¿Cuúit°' grupos diferentes de seü se pueden seleccionar! 4. A veces P1 E1 n E2) se lee como b probabilidad de E1 y E2• Para llenar los requisito• de la intersección. donde 5 es algún evento.su probabilidad condicional C$ ~lo una medida de la proporción de propietarios Ford que uenen un Olc-\-role1 -no la proporción del total de propietarios de auto que poseen un Chevroler.<t. la probabilidad de que una persona use lente• o sea pdirrojo. Para llenar lo. se sabe que ha ocurrido. di. Esw herramientas inclu)·cn espacio muestral. dado que E2.ten varias herramientas para usar en Ja solucién de problema. !'\o existe el mejor método para resolver todos los pro- . E. una probabilidad de unión. o probabilidad conjunta. la probabilidad de que una persona posea un auto Ford. Esta expresión se lee: La probabilidad de que E1 ocurra.6 resume estos cuatro tipos de probabilidad.a los propietari~ de un Ford. el primer tipo es el de proba· bilidad muginal que se denota P(E). Todas las personas que usen lentes esun incluidas en la unión. 4. Un ejemplo de probabilidad marginal e. .:igranw de árbol. la probabilidad de que una persona sea pelirroja y use lento. l'osttr' UD tipo de auto no es suficiente. seis de los cuales serán seleccionados al azar para ser entrevístados como parte de un programa de ~tisfacción de empleado •. La figura 4.ta o ser ambos (oficinista hombre). Un ejemplo de probabilidad conjunta es la probabilidad de que una persona posea un Ford y un Chevrolct. Las probabilidades condicionales tienen un subtotal de población en el denominador..6 Una compaflla coloca un nümero de serie con siete dlgito• en cada pieza que fabrica. requisitos para la unión. P(E1 U E2) e> la probabilidad de que E1 ocurra o que E2 ocurra o que ocurran tanto E1 como E2• Un ejemplo de probabilidad de unión c. Cada digito del numero de serie puede ser cualquier número de O a 9. junto con todos los pelirrojos y todos los pelirrojo¡ que usen lentes. La probabilidad de que una persona ese lentes también es una probabilidad marginal. Un tercer tipo de probabilidad es la intersección de dos eventos.5 LEYES DE LA ADICIÓN Eiu:. Otro ejemplo de una probabilidad condicional es la probabilidad de que un trabaiador de una com¡>Mlia sea un profesional dado que es hombre. t\. P1 S .Jl. la solucién del problema parece ser P(N U SI• P(N) + PIS)• . w Ul' GE. las leyes de la multiplicación y la regla de Ba}-es. P(X U Y). La ley general de la adición se utiliza para encontrar la probabilidad de la unión de dos eventos.seleccionado por 6i% de los rrabaiadores. problema) la solución se puede determinar sin aplicar formalmente las leye). Por tanto.is ~cio de almacenamiento o de archivo. 70.iles eran los cambios en disd\o de oficinu que aumentarian la pro· ducuvidad. En segundo lugar~ espacio de almacenamiento o de archive. En este capnulo se presentan cuatro leyes de probabilidad.O 4 PROBA.37 .'.i'O + .. El cambio número uno que 70% de lo¡ trabajadorts diieron aumentaría la productividad era reducir el ruido. leyes de la adición. Y son eventos y (X n Y) es fa intersección de X y Y. Como 70% de los entrevistados respondieron que reducir el ruido crearla mis preductividad. Las ltye$ de la adición y las leyes de la multipliación tienen cada una de ellas una ley general y una ley especial.\1 P\XvY) P(Xn Y) P\Xh1 La La probabilidad QIXXyl" ocurran La probabilidad QIXXyt' ocurran La probabilidad QIXX probabllidad QIXX ocurra ocurro dado qlk' r ha ocurrido Utiliza multados posibles loulntnd dtnomi-iot V1ibu rnuludos posibln IOblamd daiomimdor U1ilw rnulwloa poliblcs 1ocalaen d daiomllwlor U1iliu d aub1ow d~lotpoubla rnuludo>md dmominador blemas de probabilidad. Otra) incluyen las leyes de probabilidad. Una de las herramientas ya presentadas es el espacio muestral. En algunos ejemplos. P(:SUS) Para satisfacer con éxito la búsqueda de una persona que responda con reducir el ruido o m. como 67% respondieron que aumentar el espacio de almacmar:llt!lto mejoraría la productividad.67 • 1. s.67. establecer la matriz de probabilidad es mas dificil que resolver el problema de otro modo. la ma1riz de probabilidad trua un problema de un modo que se puede resolver fácilmente. Yankelovich Partners llevó a abo un estudio para la American Society of Interior De igners en el que se preguntó a trabajadores cu. sólo necesuamos encontrar una persona que drsce 11/ menos aDO de estos eventos. DE LA ADICJON P(X U Y)• P(.BIUllt\D IOi' Conjuui conjuntas y ::::r."tRAl. pero pan alguno. La expresión P(X U Y) denota la probabilidad de que X ocurra o que Y ocurra o que ocurran X r Y. Si al aur 5C selecciona uno de quienes respondieron y se le pregunta qué cambio) de diseño de oficina aumentarla la productividad del trabajador. ¿cuál es la probabilidad de que esta persona seleccionaria la reducción de ruido o mú copado de almacenamiento o de archivo? Hagam06 que N represente el evento "reducir ruido· y que S represente el evento •más espacio de almacenamiento o de archi•-o': La probabilidad de que una persona responda con N o S se puede simbolizar estadísticamente como una probabilidad de unión con el uso de la ley de la adición. A quienes respondieren se les permitió contestar m~ de un tipo de cambio de diseño. Cualquiera de bto.. En otros casos. Adcm. probabilidad condicional. P(!') .P(X n Y) Donde X.atisfaria el requisito de la unión.\1 + P(Y) .i:!Qonales P(. Las I~ de probabilidad casi siempre se pueden usar para resolver problemas de probabilidad.CAJ>tn. Una vci creada la matriz. podemos escribir las probabilidades marginales. ·~ Despeje de la unión en el problema de productividad en oficinas !'o obstante.70 + . En general. Por Unto el diagrama 8 ilusua la apli· caci6n correcta de la ley general de la adición. el sombreado es consistente en todo N y S porque el área de intersección se ha resudo.3. E:. PIN n S). en el problema del diseño de una oficina. las personas que recomendaron ambas mejora se cuentan doblement«.67. P(N n S) 56. Por esa rvón. Por ejemplo.67 se coloca en la columna No.S1. entonces 30% de las personas entrcviiudas no pensaron que la reducción de ruido aumentar1. 67 ..") • 1 .." LOS NECOCIOS . como se ve en la tabla 4. )'a establecimos que las probabilidades no pueden ser mis de 1. se registra la probabilidad marginal P(S .70. también una probabilidad marginal.2 Matriz de probabilidad para el problema de disello de oficinas . una fila Sí y una fila No se aeartan para una variable y una columna Si y una columna ~o se crcarian para la otra variable. pt no S 1 -0. de Venn ilustran este análisis. ¿úúl es el problema aqul1 NóttM! que todas las personas que respondieron que tanto. TABLA 4. Una matriz de probabilidad.P\N íl SI• . Este valor se coloca en el margen de la fila de SI a reducción de ruido. la ley general de la adición resta la probabilidad de interseeción. F. como se ve en la tabla 4. diagram. Sí para aumentar espacio de almacenamiento.56 • . lo que indica que se ha contado do. reducir el ruido como aumenur el espacio de almacenamiento mejoraría la productividad se incluyen en cada una de 1.108 lSTAl>bTICA E. ¿Entonces cual es la respuesta a la pregunta de probabilidad de unión de Yankelovich Partners! Suponga que 56% de todos los que respondieron a la encuesta habian dicho que tanto la reducción de ruido romo aumentar el espacio de almaanamiento o de archh~ mejoraría la productividad.. la reducción de ruido estarla en un lado del cuadro y aumentar el espacio de almacenamiento en el otro. Entonces podríamos usar la ley general de la adición para resolver la probabilidad de que una persona responda que ya sea la reducción de ruido o aumentar espacio de almacenamiento mejorarían la productividad.7 . la probabilidad marginal de No para aumentar espacio de almacenamiento. veces.2. Sin embargo.7.00. Matrices de probabilidad Ademis de las fórmul~ otra berramiema útil al resolver problemas de probabilidad es una matriz de probabilidad. como aún incluidas en el P\N) y el P(S). va en la fila indicada por No bajo reducción de ruido. una matriz de probabilidad se construye como un cuadro de dos dimensiones con una variable en cada lado del cuadro. 81 'MI de los trabajadores encuestados respondieron que ya sea la rtd11cri6n dt mido o aumentar t$pacio de almactnamicnto mejorarían la productividad.1 la productividad. Nótese que el área de interseccíén de N y S esU doblemente sombreada en el diagrama A. Si Pt ~) • .oru debe incluirse como que favorece al menos una.te valor.70 es la proba· bilidad margiiul de que una persona responda si a la reducción de ruido. En el día· grama 8. mueura las probabílídadcs malfÍnalts y las probabilidadts dt m1mccci6n dt un problema dado..30. P(N) • .81 Por tanto.. Finalmente. Las probabilidades de unión y probabilidades condicionales deben ser calculadas desde la matriz.n la figura 4.Si . Ciertameme una persona que responda y recomiende estas dos me. P\no :-.flGURA 4.i. PlN U S)"' P(N)-+ PI. probabilídades marginales P(N) y Pl. En la columna bajo. En este problema.. Por tanto.iO = . Por ejemplo.00 ¡llllA 4. Ahora podemos resolver la probabilidad de unión. restar 0. se puede determinar a partir de la matriz de probabilidad al sumar las probabilidades marginales de Sf para reducción de ruido y Sí para aumentar espacio de almacenamiento y luego restar la celda Sí Sí. P(N U S). P(N U S) = 0.70 ~.11 (de No en reducción de ruido y Sí en aumentar espacio de almacenamiento) = 0. En otras palabras.4 -e ~ columna Sí para matriz de idad del problema a :::!:seño de oficinas .33 l. La probabilidad de que una persona sugiera reducción de ruido o aumentar espacio de almacenamiento como solución para mejorar la productividad.0. Este valor se escribe en la matriz de probabilidad en la celda bajo Sí Sí. como se ve en la tabla 4.67 (de la columna SO .56 (de la celda Sí Sí) = 0. P(N U S) = 0.14 da el valor para Ja celda bajo Sí por reducción de ruido y No por aumentar espacio de almacenamiento.P(S).70 y obtener 0. 14% de todos los que respondieron la encuesta dijeron que la reducción de ruido mejoraría la productividad pero el aumento de espacio de almacenamiento no la mejoraría.56. Aquí se muestra de nuevo la matriz de valores sin procesar (también llamada cuadro de contingencia).67 En esta matriz de probabilidad se dan las cuatro probabilidades marginales o se pueden calcular con sólo usar la probabilidad de una regla complemento.as Noa.3. con las cuentas de frecuencia para cada categoríay para subtotales y totales que contengan un desglose de estos empleados por tipo de posición y por género. Llenar el resto de la matriz resulta en las probabilidades que se ven en la tabla 4. los valores de la celda. en al menos dos formas diferentes con el uso de la matriz de probabilidad.4.81 PROBLEMA DE DEMOSTRACIÓN 4. La intersección de reducción de ruido y aumentar espacio de almacenamiento se da como P(N n S) = 0.67 . El resto de la matriz se puede determinar al restar. como se ve en la tabla 4.3 SI !l&iciL de probabilidad del ~~-ma OfHldo de 41lmtiamrmiento de diseño de No Sl~.A4.3. de las probabilidades marginales. siguiendo el modelo de la ley general de probabilidades.1 Los datos de la compañía cliente del Dilema de decisión dejan ver que 155 empleados trabajaron uno de cuatro tipos de posiciones.56 de 0. El enfoque está en la fila Sí por reducción de ruido y la columna Sí por aumentar espacio de almacenamiento.56 (de la celda Sí Sí) + 0.3º .81 Otra forma de despejar la probabilidad de unión de la información mostrada en Ja matriz de probabilidad es sumar todas las celdas en cualquiera de las filas o columnas Sí. P(no S) = 1 . Si un empleado de la compañía se selecciona al azar.14 (de Sí en reducción de ruido y No en aumentar espacio de almacenamiento) + 0.70 (dela fila Sí)+ 0.4. Observe lo siguiente de la tabla 4. ¿cuál es la probabilidad de que el empleado sea mujer o un trabajador profesional? . P(N U S).CAPÍTULO 4 PROBA6lUDAD 109 ~ "IUl. 555 Para resolver esta probabilidad con el uso de una matriz. convertir la matriz de valores sin procesar a una matriz de probabilidad al dividir todos y cada uno de los valores de la matriz entre el valor de N.2 861155 • .284 .l l 0 ESTADISTICA zx LO) SEGOC"JO!> DATOS OE RECURSOSHUMANOS OE COMPAMA Hombr• Mu1er Gerencial 8 3 11 1lpo Profesional 31 13 " po9k10n Tknlco 52 17 69 Of'ICini•ta 9 22 31 100 55 155 • Sol11<ión Denotemos por F el evento de mujer y P denota el evento de trabajador profesional.. Como 13 empleados son mujeres y profesionales.86 y luego dividir entre el número total de empleados..555 Una segunda forma de obtener la respuesta a partir de la matriz de valor sin procesar sumar 1odas las celdas una vez que estén ya sea en la columna Mujer o en la fila Profesional es 3 + 13 + 17 + 22 + 31 .355 + . se puede ya sea usar la matriz de valores sin procesar que vimos previamente. para los resultados de un estudio nacional de 200 ejecutivos a quienes se pidió idan· tificar la ubicación geográfica de sus compaflías y el tipo de industria de las mismas.13. se suma el número de personas de la columna Mujer !551 al número de personas del renglón Profesional 1441. La matriz de valor sin procesar se utiliza de un modo semejante al de la matriz de probabilidad. N • 155 se obtiene: P(F U PI• PROBLEMA DE DEMOSTRACIÓN 4. los 155 empleados incluyen 44 profesionales. Este paso da el valor de 55 + 44 . La pregunta es PIF U PI• 7 Por la ley general de la adición. Dividir este valor (86) entre el valor de N(155) produce la probabilidad de unión.13'155 • 0. 86. P(PI • 441155 • 0.. P(F u P) • P(FI .P(P) .284.084. o bien.. La probabilidad de unión se resuelve como PIF u PI • . . Por tanto. 155. P(F U PI • 86'155 • . PIF) 55/155 0. A los ejecutivos sólo se les permitió seleccionar una ubicación y un tipo de industria.555 A con1ínuación se muestran la matriz de valores sin procesar y la correspondiente matriz de probabilidad.PIF n PI De los 155 empleados.084 . Por tanto.355. 55 son muieres. Para calcular la probabilidad de unión de seleccionar una persona que es ya sea mujer o trabajador profesional de la matriz de valor sin procesar. luego se resta el núrnero de personas en la celda de intersección de Mujer y Profesional 1131. PIF n PI . a.00 Suponga que de estos datos se selecciona al azar uno de los que respondieron al estudio.PIE n Al• .P(X n Y) . ¿Cuál es la probabilidad de que quien respondió sea del Medio Oeste-Región central (Fl7 b.11 .40 Al calcular la unión con el uso de la ley general de adición.04 .PIC n DI• .. o }.Pi. PIC U DI c. ¿Cuál es la probabilidad de que quien respondió sea de la industrie de comunicaciones (CI o del noreste IDl7 c. P(X o Y) pttO no ambu • P\Xl + PO') .\' ni r. Esta probabilidad ajustada deja una probabilidad de unión que apropiadamente incluye "atores marginales>· el valor de intersección.CAPM"ULO 4 PROBABILIDAD 111 MATRIZ DE VALMES SIN PROCESAR Noreste Sureste Reglón central Oeste Finanzas A 24 10 8 14 56 Manufacturas 8 30 6 22 12 70 28 18 12 16 82 34 D 71po de lnduUrla Comunicacion11•C E F G 200 MATRIZ DE l'ROBABIUDAD Noreste Sureste D 71po de lndwtrlll E Medio oeste-Región central F Oeste G .12 .05 .08 . Otra forma de expresarla es ni .06 . lo cual puede csw repre- ..21 PICI • PIDI .03 .P!X n Y) • P(X u Y) .06 .14 .64 PIE) • P(AI .15 . P(E U Al• P(F) .05 .28 .17 + . ¿Cuál es la probabilidad de que quien respondió sea del sureste (El o de la industria de finanzas (A17 Solucl6n a.07 . X r Y.8 es el diagrama de Venn para esta probab~ E:cnodeXo Y ~no ambos Complemento de una unión La probabilidad de la unión de dos eventcs Xv r r~!'C:S(!lU b probabilidad de que el resultado sea o X. Si Ja proba· bilidad de interseccién -e rt>ta una segunda vez.21 . la Intersección se elimina. dejando la probabilidad de X o Y pero no ambas. La mü6n incluye todo excepto la posibilidad de que no sea ninguna (X o }').14 . P(Regiónl b.28 M11nuf11C1urasB .09 .17 .41 .35 Comunicacíonu C . o amM.\' n Y\ En la figura 4.37 + . la probabilidad de intersección se resta porque ya está incluida en ambas probabilidades marginales .37 .41 .21 Fin11n1111A 1.. ~1~r. demasiado 1.81 • . cuando los eventos son mutuamente excluyentes se inserta WI m-o en la fórmula de la ley general para la intersección y rei.n escoger sólo una respuesta.19. no tiene que restarse nada. Dicho más formalmente.112 ESTADISTICA EN LOS NEGOCIO:. y la ley especial de la adición no apliaria a ese ejemplo. !l:iXru Y En el estudio que hicimos sobre la creciente productividad de trabajadora al cambiar el disetio de oficinas. En este estudio. ¿cuál es la probabilidad de que el trabajador mponda que es demasiado trabajo o proceso ineficiente? .ulta la fórmula de la ley especial.rabajo ( 1899).rabajador seleccionado al aur respondiera con reduccién de ruido o mayor espacio de almacenamiento fue determinada como: P(N U S) • P(N) + P(S) . Por tanto. dirigido por \mkelovich Pvtnen para W"illíam M. a le» trabajadores se les prq¡untó qué entorpece su productividad y se les díeron sólo las siguientes selecciones de las que podla. 19% de los trabajadores no seleccionaron reducción de ruido ni mayor espacio de alma· cenamlemo como soluciono para aumentar la productividad. la probabilidad de que un 1.56 • .P(N U S) • 1 . a quienes respondieron se les permitió escoger más de un posible cambio de diseño de oficinas.ta a todos lo• C&SC» pero. proceso ineficiente (8%). • Falta de dittcción • Falta de apoyo • Dem~iado trabajo • Proceso ineficiente • No hay suficiente equipo o abasto • Bajo salario o pocas probabilidades de avanzar La falta de dittcción la citaron más trabajadores (20%).J. a quienes respondieren se les permitió seleccionar sólo una opción para su mpucsa. lo cual hizo mutuamente exduyentes las posibles opciones.81 La probabilidad de que un trabajador respondiera con ni reducción de ruido ni mayor espacio de almaccn. 0. P(X U Y) • P(X) + P( Y) La ky especial de la adíción es un caso particular de la ley general de la adición. Como los eventos mutuamente aduyente< no se intersecan. Si un trabajador que respondió a esta encuesta es seleccionado (o si el estudio en realidad refleja los puntos de vista del público trabajador y se selecciona un trabajador en general) y a ese trabajador se le pregunta cuál de las selecciones dadas entorpece su productividad. ley especial de la adición idos e-ente» son mutuamente excluyentes. En la tabla 4. es de lo r!W probabk que ninguna de las opciones de cambio fueran mutuamente excluyentes. sín embargo. En otro estudio. Y es d área sombreada fuera de los círeulos. bajo salario o pocas probabilidades de avance (#%) y otros factom agregad<» por quienes respondieron. la probabilidad de la unión de los dos eventos es la pro· babilidad dd primer evento m. Y son mutuamente excluyentes. sentado simbólicamente como P(no X n no Y).9 El componente de una unión: la región nVni P(ni X ni Y) = P(no X n no Y) • 1 . P(ni N ni S) • P(no N n no S) 1 . Nótese que el complemento de la unión de X. o el complemento de una unión. esta probabilidad ni/ni se encuentra en la celda No No de la matriz. flGUIA 4.. Como es el único caso posible que no sea la unión de X o Y. En cierto sentido. lnc.P(N n S) • 70 + . LEY ESPEClAL DEUADIOOS Si X. no hay suficiente equipo o abasto (799). En d estudio acerca de mejorar la productividad al cambiar el diseno de oficinas. seguida por falta de &po)'O ( 18%).67 - .P(X u Y) Examine el diagrama de Venn de la figura 4. Esta área representa la región ni X ni Y..u la probabilidad del segundo evento.tmiento se calcula como el complemento de esta unión.9. b ky gmen1 se aiu.19 Entonces. 17 + . resuelva lo . las categorías de tipo de posición son mutuamente excluyentes. escogido al azar.. En numerosas matrices de probabilidad y de valor sin procesar como 6sta.. PIE U Gl PIEi . P(M n 1) .08 • . 0000 La implementación de la ley especial de adición da P(M U 1) • P(M) + P(I) ..2 PROBLEMAS 4..2. ¿Cu61 es la probabilidad de que uno de quienes contestaron. n C} • .b de una re puesta.08 Dado que no es po ible seleccionar m. P(I) • .18 Como el 8% de quienes contestaron dijeron "proceso ineficiente". '"' ~ • 155 155 . PIGI . 484 Utilice los datos de les matrices del problema de demostración •. pero no ambos. las filas no se traslapan ni son mutuamente excluyentes. P(A n C) • .1.12. un trabajador puede ser clasificado como que sólo est6 en un tipo de posición y como que es hombre o mujer. Denotemos por Ta un t6cnico. 645 La probabilidad de que un trabajador sea profesional u oficinista es: P(P U O) 1 PROBLEMA DE DEMOSTRACIÓN 4.3 Si se elige a un trabajador al azar en la compallla descrita en el problema de demostración ' 1. ¿cu61 es la probabilidad de que el trabajador sea tknico u oficinista? ¿Cu61 es la probabilidad de que el trabajador sea profesional u oficinista? Soludón Examine la matriz de valor sin procesar de los datos de recursos humanos de la compallla que aparecen en el problema de demostración '· 1.!.21.10. • 155 155 100 155 • .. como son las columnas. sea del Sureste o del Oeste? PIE U Gl • 7 Soludón Debido a que la ubicación geogr6fica es mutuamente excluyente (la ubicación del trab91() • Yll sea en el Sureste o en el Oeste pero no en ambos).Denotemos por M d evento "demasiado trabajo" y por 1 el evento "proceso intficiente': La preguna a: P(M U 1) •? Como el 18% de quienes contestaron dijeren •demuiado trabajo': P(M} • .8 Dado P(A) • .!.38 4. O un oficinista y P un profesional. En esta matriz.21 . 18 + ....26 PIOBLEMA DE BEMOSTRACIÓN 4. Asl.4 = P(Pl + P(Ol • ~ 155 + . como son las categorías de género y la ley especial de la adición se puede aplicar a los datos de recursos humanos para determinar las probabilidades de unión. P(C} • .1..03. La probabilidad de que un trabajador sea t6cnico u oficinista es P(T u Ol • Pm + P(Ol = ~ + .05 y P(B siguiente. P(B) • . a. ¿Cuál es la probabilidad de que una mujer de ese grupo de edades seleccionada al az. d.O) B . Setenta y cuatro por ciento de todos los hogares de Estados Unido .Pl'B IC) . a. Suponga tambitn que 61% de todas las mujeres de 25 a 49 ailos son casadas y participan en la fueru de trabajo. b. S1 A y B son mutuamente excluyentes.114 FSTADISTICA ES LOS :"EGOCIOS a. c. a.06 D .U televisores? es la probabilidad de que tenga televisión por cable o dos o mi¡ televisores pero no ambos? b. P(EUB) •_ c.10 . ¿Cuál .)1 . con televisión tienen dos o más televisores. los estadounidense han viajado en un tren por lo meno> una \U. P(AUC) •_ b • .. Bureau of labor Statistic•.07 P(AUF) •_ P(EUB)=_ PtBUC) • _ P(EU F) • _ 4. ¿Cuil es la probabilidad de que una mujer de ese grupo de edades seleccionada al aur set casada o participe en la fuerza de trabajo? b. Un hogar de Estad~ Unido> se selecciona al azar. P(AU D) •_ b.ar no sea casada ni participe en la fueru de trabajo? 4. Suponga que 78<\0 de las mujeres de ese grupo de edades o casada.10 Use lo> valore> de la matriz para resolver las ecuaciones dadas. aproximadamente 67% de hogaru en Estado> Unido• con televisión tienen televisión por cable.13 Según ~iel-cn . ¿úW e. P(A U 8) =V« I<» valores de la matriz para resolver lu ecuaciones dadas. ¿Cuál es la probabilidad de que un estadounidense seleccionado al aur haya viajado en tren o volado en avión? ¡Plttde resolverse este problema? ¿Bajo qué condiciones puede resolverse? Si el problema no se puede resolver. Suponga que 55% de todos los hogares de Estado~ Unidos con televisión tienen televisién por cable y dos o más televisores. ptCUF)•_ 4. D E F s 8 12 B 10 6 4 e g 2 s a.12 e ..12 ~ b U. _ 4. ¿qué información es necesaria para que pueda resolverse! 4. E F .\tedia Research.1 televisión por cable o dos o m.11 Suponga que 47% de todos los estadounidenses han volado en avión por lo menos una vez y que 2 % de todo. ¿Cuál es la probabilidad de que el hogar teng.27 . 75% de mujeres de 25 a 49 al'I~ de edad participan en la fueru de trabajo.04 .S.9 c. PIDU E)•_ d. la probabilidad de que una mujer de ese grupo de edades seleccionada al azar sea casada o participe en la fueru de trabajo pero no en ambas? c. (b) y (e) en la matriz. Denotemos por T el evento de que el miembro es trabajador tiempo parcial. Bureau of Labor Stati<tic~.is tde-. P(W) • P(TJ\\') es una probabilidad condicional que se puede c:ipRSU como la probabilidad de que un trabaiador sea de tJta:?) pm:W dado que el trabajador C• mujer. ¿Cu. Suponga que e. P(TJW) = .La ley general de la multiplicación da la probabilidad de que tanto ti evento X como ti C\·en10 Y ocurran al mismo tiempo.25. Unidos y que 35% de t~ ~ comp. usan la copia de la universidad del solicitante y su• referencias de facultad.5% de la fueru labo:al en Estados Unxlos son mujeres r trabajan tiempo parcúl.il es la probabilidad de que no tenga televisión por cable ni do.tern University Lindquist-Endicon Repon pidió a 3~ cornpañías informaran sobre los procedimiento.c. ¿Por qué la ley especial de la adición no se aplica a este problema? 4.25) • .115 n T) • P(W) • P(TJW) • 1. De aquí K dcduct que: .u'lla.z ~ tiempo parcial.S.10 muestra estas relaciones y b probabfficlad conjunta. La pregunta C): ptWnT)•? Según la ley general de muluplicación.Pl W) • PCTIW) Como 46% de la fuerza laboral son muieres. 46% de la fuerza de trabajo en Estados t."ÜOres? d.la seleccionada aJ azar no utilice referencias de facultad ni copia de la universidad como partedel proceso de contratación? d. Unido. y sólo 44% considera referencias de una facultad. Construya una matriz de probabilidad para este problema e indique las ubicadones de sus respuestas para las panes (a).il es la probabilidad de que una compall.ta condkión es b qur se dio ea el enunciado de que 25% dt las 11111pts dt la fuar. que usan p.'U1PUCACJ0N n Y)"' Pf.115 Se puede decir que 11. AGUR.'-'EVJ.:nidos son muieres.XJY) La notación X n Y significa que X y\' dtbni ocurrir. pero no ambas. Además. 25% de las muieres de la fuerza laboral trabajan tiempo parcial. y la ley general de la multiplicación <e puede aplicar para responderla. ¿Cu.X) · Pf. Denotemos por W el evemo de que el miembro de la fuerza laboral su mujer. La ley general de la multiplicación se usa para encontrar la probabilidad conjunta: u:r GE. sea mujer y trabaje tiempo parcial! Esta pregunta es de probabilidad conjunta. Por tanto. eventos (X n Y) recibe el nombre de probabilidad conjunta. como parte del pl'OCC)() de contratación? c. Según la U. . li LEYES DE LA MULTIPLICACIÓN ley general de la muhiplicación Como se expresó en la -ción 4.14 Un estudio realizado por la :-:orthwc.Y) · Pf. este problema se puede resober con: P(W n T) .YIX> = Pf. E.1 es la probabilidad de que un miembro seleccionado al azar de la fuerza laboral en 81ado.1. la probabilidad de la intersección de do. ¿Cuál es la probabilidad de que una compallia seleccionada aJ azar utilice ya ~ referencias de facultad o copia de la universidad.A 4.4. MU. Sólo S4% de las que contestaron revisan la copia de la universidad del solicuante como parte del procese de contratación.46)(. P(X Mt. ¿Cu.ira contratar personal.to• porcentajes son verdaderos para la población de compañías en Estado. L ¿Cuál es la probabilidad de que una compatlla seleccionada al azar utilice ya sea referencias de facultad o copia de la universidad como parte del proceso de contratación? b. o m. El ~ de \'mn de la figura 4.10 Probabilidad con1unta da qua una mujer est' en 141 fuerza laboral y tea trabajadora de tiempo parcial P(W P(Wl"'IT)•. P(M) - ~ • 5714 140 • Luego entonces. ~o ob)unte. P(B n C) '2..h fácil para despejar la probabilidad conjunta es encontrar la celda apropiada de la mauit y seleccionar la respuesu. La probabilidad de que un trabalador seleccionado al aur sea mujer y trabajador profesional. es la probabilidad condicional.. . Finalmente.MI . Una''ª construida una matriz de probabilidad para un problema.201 = . por lo general la forma m..5 Una compal'lía tiene 140 empleados. de los cuales 30 son supervisores. 11. es ..ua M5 .116 ESTADISTICA EN LOS l'-'EGOCIOS -- TABLA 4.335.5 es una interseccién.. .5. nótese que 20% de los empleados casados son supervisores.5 . PROBLEMA DE DEMOSTRACIÓN 4. P(M n T}.084.21111 . P(G ()Al c.6&5 . P(S M) = .20. en el problema de demostración 4.000 ~tmninar probabilidades conjuntas a partir de valores sin procesar o de matrices de probabilidad es fácil porque cada celda de estas matrices es una probabilidad conjunta. a veces el uso de la fórmula es más fácil que construir la matriz. . Cada valor de celdas de la ubla 4. f'\F n P).. La pregunta es: P(M n S) 1 Primero calculamos la probabilidad marginal. ¿cu" es la probabilidad de que el empleado sea casado y sea supervisor1 Soluci6n Denotemos por M a un casado y por S a un supervisor.5714)(.. 1. Ochenta de los empleados son casados. Por ejemplo.43% de los 140 empleados son casados y son supervisores... Matriz de probabilidad de datos de recursos humanos de campal'Ha .1 y el Dilema de decisión.6 De los datos obtenidos de las entrevistas de 200 ejecutivos en el problema de demostración encontramos: a.071 . y la ubla contiene todas las posibles interseccicnes (probabilidades conjuntas) para lo) eventos de género y tipo de posición. algunos expertos en estadistica llaman cuadro dt probabilidadconjunta a una matriz de probabilidad. la probabilidad de que un trabajador seleccionado al azar sea hombre y trabajador técnico.. al aplicar la ley general de la multiplicación tendremos P(M n S) • P(M) · P(SIMI • (. debido a lo que se da en un problema.De hecho. se conviene a matriz de probabilidad al dividir entre el número total de empleados (N = 155)... es . . Por ejemplo.214 f. supongamos que la matriz de valor sin procesar de datos de la compataJa diente. .1143 Por tanto. P(B ()El b. y 20% de los empleados casados son supervisores. PROBLEMA DE DEMOSTRACIÓN 4. con lo cual resulta la ubla 4. Si se selecciona al azar un empleado de la compal'lla. 35 e . PB n El• PB • PEIB 35 (·º353) . Entonces PIB El sig· nifica la probabilidad de B si se de E. pero PIEi • 0. PIB n E) • 61200 • .031.28 Manufacturas 8 . Pare obtener PIG n Al.17E en la matriz de probabilidad v 0.11 . o use una de las siguientes fórmulas: PG nA • PG • PA¡G • .21 .07. Por tanto.03 Aun cuando la fórmula funciona.03 .12 .00 FinanznA Comunicaciona 17 . se puede determinar con la matriz de probabilidad como PIEIB)• . PBIEI • :~~ V PB nE •PE PBIE .07 .03 b.JDAD Noreste Sureste D 1'1o tM lndwrria Reglón E central Oeste F G .D 117 MA11bZ DE VALORESSIN PROCESAR Oeste Surest« 24 10 8 14 56 30 6 22 12 70 28 18 12 16 74 34 42 42 200 D Finanzas A Comunicacion .41 •· De la celda de la matriz de probabilidad. Una fórmula alternativa es PIB n El• PIEi • PIB!EI.28 ('~~)- . dado que B ha ocurrido. encuentre la celda donde se cruzan G v A en la metnz de probeb1lided. Hay 0.21 1.21(~~)- .04 .06 .03.14 .08 . .17c~)- . primero hallamos PIB): PIBI • ~ • 35 200 La probabilidad PIEIBI de que E ocurra. Región Noreste e central E 82 F G MA11bZ DE l"ftOeAM.038 en estas E. Para resolver por le fórmula PIB n El • PIBI PIE!BI.. Por tanto.07 o bien.C\PrTVl.15 .O 4 PROBABIUDA.07 PG nA • PA · PGIA • .17.35.09 .05 . 0.37 . encontrar la probabilidad conjunta en la celda de 1• matriz de probabilidad es m's r'pido que usar la fórmula.06 . Y). el muestreo que SI realiza es.P(. Le probabilidad P(B n CI significa que uno de quienes contestaron tendría que trebejar en la industriamanufacturera y en la industria de comunicaciones El estudio utilizado para captar datos de los 200 ejecutivos. y descubrióque 72'141 de todos los empicados pimsa que trabajarcomo parte de un equipo reduce el estrés.28 P(A) • .6 Table de contingenciade datos de eventos independientes D E :~: Cm c.\ eventos X y Y 50n independientes.>ol y P( YIX) .28 P(A n S) = P(A) • PtS) = (.En consecuencia.La matriz no muestra lnteraección para estos dos eventos.PI.O IS )4 51 85 ley especial de la multiplicación Si lo. P(A¡ . sobre el espíritu de equipo en el lugar de trabajo.16'9 de la poblaciónpiensa que el cajero autom.la ley general de la multiplicaciónP(X n Y) . B y C son mutuamente excluyentes. Otro estudio de ~id M1cluelson & Associates para Dale Camegie & Associate.e> posible usar una ley especialde multiplicaciónpara encontrar la intcrs«ción de X y r.P(X) • P(. PROBLEMA DE DEMOSTRACIÓN 4. Al azar.-pr de trab3jo? Si son independientes. un inspectorescoge dos y una a la vez.entonce> la probabilidad de que una persona ~a sdeccionada al aur. Si X. se encuentra como sigue. P(X!Y). Por tanto. y son independientes. eventos.031 • .Sl una matriz de probabilidad contiene eventos independientes. estadounidensepimsa que el cajero automáticoha tenido el impacto ITW imponanteen la vida diaria.031(.28l(. LEY ESPEClAL DEU. ¿"<>n independientesde su> puntos de vista cobre el espíritu de equlpo en d h:.7 Una empresa manufacturera produce cuadernos de papel. Los puntosde vina de personas sobre CIJCTOS automáticos.i2) = . Por tanto. requirió que cada persona que haya contestado especificara sólo un tipo de industria para su compallia. los dos eventos son independientes.2016 Por Wlto.03.tticoha tenido un impacto importanteen la •ida diaria y que trabaiar como parte de un equipo reduce d c~trb. El problemaes determinar Pll1n121•1 Le probabilidadde 1 -O .Como el muestreo se realiza con reemplazo. futa ley especial utiliza d hecho de que cuando do. X. Debido al gran número de cuadernos que SI producen durante la inspección. no obstante. Denotemos por A un ajm> automáticoy por S que el trabajo en equipo reduceel estré. en esencia.TABLA 4. ~. que piense que el cajero automático ha tenido un impacto importanteen la vida diaria y que uabaµr como parte de un equipo reduce el estrés. euminó lo> puntos de vistade Cll'. o 3% es que son incorrectamenteencuadernadas.Ninguno de quienes contestaron esté en manufactura y en comunicaciones.0009 Casi todas las matrices de probabilidad contienen variables que no son independientes.>ol • P( Y) cuando X y Y son independiente>. Y son independientesPIX MUlllPUCACION n Y) • PtX) · P( Y) Un estudio realizado por Bruskin-Goldring Research para SEIKO encontró que 28'141 de adulto..la ley especial de la multiplicación . PIB n CI •.f'kad0$.Por tanto: PU1n121 • PU11 • Pll2I • (. con restitución..\1}') \C luce P(X n Y) • P(. ¿Cuál es la probabilidad de que dos cuadernos seleccionados estén mal encuadernadas? Solución Denotemospor 1 un encuadernado incorrecto. de los cuales 3% estén mal encuadernadas. 04 . P(En B) =_ b. P B n D) = ~~ = .17 a. P(CnF)=_ c. Científicos de la Princeton University y la University of Wisconsin reportan que alrededor de 15% de todos los adultos en Estados Unidos cuidan de familiares enfermos.1 vez y sin reemplazo.06 . Suponga que 11 % de adultos que viven en zonas urbanas cuidan de familiares enfermos.18 Según el grupo sin fines de lucro llamado Zero Population Growth (Crecimiento Cero de Población).CAPITULO 4 PROBABILIDAD 119 se puede aplicar.6 contiene datos de eventos independientes. P(En D) =4. Utilice los datos de la tabla 4. ¡cuál es la probabilidad de que ambas piezas sean defectuosas? 4.2353 U PROBLEMAS 4. P(AnB) =4. C A D E F 11 16 8 B 7 a. Si se repite este experimento.06 a.13 . Nótese que la respuesta obtenida con el uso de la fórmula es la misma que la respuesta obtenida con el uso de la información de la celda de la tabla 4. ¿cuál es la probabilidad de que ambas piezas sean defectuosas? b. P(Dn E)=d. P(An E)=_ b. A D E F . Un lote de SO piezas contiene seis defectos.18 e . .09 . una a l. con sustitución. Solución P(B n D) = P(B) · P(D) 5o = 85 · 34 85 = .12 .6.7 exploramos una técnica para determinar si son eventos independientes.16 Use los valores de la matriz de probabilidad para resolver las ecuaciones dadas. 78% de la población de Estados Unidos vive ahora en zonas urbanas.15 Use los valores del cuadro de contingencia para resolver las ecuaciones dadas. En la sección 4. P(DnB) =_ c.24 . La tabla 4.6 y la ley especial de la multiplicación para encontrar P(B n D). Si al azar se sacan dos piezas. la ley especial no se puede usar. 2353 Este método funciona sólo para cuadros de contingencia y matrices de probabilidad en las que la variable de un lado de la matriz es independiente de la variable del otro lado de la matriz. Si no.08 B . ¿Cuál es la probabilidad de seleccicnar al azar una persona del público viajero y encontrar que ti o ella digan que: la selección del nido ~t.120 ESTADISTICA E. del público viajero que dijo que SU) selecciones de vuelo Nán influenciados por percepciones de seguridad desea saber la edad del avión. ¿Cuál es la probabilidad de que el adulto no tenga educación univcnitaria ni posea acciones! c. ¿Cuál n la probabilidad de que el aduho posea acciono o tenga algun grado de educación unÍ\wsitaria? d. Además.19 Un estudio de Peter D.21 Un estudio de Becker A:1. a. ¿Cuál o la probabilidad de que la familia tenga ventilador de techo o una parrilla para llS3rl b. determine la probabilidad de que un adulto que vive en zona no urbana cuide de un familiar enfermo. el estudio determinó que 75% de todos lo. Se selecciona al azar una familia. Se selecciona un ciudadano al azar. ¿Cuál es la probabilidad de que la casa tenga fu o una computadora personal! c.S. . ¿Cuál es la probabilidad de que la familia no tenga \~ntilador de techo ni una parrilla para asar? . a. Comtru)OJ una matriz de probabilidad y muestre en dónde se encuentra la rC'SpUC'Sta a este problema en la matriz.i influenciada por percepciones de la seguridad de la aerolinca y desea conocer la edad del ª'ión? 4. 10% de todas las familias en E&tados Unidos tienen un fax y 52% tienen computadora personal.22 El U. d. ¿Cuál es la probabilidad de que la ca>a tenga fax y no tenga una computadora personal? d. Suponga que s. acaorusus adultos de Eittados Unidos tienen algún grado de educación uni.i influenciada por percepciones de la seguridad de la acrollnca ni desea conocer la edad del avión? c.Cuál es la probabilidad de que la casa tenga fu y una computadora personal! b. consultor de viajes de San Diego. 4. Unido> tienen alglin grado de educación uní· versitaria.20 Según la Consumer Electronics Manufacturen As. ¿Cuál es la probabilidad de que ti adulto posea accione y tenga algún grado de educación UIU\°miwU? c. Encrgy Dtpartmmt expresa que 60% de todas !. (Cuál es la probabilidad de seleccionar al azar una persona del público viajero y encontrar que ti o ella digan que la selección del vuelo no ot.u familW en Estados Unidos tienen ventiladores instalados en el techo.!I o ella digan que la selección del vuelo no ot. Treinta y nueve por ciento del publico \·iaiero desea saber la edad dd avión. a.. ¿Cuál o la probabilidad de seleccionar al azar una persona del público viajero rencontrar que .llldos Unidos que viva en zona urbana y cuide de un familiar enfermo. b. tienen ventiladores de techo r parrilla para asar. 29% tienen parrilla para »31 al aire libre.'I LO~ SEGOCIOS a.c¡¡. a. ¿Cuál o la probabilidad de que el adulto no posea acciones o tenga educación univer-ltaria! f. ¿Cuál es la probabilidad de que la ca>a no tenga fax ni una computadora personal! e.i influenciada por percepciones de la seguridad de la aerolínea y no ddca conocer la edad del ª'ión? b. Se selecciona al aur una familia de Estado> Unido>. ¿Cuál C'S la probabilidad de que el adulto no tcn¡:a acdono? b. ¿Cuál es la probabilidad de que la casa no tenga fax pero si tenga computadora personal! 4. Hart Research Asseciates para el ~asdaq Stock ~larket revelé que 43% de todos los adultos en ütadO> Unidos son accioni-w.6ociation. ¿Cuál es la probabilidad de que el adulto tenga alguna educación univer>itaria y no posea acnoncs? 4. Suponga que 91% de toda¡ las familías en Estados Unido> que tienen fax también tienen computadora personal. AdenW. Suponga que 3i% de: todo> lo> aduho> de ütado. De la nutriz de probabilidad.·enitaria.<0eiatcs. encontró que 30% del público \-iajm> dijo que sus selecciones de vuelo están influenciado> por percepciones de seguridad de la aerolínea. ¿Cuál es la probabilidad de seleccionar al aur un adulto de la población de Estado> Unidos que viva en zona urbana y no cuide de un familiM enfermo? c. Utilice la ley general de la muhiplicad6n pua determinar la probabilidad de seleccionar al azar un adulto de la población de E.. Suponga que 1 }'MI de estas familia. Nótese.70 Ochenta por ciento de trabajadores que piensan que la reducción de ruido mejoraria la productividad también creen que si se aumenta el espacio de almacenamiento mejoraría la productividad. Este trabajador piensa que la reducción de ruido mejorarla la productividad. Se seleccionó al azar un trabajador y se le pidió sobre cambios en diseño de oficina.56 P(SnN) = . Y son dos eventos.70 P(SIN)= e::. La fórmula para probabilidad condicional se deduce al dividir entre P( Y) ambos lados de la ley general de la multiplicación. ¡Cuál es la probabilidad de que este trabajador piense que aumentar el espacio de almacenamiento mejoraría la productividad? Esto es.56 = . que el área para N del diagrama de Venn está sombreado por completo el área del trabajador que piensa que la reducción de ruido mejoraría la producnvidad. Si X. suponga que 56% de quienes respondieron pensaron que la reducción de ruido y el aumento en espacio de almacenamiento mejorarían la productividad. En el estudio de Yankelovich Partners para determinar qué cambios en el diseño de oficinas mejorarían la productividad. porque esta parte de reducción de ruido incluye más espacio de almacenamiento y es la única que aumenta en relación con la reducción . la pregunta es P(SIN) =? Nótese que parte de información dada aparece a la derecha de la línea vertical de la probabilidad condicional. La solución utilizando la fórmula es: P(SIN)= P(SnN) P(N) P(N)=.CAPITULO 4 PROBABILIDAD 121 c. Además. 70% de quienes respondieron pensaron que la reducción de ruido mejoraría la productividad y 67% dijeron que aumentar el espacio de almacenamiento mejoraría la productividad.. También nótese que la intersección de N y S está más sombreada.80 P(N) . en la figura 4. ¡cuál es la probabilidad de que una persona seleccionada al azar piense que el espacio de almacenamiento mejorada la productividad dado que él o ella piensan que Ja reducción de ruido mejora la productividad? En símbolos.1 l. la probabilidad condicional de que X ocurra dado que Y se conoce o ha ocurrido se expresa como P(XIY) y se da en la ley de probabilidad condicional: u:"" DE ~ABlllDAD CD !ffi!CIONAL P(XIY)= P(XnY) P(Y) = P(X)·P(YiX) P(Y) La probabilidad condicional de (XJ Y) es la probabilidad de que X ocurrirá dada Y.PROBABILIDADCONDICIONAL Las probabilidades condicionales se calculan con base en el conocimiento que un experto en estadística tenga sobre uno de los dos eventos que estudie.''tHI• ~bilidad -::::-<l1Cional de '1:'2'·'01 espacio de mt"'acenamiento :a:a una ~sJCCión de ruido y P(SnN)=. ¡Cuál es la probabilidad de que la familia no tenga ventilador de techo y tenga parrilla para asar? d. ¡Cuál es la probabilidad de que la familia tenga ventilador de techo y no tenga parrilla para asar? . 67 . P(no N n S) se encuentra como la intersección de No para ruido y Si para almacenamiento. Este valor es 0. Para reiterar lo que ya se mencionó.7 Aumenforapodode almaunmnimto Sf Matriz de probabilidad para el problema de diseño de oficinas IWuccl6n de ná4a No Sf~. Por tanto.67. por ejemplo.33 1. la matriz de probabilidad tiene la información necesaria para resolver una probabilidad condicional. se presentaron los datos que relacionan a las mujeres de la fuerza laboral de Estados Unidos. que es la columna marcada con Sí para espacio aumentado de almacenamiento.7.11. a veces debe usarse la segunda versión debido a la información que se proporciona en el problema. estamos interesados sólo en la columna sombreada en la tabla 4.4% trabajan tiempo parciaL ¿Cuál es la probabilidad de que un trabajador de Estados Unidos seleccionado al TABLA 4. En consecuencia: P(no NIS) P(no NnS) P(S) ~=. P(no N n S) es O. una matriz de probabilidad contiene sólo dos tipos de probabilidad. P(X n Y)IP( Y).30 .! l. En esta información se incluye el dato de que 46% de la fuerza laboral de Estados Unidos son de mujeres y que 25% trabajan tiempo parcial. se sabe que 17. marginal y conjunta.70 No . La probabilidad marginal. P(S) es el total de esta columna y se encuentra en el margen al fondo de la tabla como 0.164 . 7 para el problema del diseño de oficina. ¿Cómo se determinan las probabilidades condicionales desde una matriz de probabilidad? La ley de probabilidades condicionales muestra que una probabilidad condicional se calcula al dividir la probabilidad conjunta entre la probabilidad marginal Entonces.6. Examine la matriz de probabilidad de la tabla 4. Los valores de celda son probabilidades conjuntas y los subtotales de los márgenes son probabilidades marginales.122 ESTADISTICA EN WS NEGOCIOS de ruido y como las personas saben que favorece la reducción de ruido. en la sección 4. Corno ejemplo. cuando se resuelva P(XjY) pero se da P(YjX).67 La segunda versión de la fórmula de la ley de probabilidad condicional es: P(XjY) = _P(_X_)· P_(Y~IX_) P(Y) Esta versión es más compleja que la primera. ¿Cuál es la probabilidad para que un trabajador seleccionado al azar piense que la reducción de ruido mejoraría la productividad dado que el trabajador cree que aumentar espacio de almacenamiento mejoraría la productividad? Esto es: P(noNjS) =? La ley de probabilidad condicional expresa que: P(noNnS) P(no NIS) P(S) Nótese que como S está dada. Sin embargo. Además. La segunda versión de la fórmula se obtiene de la primera versión al sustituir la fórmula por P(X n Y) = P(X) · P(YjX) en la primera versión.00 . Ninguna de las probabilidades dadas en la matriz son probabilidades condicionales. es la única área de interés que incrementa el espacio de almacenamiento. P((DIFl) MATRIZ DE VALORES SIN PROCESAR Ubicación geográfica Tipo de Industria Noreste D Sureste E Región central F Oeste G Finanzas A 24 10 8 14 Manufacturas 8 30 6 22 12 Comunicaciones C 28 18 12 16 74 82 34 42 42 200 J 1 56 70 .661 Por tanto.46 P(T) = .25 La probabilidad de que un trabajador sea mujer. dado que la persona trabaja de tiempo parcial. que no se da aquí.174 P(TjW) = . Por tanto.46)(. PROBLEMA DE DEMOSTRACIÓN 4. P(W n T). En general.CAPfTUW 4 PROBAB!UDAD 123 azar sea mujer si se sabe que es trabajador de tiempo parcial? Denotemos por W el evento de seleccionar una mujer y por T el evento de seleccionar un trabajador de tiempo parcial.25) (. 66. intentamos la segunda versión de la ley de probabilidades condicionales que es: P(WjT) =-P(_W_)·_P_(T~jW_) P(T) Para esta versión de la fórmula. la pregunta es: P(WIT) =? La primera forma de la ley de probabilidades condicionales es: P(WjT)= P(WnT) P(T) Nótese que esta versión de la ley de probabilidades condicionales requiere el conocimiento de la probabilidad conjunta. es probable que esta segunda versión de la ley de probabilidades condicionales se use cuando P(X n Y) se desconozca pero P( YjX) sea conocida. Utilice estos datos para encontrar: a. P(BIFl b. P(GICl c.174) = . En símbolos.9 Los datos de las entrevistas a ejecutivos dados en el problema de demostración 4.2 se repiten aquí. se puede calcular ahora: P(WIT)= P(W)·P(TjW) P(T) (. todo se da en el problema: P(W) = . l % de trabajadores de tiempo parcial son mujeres. 111.00 • 00 PIDI .¡ lo• eventos son independientes.X}. La razón fundame"" tal que esta tras PIOIF) • O es que.\1)'} • PI. no importa que X o Y se dé porque X y Y son indtpendicnta.OS !'EGOCI05 MATRIZ OE MOeABIUDAD Región Noreste Sureste .10 Pruebe con la matriz para las 200 respuestas de ejecutivos pare determinar sí el tipo de industria es independiente de la ubicación geográfica.Y Para determinar i X y r son eventos independientes. es un proceso relativamente fácil. PROBLEMA DE DEMOSTRACIÓN 4..37 b. PID n F) es cero y así es PIDJFI.12 .\1 • P(}1 En cada ecuación. la probabilidad marginal.'DIENTES X. Unir estas dos probabilidades por medio de la fórmula produce la respuesta.. PIB n FJ. la probabilidad conjunta. Cuando X y Y independientes. puede usarse la 'iguiente definición.17 . si se da F (quien se sabe contestó que está ubicado en el Región Central).Si (UQ!quitr combinación de do.06 .08 .124 ESTAObTlCA E.09 .\1)'} . ICI son del Oeste (G).11 .21 ' c. En este caso. quien contestó no podría estar ubicado en O (el Noreste). la probabilidad condicional se resuelve como una probabilidad marginal. aparece en un margen (.-. aparece en una celda de la matriz 1. P(X) y P(Yl.35 . . P(.211.03 Comunaciofl# C .28 .37 . lados dífnmlQ de la matriz no pasa la prueba. Este resultado significa que 21.21 .52• Esta respuesta significa que 52. eventos de lo.111. con el uso de la formula.06 . P(.21 1.07 .•% de los ejecutivos del Región Central (los valores fl están en manufactures (los valores B).. PIGIC) • PIG n CI • .PEi.. PIF). PIDIF) • PID n F) • .lOS l~OE.21 ' • lJI determinación de probabilidades condicionales desde una matriz de probabilidad. Eventos independientes EVE.15 . la matriz no contiene eventos independientes.05 Manuf«:rura1B . • 52• PIFI .00 Solución PIB[FI • PIB n fl • d!. A \'CCO.6% de los ejecutivos de la industria de comunicaciones que respondieron. Como O y F son mutuamente excluyentes. .216 PICI .1' D ~ tHi /ndulfrl• E central F Oeste G ·º' . es importante probar con el cuadro de contingencia de materiales sin procesar para determinar .21 • .: l.08 • . mientras que 9. 57% de demócratas piensan De acuerdo con estas cifras. Cincuenta y cinco por ciento de consumidores de salud (HMO) son buena idea. El articulo indica que 51 % de consumidores piensan que la aprobación de nuevas leyes sobre estas orgamzaciones son una buena idea.49 P(buena ideajsin seguro) = . pero 32% de consumidores • ~nsan que es mala idea. otros piensan que estas organizacionesnecesitan reformas.43 P{sin seguro U buena idea) = P(buena ideaj18 a 29) = . 5. más..!± 42 (por ejemplo A-Finanzas y G-Oeste•.32 P(sin seguro) · P (buena idea/sin seguro) El apoyo para la aprobación de este reglamento varía = (0.7% de con!8 a 29 piensa que nuevos reglamentos son una buena idea.058 P(sin seguro n buena idea) = P(buena idea) = .126) (0.097 segun la afiliación política de los partidos. Un articulo publicado en The Wall Street fournal el 25 de junio de 1998 presenta numerosas estadísticas respecto a estadounidenses y su serñcio de salud.P{sin seguro n buena idea) P(buena ideajMedicare/Medicaid) = . pero sólo 43% de republicanos piensan lo reglamentos para las organizaciones de administración de mismo. Por ejemplo.1 % de Ja población de Estados Unidos no tiene seguro: P(:2:65) = .CAPITULO 4 PROIW!!LIDAD 125 •Hº·1H•10¡111. Cuarenta y nueve por ciento de consumidores que tieCon el uso de la ley de la adición.t. sumidores no tienen seguro y piensan que nuevos regla· pero la cifra cae a 46% para consumidores de 65 años o mentos para estas HMO son una buena idea. son una buena idea: P(buena ideafdemócrata) = . Census Bureau reporta que 12.097 = 0.16i + 51 .¡s111+Ii!.60) = 0.. ¿Es y P(AJ = ~ 200 .S. _ Las HMO: las probabilidadesde regular y reformar El movimiento hacia las HMO (Health Management Organization) de proveedores de salud tradicionales ocució rápidamente en la década pasada.8% de consumidores tieque aprobar nuevos reglamentos sobre las HMO es una nen por lo menos 65 años de edad y piensan que nuevos buena idea. Aun cuando algunas ~nas están satisfechas con las HMO.57 P(buena ideajrepublícano)= ..f'·11:1.60 = 0. y 60% de consumidores que no tienen seguro apoyan los calcular las probabilidades de unión como Jo es la probabinuevos reglamentos.0.46) = 0.51 y P(mala idea) = .46 .161 = Algunas de estas probabilidades se pueden combinar para obtener probabilidades de intersección como son: P(:2:65 n buena idea) = P(:2:65} .161) (0.6% de la población tiene por lo menos 65 años de edad y 16.55 P(sin seguro) + P{buena idea) P(buena ideal65 o más) = . podemos también nen Medicare/Medicaid apoyan Jos nuevos reglamentos.574 MATRIZ DE VALORESSIN PROCESAR Ubicacióngeográfica Noreste O Tipo de industria Sureste E Región central F Oeste G Fi':}anzas A 24 10 8 14 Manufacturas B 30 6 22 12 ComunicacionesC 28 18 12 16 74 82 34 42 42 200 56 1 70 Solución Seleccione una industria y una ubicación P(AjG) = P(A)? P(A!Gl = geográfica .126 y P(sin seguro) . el U. edad y tipo de seguro que se tenga. Estas cifras se pueden expresar como lidad de que un consumidor seleccionado al azar no tenga seguro o piense que los nuevos reglamentos para las HMO probabilidades condicionales. Estas dos cantidades pueden verse como probabilidades marginales: Además. P(buena ideaf:2:65) = (0. ~"EGOCIO~ ¿ 14142 es igual a 5612007 No. la tabla 4.- b.-: L()<. PIAIDI .. • 38 4 • .2353 PIAI • !~ • . P(AJB) =- D .11 O E A~1220 8 20 30 50 e s 9 15 34 51 85 Solud6n Pruebe la primera celda de la matriz para encontrar si P!AJDI • PIAI. P(EJG) • _ :m 4. a.4 PROBLEMAS 4. E F G 15 12 8 8 11 17 19 e 21 32 2. PíBIDJ •_ c. P(qE) d.126 FSTADISTICA E. En esta matriz. 4. Por tanto.. P(BJF) =- =- c.lJ L'tilice los valores de la tabla de contingencia para resolver las ecuaciones dadas. todas las posibilidades se comprueban. D 18 13 12 PlGIA> • _ b. C •. . PROBLEMADE DEMOSTRACIÓN Determine si la tabla de contingencia que se muestra como tabla 4.2353 El proceso de prueba debe continuar hasta que se determine que todos los eventos son inde· pendientes.6 y repetida aquí conuene eventos independientes. El tipo de industria y la ubicación geográfica no son independientes porque por lo menos está presente una excepción a la prueba.6 contiene eventos independientes.28. 4.33 .24 Ulilícelos valores de la tabla de contingencia para resolver las ecuaciones dadas. . P(CjA) . 25 A continuación aparecen los resultados de un estudio que pregunta: "¿Tiene usted calculadora y/o computadora en su casa?" Calculadora Sí Computadora 5{~6 No No 3 49 11 15 26 57 18 75 ¿Es la variable calculadora independiente de la variable computadora? ¿Por qué si o por qué no? 4. Suponga que de quienes prefieren servicio a dientesen VÍ\'O para comprar boletos de avión.27 Arthur Andersen Enterprise Group/National Small Business United.CAPITULO 4 PROBAJllUDAD 127 4. ¿Cuál es la probabilidad de que el propietario piense que la economía es un desafío de crecimiento. un estudio de usuarios en línea fue realizado por Iupiter Communications para determinar por cuál tipo de compra es que un consumidor prefiere un servicio a dientes en vivo.26 En 1997. Si se selecciona al azar a un usuario en línea. a. según Dun & Bradstreet. El propietario de un pequeño negocio se seleccionó al azar. ¡Cuál es la probabilidad de que el negocio no esté situado en estados del Atlántico sur si se sabe que el negocio es de la construcción? e. ¡Cuál es la probabilidad de que el propietario piense que ni la economía es un desafiopara el crecimiento fil encontrar trabajadores capacitados es un desafío para el crecimienm? 4. si el propietario piensa que encontrar trabajadores calificados es un desafío para el crecimiento? b. Washington. ¿Cuál es la probabilidad de que el negocio esté situado en estados del Atlántico sur? b. ¡Cuál es la probabilidad de que el propietario piense que encontrar trabajadores capacitados es un desafío para el crecimiento. Suponga que 15% de los propietarios de pequeños negocios seleccionó tanto la economía como encontrar trabajadores capacitados como desafíos de crecimiento. seleccionado por 46% de los propietarios de pequeños negocios. era la economía. ¡Cuál es la probabilidad de que el negocio sea de la industria de la construcción o esté situado en estados del Atlántico sur? c. Dado que el propietario no selecciona la economía como desafío para el crecimiento. las quiebras financieras en Estados Unidos llegaron a 83 384. ¿Cuál es la probabilidad de que el negocio sea de la industria de la construcción si se sabe que el negocio está situado en estados del Atlántico sur? d. Cuarenta y siete por ciento de los usuarios respondieron que cuando compran boletos de avión. Dado que el negocio es de la construcción. realizó una encuesta nacional de propietarios de pequeños negocios para determinar los desafíos de crecimiento de sus negocios. Suponga que 1 258 de todas las quiebras fueron negocios de construcción situados en estados del Atlántico sur. La industria de la construcción tuvo 10 867 de estas quiebras. ¡cuál es la probabilidad de que el negocio no esté situado en los estados del Atlántico sur? 4. Un negocio en quiebra de 1997 raras veces se muestrea al azar. a. Cuál es la probabilidad de que el negocio no esté situado en estados del Atlántico sur si se sabe que no es negocio de la construcción? f. si el propietario piensa que la economía es un desafío para el crecimiento? c. Un cercano segundo lugar fue el de trabajadores capacitados (37%). determine las siguientes probabilidades: . El principal reto. prefieren servicio a clientes en vivo. ¿cual es la probabilidad de que el propietario piense que encontrar trabajadores capacitadas es un desafío para el crecimiento? d. 81 % prefieren servicio a clientes en vivo para transacciones de préstamos. Los estados del Atlántico sur tuvieron 8 010 quiebras.28 A fines de 1998. Si se selecciona al azar un contador. REGU DE BAV'tS P(x ' In- P( x'>· P<YI.'O pua comprar boletos de a\ión. Suponga que 97% de los contadores que compran su hardware por pedido directo por correo compran su software por pedido directo por correo.) mismo. 4. El usuario en linea no prefiere servicio a dlentes en vi\'O para transacción de préstamos pero si para comprar boletos de avión. d. El contador no compra su software por pedido directo por correo dado que no compra su hardware de la misma manera. c.128 ESTADISTICA tx LOS SEGOCIO~ a. determine las siguientes probabilidades: a.8 REVISIÓN DE PROBABILIDADES: REGLA DE BAYES Una extenslén de la ley condicional de probabilidades es la regla de Baycs.29 Arco11111i11g To•"'Y reportó que 37% de contadores compran su hardware de computadora por pedido directo por correo y que 54% compran su software de la misma manera.) R«ordcmos que la ter de probabilidad condicional para l'(Xdl') Es: P( XJY) • P(X.Representa un promedio ponderado de las probabilidades condidonales. con los valores de las probabilidades previas del evento correspondiente.. Los numeradores de la regla de Bares)' la ley de rrobabili<UJ condicional son los mismos.La regla de Bayn es unafJrmulaqucatk1ulccl uso dt 111 ley dc probabilidallts condiciona/n para permitirla rtviswn dt probabüida. c. b. con la interseccíén de X.. El contador no compra su hardware por pedido directo por correo si se sabe que no compra su software por pedido directo por correo.ón y pua transacción de prbtamos. +P(Xn)·P(YIX. Este dmominador se conoce a veces como la fórmula dt probabilidadtotal. El contador compra su software por pedido directo por correo dado que no compra su hardware por pedido directo por correo. El usuario en linea prefiere servicio a clientes en vivo para transacción de préstamos pero no prefiere servido a dientes en \+. incluyendo el evento (X. El contador no compra su hardware por pedido directo por correo si se sabe que compra su software por pedido directo por correo. b. 4. Y. . El usuario en linea prefiere servido a clientes en vlvo pua comprar boletos de in. que fue aca<U por Thomas Ba)~ (1702-1761) en cU)'O honor lb-a su nombre.xi > P(X1)·P(r!Xi)+P(X2)·PO'IX2)+ . El denominador es entonces una lista cxhausth-a y colectiva Je resultados mutuamente excluyentes de Y. La nueva airactmstka que usa la regla de Bayesse encuentraen el denomlnador de la regla: El denominador de la regla de &)n índuye una n:pmión del producto (intersccdón) pua cada partición del espacro maestral.) · P(t]X1) • íl PO') Compare la regla de Bayes con esta regla de probabilidad condicional. y Y m0$lrada en forma de regla general de la multiplicadón.lts originalts con nuC\11 informad6n. . Un cliente compra una cinta nueva. .8.. La tabla 4..4% de todas las dotas son defectuosu (Alamo r defectuosas == .. El proceso se inicia con las probabílidades previas: ...) de Alamo son defectuosas: (. 8te porcentaje incluye las únicas cintas de interés de South Jer>ey porque la cinta comprada es defectuosa.~tas K llaman pro· babilidades previas porque están basadas en la información original. La nueva información de que la cinta e) defectuosa cambia las probabilidades porque una compsl\fa produce un porcentaie mh aho de cintas defectuosa> que la otra compañla.. Alamo Ribbon Compan)· y South Jeney Products. ¿cuál b la probabilidad de que Alamo produjo la cinta? ¿y de que South Jerwy produjo la cinta? La probabilidad era . las probabilidades poneríoreso revisadas.094 que son defectuosas.OS2 . ~tas dos pro· babilidades condicionales aparecen en la tercera columna. Como la cinta comprada e> defectuosa.35) • .Cy que es defectuosa.. la regla de Ba}~ hace posible que d experto en estadística haga nuevas y diferentes aplicaciones con el uso de probabilidades con· dicionales.042.08.u de South Jersey son defectuosas.65) = .3 . La columna 4 se totaliza para obtener .65 de que la cinta provino de Alamo y . no son de interés porque la cinta comprada e> defectuosa. Un tipo panicular de cinta de ímpre-ora es producida por sólo dos compañías. que $00 aceptable>.6% de las cintas.. ·1 Pfli!!¡) ProbebWdecl caajuDta P(E¡ I"\ 111 . lo~ estadísticos usan la regla de Bayb para revistarprobabilidades en vista de que hay nueva información. que indica que 9.. En.52 o 'lea 5. éstas son las únicas cint. •• 1=. la probabilidad de South )er>ey se revisaal dividir la probabilidad conjunta de . TABLA 4.2% del total. ~ta cantidad tambito aparece en la cuarta columna de la tabla 4.. entre la probabilidad total de que la cinta o defeetuosa (. En particular. ..094 P42 094 '"' 44~ .implica dividir cada valor de la columna 4 entre el total de la columna 4. Esta probabilidad e> menor que la probabilidad previa u original de .8.Dividir . ¿Cuál es la probabilidad de que Alamo produjo la cinta? ¿Cuál es la probabilidad de que South Jcr¡ey produjo la cinta? La cinta se prueba y multa defectuosa.35 de South Jersey..12 ~ l'{~)·..052 entre .. . El otro 90. . t:na forma de trazar una revisión del problema de probabilidades es usar una tabla. es la probabilidad conjunta de obtener una cinta que fue hecha por Alamo y es defectuosa. .052 del total de cintas son Alamo y defectuosasdel total de .~ Pu' ~2 .094 ). Debido a que el producto K encontró defectuoso deben usarse las probabilidades condicionales P(defcctuoso!Alamo) y P(deftctuosolSouth JefKY). Para calcular esta quinta columna. Ocho por ciento de las cintas producidas por Alamo son defectuow y 12% de ~ cintas de Soutb Jeney son defectuosas. Esta cantidad aparece en la cuarta columna de la tabla 4.. Suponga que Alamo produce 65% de w cintas y que South Jersey produce 35"<>. La cinta defectuosa es ahora menos probable que provenga de Alamo que antes de saber de b anta defectuosa.094 da .08 .094 ·m· « .CAPITULO 4 PROBABIUDAI> 1 ?9 Al expresar la ley de probabilidades condicionales en esta nueva forma.8 muestra el análi>i) del problema de la cinta. Ocho por ciento de 65% de las cinta.55.8: (. Ahora..3S e .65 Afamo y .094.35 South Jerwy. ¿Cómo puede usarse esta información para actualizar o revisar las probabilidades originales? La rtgla de Bayes permite esta actualiudón.042).:tuoso!Alamo) • .....li de interés de Alamo. Ocho por ciento de las cintas de Alamo son defectuosas: P(defe.. la multiplicación de estos dos porcentajes da la probabilidad conjunta de obtener una cinta de South Jef'.12.8 Tabla de Bayes para revisión de probabilidades del problema de cintas . Para Alamo.52 + South Jer-cy y defectuosas • .553 como probabilidad revisada de que la cinta comprada fue hecha por Alamo. Doce por ciento de 35% de las cint..08)(.2% de todas las dnt.u son hechas por South Jersey y son defectuosas..042 o sea '4.u probabilidades previas aparecen en la "!!Unda columna de la tabla 4. IW "' ..65 porque menos de las cintas de Alamo (como porcentaje) son defectuosas que las producidas por South Jenq·. de que la cinta t'ú hecha por South Jer\t)' y es defectuo"1. Doce por ciento de las cintas de South Jerser son defectuosas: P(defcctuosolSouth Jersey) • .12)(. porque la máquina A produce 60% de todas las piezas . De todas las piezas producidn.70 de las piezas hechas por la máquina C con piezas X.12 4 Las máquinas A. pero .094.130 l:STADb°TICA L" tos NF. Usar el número total de cintas defectuosas. C:h1tHF• . las probabilidades condicionales.u se emplean para revisar y calcular las posibilidades pcsteríores.308 El resultado C$ . Por ejemplo. se pueden usar para revisar las probabilidades previas para obtener probabilidades posteriores. sólo las ramas pertinentes se seleccionan y utilizan.553 . las probabilidades conjuntas y la probabilidad marginal. 40% de las pieza hechas por la máquina A son pieza X. B y C producen todas las mismas dos piezas. la máquina A produce 60%. ° Probabilidad revisada Alamo = ·09 52• . La tabla siguiente muestra cómo es que las probabilidades previas. pero se sabe que es una pieza X. Nótese que el diattrama de árbol contiene todas I~ posibilidades.094 • . Cuando se da nueva información.042/. revise las probabilidades de que la pieza pro· venga de la máquina A. .042 . el cálculo es como sigue. La probabilidad previa es .447.50 de las piezas hechas por la máquina By . .10 de que provenga de C. P()(). la máquina B produce 30% y la máquina C produce 10%.• apropiad. Con el conocimiento de que es una pieza X. 4 Probabilidad revisada: South JeNy • ·09042• . Los diagramas de árbol son otra forma comun de resolver problemas de la regla de Bares. 50% de las pieza hechas por la máquina B son pieza X. incluyendo cintas defectuosas y aceptables.042 '"' .. Las probabilidades condicionales muestran que las diferentes máquinas producen proporciones distintas de piezas X. Una pieza producida por esta compal'lla es muestreada al azar y se determina que es una pieza X. SokK'6tl La probabilidad previa de que la pieza provenga de la máquina A es . Ademú. B o C.052]- Diagrama de árbol para probabilidades del problema de cintas . 70% de las pieza hechas por la máquina C son pieza X. La figura 4. X y Y.447 • PROBLEMA DE DEMOSTRACIÓN 4.40 de las piezas hechas por la máquina A son piezas X. .052 + . Estas probabilidades previas son más pertinentes si no se sabe nada acerca de la pieza.30 de que la pieza provenga de B y . Es lógico que la probabilidad de que la pieza provenga de la máquina C aumentaría y que la probabilidad de que la pieza fue hecha en la máquina A aumentaría porque la pieza es una pieza X.12 muestra la solución para el problema de la cinta.598 .GOCIO:.60. Los valores de probabilidad conjunta al final de las rama. La probabilidad de que la cinta defectuosa o de Soulh Jmey aumeruó porque un porcentaje más alto de cintas de South Jeney son defectuosas.094 . .C\PIT\Jl.. Alicia de.pacha incorrectamente 1:!% de los pedidos que toma. máquina B o máquina C.J!. ¿Cu. productos de la máquina C son defectuosos. Juan despacha incorrectamente 5% de los pedidos que toma.24 . ¿Cu.46 - .60 . Acaba de despacharse una orden. 12% de loo.15 .. ¿Cuál es la probabilidad de que Alicia despaché el pedido? b.24 ~.lquina A. es evidente que la probabilidad de que la pieza sea hecha en la máquina A disminuyeron y que las probabilidades de que le pieza fue hecha en las máquinas B y C aumentaron..o. Se desconoce quién despachó el pedido. 52 .46 .lquina A son dcfcctuo.lle.33 . ¿Ciúlcs son las probabilidades revisadas de que Alex.46 .46 • 15 P!)() . Alicia o Juan despacharan el pedido? d.lquina e produce 50% de este producto. 4. la m.03 "5 PROBLEMAS En una planta manufactuma.52 .10 .36 ..15 .:.07 ~. Probabilidades revisadas: Máquina A: Máquina B: :!: • :!: • Máquina C· . Se desconoce quién despachó el pedido. Alicia o Juan despacharan el pedido? 4.40 B .. Alicia y Juan despachan pedidos en un restaurante de comida rápida. pero éste se despachó incorrectamente.70 Evento Conjunta P(Xn E' (.30 . Alcx despacha 30% de todo) lo) pedido). Un diagrame de árbol presenta otra viste de este problema. fJ inspector de la compaflia ha muestreado un producto de esta planta y ha encontrado que es defectuoso..46 .30 .15 .lqwna 8 produce 40% de este producto. a. y la m.il es la probabilidad de que se haya despachado correctamente? c.lquina A produce 10% de cieno producto. 33 Une vez revisadas las probabilidades. Alicia despacha 45% de todos los pedidos y Juan 25% de todos los pedidos. productos de la máquina B son defectuosos y 8% de loo.31 Alex.15 . Si el pedido fue despachado por Juan.50 e . la m. pero 6te se despachó correctamente.601(. Cinco por ciento de !O> produetos de la m.07 .04 Previa PIE' Condldonal Pl~E' A .07 . son ~ probabilidades revisadas de que Alo. Determine las probabilidJdcs misadas de que el producto muestreado fue producido por la m.40) PROBABlllDAD 131 Posterior . Alcx despacha meorreetamente 20% de los pedidos que toma. n C) • 100 - 155 31 9 122 + -155 . La proporción de gerente> que son mujeres en la compallia e» menor que la proporción de todos los trabajadores de c>ta compañía que son muiere •.246 • . algunos de los cuales podrlan ser justificables por la compatlia. P(W). P(Ffl1 = 1 i/69"' . que no dan capacitación son pequeñas. la probabilidad de que el trabajador sea mujer. pregunta. La probabilidad de que el ganador sea mujer )' gerente es una probabilidad conjunta.019 . 51. ¿Cuál o la probabilidad de que una mujer sea selecdonada. la probabilidad de que el empicado o. La prob.ibilidad nwginal de que el ganador sea un prefesional C$ P(P) • 4-l/155 • .-po11&3 que al azar se selecciona un empleado técnico para darle un bono.ca mujer. gerenciales. en el Dilema de decisión ~ muestran en forma de matriz de valores sin procesar. es decir: Pl.32 En un pequeño poblado. Dado que d empicado tiene una posicién gerencial. P\ Fff) • ? Al aplicar b ley de probabilidades condicionales a la matri1 de valore> sin procesar dada en el Dilema de decisión. Se muestrea al azar una compatlia sin consi~erar su tamatlo. Con el uso del concepto de eventos complementarios. ~ta probabilidad margin. es posible cstad~ticamen· te responder la. ~ más de tres veces probable que un técnico seleccionado al azar sea hombre. Trtinta por dmto de lo. lo> empleados de la compañia cliente 50n muiere>.4. Suponga que 65% de toda. pero quienes toman decisiones en la compañía podrían presentar entonces documentación de los criterios de seleccién basados en productividad.33 Las comparuas dan capacitación a empleado. las compañías dan alguna capacitación a sus empleados pero que esta cantidad varia según el tarnatlo de la compañía.355. es decir.246. fcniliudo. dos companías de jardinerú fertilizan prado> durante c:I verano.tl india que alrededor de 355% de todo. Si al azar <e selecciona un trabajador de lo> 155 empicados. sugerencias técnicas.. ¿Cuál es la probabilidad de que la compatlia dé capacitación? ¿Qué proporción de todas las compaflias no o pequeña] Igualdad de géneros en el lugar de trabajo Los dato. prado.754.P(M . por Tri-State podrian clasiñcarse como muy sanos un mes después del servicio. dado que el trabajador es un empicado técnico? Es decir. P(F n M) • 31155 • . \'arios factores podrían estar relacionados con esta discrepancia. pero otros factores no podrían ser justificable». Veinte por ciento de lo> prados ferulizados por Greenchem podrian clasificarse como muy sanos un mes después del servicio. retención de éste )' calidad del trabajo. educación e historia previa de éxitos. por muchas razones diferentes. Greenchem time el otro 28% del mercado. Si una mujer fuera una de las escogidas para el bono. Con el uso de las técnicas presentadas en este capitulo. ¿Cuál es la probabilidad de que la com · pania dé capacitación? Suponga que se determina que la compatl[a seleccionada no es pequeña. Suponga que un empleado de la compañía clieme se selecciona al azar para ganar un viaie a Hawaí.284. Al azar se selecciona un prado que ha sido trata· do con fertilizantes por una de estas compañías dentro del último mes. P( \\'IM) es 3/11 o sea . un hombre podría alegar discriminación con base meramente en lu proba· bilidades.-155 = -155 • . incluyendo upe· rimcia. medidas de calidad y otros.M U C) • P(M) + P(C) . Suponga además que 18% de todas las compañías que dan capacita· ción son pequeñas r que 75% de todas las compatlla. la probabilidad de que se seleccione un hombre dado que el empleado es una persona técnica C> 1 . TriState Lawn Service tiene 72% del mercado.787. La probabilidad de que el ganador se-a hombre o empleado oficinista es una probabilidad de unión.787 La probabilidad de que un hombre o empleado o6cinüta de la compar'tia cliente gane el viaje es .' de la compatlía cliente dado. Si el prado se clasifica como muy sano. es 55/155 o sea . entre las que se: cuentan la lealtad del empleado. ¿cuáles son las probabilidades de que Tn-State o Greenchem trataron el prado? 4.2i3. objeuvo y numérico para la selección de persona.52 fa posible responder a muchas otras preguntas acerca de la 'ítuación de recursos humanos de la ccmpañía cliente que use probabilidades. ¿Cuál e. FJ método de probabilidad a un grupo de recursos humanos e• real. sin considerar talentos individuales. promoción y recompensas con el uso de anáfoi> estadí>tk0> como los aqui presentados. muchas otra. promoción r recompensa> de trabajadores adcmh de sacar al aur su nombre. la probabilidad de que d ganador sea del grupo técnico si se sabe que el empleado es hombre~ Esta probabilidad condicional es como sigue: P(T!M) "' 52/100 • . . consideraciones entran en la contratación. t-:o obstante.u probabilidades dentro de categoría> particulares. Por supuesto. decisiones con evidencia documentada de la productividad del trabajador)' el valor de la organización. la administración de la compaMa debería estar atenta a que a veces existen ataque. la administración puede considerar su. a la> prácticas de contratación.iwr sus decisiones meramente en l. conocimiento> y valor de la compal'lla. CONSIDERACIONESrnos .Har meno> de 2% de probabilidad que una mujer gerente sea seleccionada al azar como ~ del viaje.i todos los casos. Ko se argumenta aqul que la administración debe b.i está consciente de las probabilidades. En cambio. cm ca. Las probabilidades apoyan la noción de estadísticas internas. de manera natural pro· w comse ducen eventos independientes. para contar las posibilidades en un experimento son la regla de conteo mn. cíón se usa para calcular probabilidades conjuntas. La.. y leye) de probabilidades. Ciertos experimentos. El método clásico puede asignar probabilidades a priori. Se apoya en la~ leyn y~ de probabilidad.. es una variante de la ley condicional. eventos simple.pfricammte.ar. Si lo) eventos son independientes. conocimiento )' experiencia de la persona que determine la probabilidad. la probabilübc! conjunta se calcula al multiplicar las probabilidades indh.. La fórmWJ ' :-in se aplica cuando se hace muestreo con reemplazo o b eventos son independientes. o antes que tenga lugar el experimento. Cuatro tipos de probabilid. Tres mttodos de asignar probabilidades son 1) el método disico.id son probabilidad margin¡L probabilidad condicional. probabilidades previas de eventos que ocurran ajusta o revisa esa> probabilidades con base en lnformad acerca de lo que ocurre después. La regla de conteo mn se usa para determinar ~ cuantas formas posibles en total puede presentarse un expenmento en una serie de operaciones secuenciales. de modo que la probabt'lidad dc su inttn«eión es cero.. La regla de Bayes es un método que se puede usar ~ revisar probabilidades cuando se dispone de informació::: nueva. duales.. En la determinación de b unión dc dos C'\'m!OS mutuamente excluyentes. las posibilidades Nª. El uso de datos muesrrales para estimar y probar hipótesis acerca de parámetros poblacíonales se hace con incertidumbre. 2) d método de frecuencia relativa y 3) probabilidades sub~tivu. probabilidad conjunta y probabilidad de unión. b prcsmtación de uno no tiene impacto o influcnc:U en b presentación del otro. Otr06 experimentos producea eventos independientes cuando el experimento se reali7~ coa reemplazo. Omos bpos cspcciales de eventos necesitan correcciones a algunas de leyes de probabilidad: eventos mutuamente OOU)'mtr5 y C"'ml0$ independientes. Si se toman muestras al 11.X U mn Muestreo con reemplazo Y) = P(X) + P( Y) P(X U Y)= P(X) Muc.. evento frecuencia relativa de presentación ezperimento eventos colectivamente exhaustivos intersección matriz de probabilidad método clásico de asignar probabilidades notación de conjuntos probabilidad condicional probabilidad conjunu probabilidad de: unión probabilidad marginal probabilidad subjetiva regla d~ Baycs regla mn de conteo unión FÓRMULAS Regla de conteo Lq general de adición PC.. y combinaciones. que o un caso especial de la ley de la multiplicación. El método de frecuencia relati'~ asigna probabilidades con base en datos hi>tórico~ o datos deducidos nr. Tres técnica. Los primeros IOn evcntos que no pueden ocurrir al mismo tiempo.tTeo sin reemplazo PIX n Y) + P(Y) Lq general de multiplicadón P(X Fórmula de combinación N) N! :•:Cn• (n • n!(N- - ley especial de adición n Y). La ley condicional se usa para calcular probabilidades condicionales. Con eventos indcpcndimtcs. o posible asignar probabilidades a resultados dd proceso inferencial.\n basadas en los sentimientos. tipos de probabilidade.RESUMEN El estudio de probabilidad aborda modos de asignar probabilidades. La ler general de la adición se usa para calculz: la probabilidad de una unión. por ejemplo los de monccbs o dados.J)u toma la. Se usan combinaciones pan determinar las posibilidades cuando el muestreo se hace reemplazo. La ley general de la multiplica. P(X) • P(YJX) = P(Y) • P(XJY) ley especial de multiplicación n)! P{X n Y)'"' P(X) • P(Y) . la ley de adición SC al suprimir fa intersección.• probabilidades >ubjcti\'U est. 1 TÉRMINOS CLAVE a priori combinaciones complemento complemento de una unión espado muestra! eventos independientes eventos mutuamente cxdu}Tntc. La regla de 8. .0 REO. Setenta y ocho por ciento seleccionaron "minudosidad". Cuarenta por cien10 respondieren que conocimiento de u "propio producto': A los prcfesícnales de compras se les permitió dar una lma de una o m.CAPfTUlO 4 PROIW!IUDAD de protYb1hdad condicional Rtglade &vn P(\lY) • P(X n Y) • P(X) • P(YJ.\1 • PO') P(Y) 'PROBLEMAS P(XAY> • P(X. d.¡ años de edad! ¿Cuál es la probabilidad de que un médico seleccionado al azar tenga menos de 35 aJ\<>5 de edad o tenga de 55 a 64 aflO) de edad! ¿Qdl es la proNbilidad de que un medico selecdonado al aur 1a mujer si tiene de 45 a 54 ail<» de edad! ¿Cu.os .'1. P(DJB) • _ ~ t 35 4.U.'I. PIFílA)•_ b • . w variables 1 y U ¿Por qué si o D E F G 3 9 7 12 B 8 4 6 4 e 30 s 3 .17 1.J COMPLEMENTARIOS ~ttDICOS DE E. P(BJD) •_ g. ~ A.ú lo> impresionaron.EKTE Ciiculo de estadfsticq Etbl (ailos) Use los Vlllom de d cudro de contingmcia para resolver ecuaciones dadas.18 ¿Cuál o la probabilidad de que un médico seleccionado al 11.14 .il no 5C'lcc· cionó "minuciosidad" r $1 sdecaonó "conodmientc de su propio preducto "? . P(AUB)•_ í.02 . Se seleccionó al u.P(A\8) • _ c.20 .J ·PO'\X.::don.12 .19 . h.. . L ¿Cuil C5 b probabilidad de que el prottstonal selecdonó "mmudosid.ar tenga de 35 a 44 ano) de edad? ¿Cuál es b prob.id" o "conocimiento de su propio producto"? b. cúdl e la probabilidad de que d proft'Sional no han seleccionado ni "minuciosidad" ru "conocunimto de su propio producto"? f. Si se sailt que d profesional scl«cionó "mmuaosid. L P(E) • - c.ll o la probab1lid. _ d. + P\X. PIDUC)•_ h.1oo..id de que un m~ko ~cccion.) • PO'IX. P(AIB>•L Son independientes por qué no? f. U~)· preguntó a profesionales de compras qué caracterútkas de ventas I~ habían impresionado mú en un representarae de ventas.¡.22 . cúdl es la probabilidad de que d profC'SIOn. P(F)•_ c. d. P(BJEl •e. P(En F) •_ e.00 .P(DJC) =- e. A \Wiabk2 D E 10 20 B 15 s e 30 15 1 1 L b.ado al azar no tea mujer ni tenga de 55 a 64 ano de edad? Pruebe eue conOCJmlentoe LJ5 U~ los valores del cuadro de contingcnc~ para resolver w ecuaciones dadas.07 .23 . P(B) •_ L d. .ú aracteri>licas..11 . b.28 . ¿cuil ~ la probabilidad de que d pro!csiona1 han scl«cionado "conocimlento de su propio product0"1 La siguimte matriz de probabilidad contiene un desglose cklaecbdygintrock~~m un año reciente.()4 .ad":.16 . aegún rq><>rta b American Med1cal &sociation. A . E.al de compras.37 Purch.) P{X1)·P1)1X1) + P\Xi) • P\}1Xz) + ..01 . P(BUD)•_ c.a· do al aur 1a mujer y tmga de 45 a S4 año6 de «bd> ¿Cuil es la probabilidad de que un médico seleccionado al aur ~ hombre o de 35 a .1d de que un médico sdc.ar un profe.ticas de ventas que m. Suponga que 27% de lo profesionales de compras anotaron "miaucxhidacl9 y"conorunim10 de su propio producto" como caractcrl.lbilid. P(Bí\C) =g. P(An E) .ising. 70% pensaron que con d si>tcma estarla ~ en 20 allo~ De las personas entrevistadas. pm~nes efreeidas por pequcl\as com~ias a sw empicado . 16'!9 de b población en Estado. Treinu y cuatro por ciento se registraron con d jefe. De los que respondieron y que tenían 45 años de edad o más.tjo? b. Si la persona seleccionada piensa que el sutcma de stgUridad social estar' stgUro en 20 allos. ¿es independientede poseer una ~futerCard? ¿Por qut sl o por qué no? e. éCu. éCu. Suponp que se~ que b persona seleccionada est. ¿cuál es la probabdidad de que tenga Ma. pero estas cantidades \'UÍan por rq. La compatlia ofrece seguro de vida dado que ofrecen plan de retiro.il es b probabilidad de que esta penona espere ahorrar más dinero el afio próximo o planee reducir su deuda el al'lo próximo? c. Suponga que de quienes leen maten. Por qemplo. ¿Cu.ti es la probabilidad de que al estar de vacaciones esta persona que respondió al estudio no se registre con el jefe ni lea el mattrial relacionado con el trabajo? c.41 Hace unos cuantos anos. 81 % planea reducir su deuda el allo próxilno. La com~la no ofrece w-gu. 57% tenían menos de 45 at\Ol. 20% timen Amcrian Expreu y 25% tienen \~ISI.¡onn. La posesión de una tarjeta \risa. c. ¿Cuál es la probabilidad de que esta persona espere ahorrar más dinero el afto próximo y planee reducir su deuda el at\O próximo? b.tcrúrd.\·cwsStrvicc rqionó que 51 % de quienes respondieron no creyeron que con d \isttma de realiuda por la compallla Maritz Mar~g Rescarcb encontró que 43'41 de n1adounidenses espera ahorrar más dinero el at\o próximo que lo que ahorró el ano puado. a. éCuál es la probabilidad de que la persona 1enga menos de 45 al\0) y piense que con el salema de <eg11rídad social estar' stgUro en 20 allos? c.fu en d nomtc? e. jefe. ¿Cm! es la probabilidad de que b persona . ¿Cu. a. ¡CIW es l. Suponp que se sabe que b penona seleccionada estJ orientada a la ucno1ogfa.a probabihdad de que tenga tarjeta \"iQ? c. (Q mutua· mente cxdu~iva de la po ición de una tarjeta \'isa? 4. Uno de quienes rbpondieron se seleccionó al azar. a. en general est. en el oeste la cifra es W% m d noreste es de 1 i'lll.il es la probabilidad de que al estar de vacaciones esta penona que respondió al es1udio se registrara con el jefe y lea el material relacionado con el trab. e.ti es b probabilidad de que la persona no en d oeste ni el noreste? 4.10timen. est. Se selecciona al azar un estadounidense.-. Cuarenta y cinco por ciento de los entrevistados planea reducir su dC'Uda el at\o próximo. ¿cu.¡ se sabe que ofrece un plan de retire. éCtúl es la probabilidad de qix b pcnona m-.ts dinero el ano próximo y no planee reducir su deuda el atlo próximo? . Entre otras COllS. Se seleccionó al azar uno de IOl que respondieron.ti es b probabilidad de que la pcnona vi'-a en el ante y sea una pcnona orientada a la tecnologla? b.38 La U. b.Ocho por ciento de las Wnilias ucnen Ma. Si una familia tiene MMtcrCard. determine bs ~iguímtcs probabilidades: a. se» porcier.il es la probabilidad de que la persona tenga menos de 45 al\os o piense que el sistema de seguridad social no estari stgUro en 20 al\Ql? 4. ¿Cu" b la probabilidad de que esca persona espere ahorrar m. Suponga que al azar se sd«"ciona un csudounidrnst. ¿Cm! es b probabilidad de que la persona viva en el oorme y sea una pcnona orientada a la tecnología! c. ¿Cu.. A quienes rcspondicron al estudio se les permitió seleccionar ~ de una actividad.t orimuda a b tccnologb.is? b.ttrCard 4. La posesión de una tarjeta Amcri<:an Exp. De quienes esperan ahorrar más dinero el allo próXImo. ¿Ctúl es la probabilidad de sdcccionar una familia que no tenga t:irjeta \rlA ni American Exprc»? b. 40% Icen maltrial rd. 30% de las úrnilias tienen tarjeta MuttrCard. seguridad social estuviera seguro en 20 al\Ql. éCu. relacionado con el trabajo. La com~la ofrece un plan de retiro y no ofrece seguro de vida.136 ESTADlmCA E.S. Doce por ciento tienen Visa y ~la. Bureau of Labor Sranstics publicó datos sobre lo. S1 una familia tiene tarjeta \ísa.a ea d oeste? d.acionado con d trabajo.40 En cierta ciudad.~~ y\'"ia a._.43 La Slttlcase Workplacc Inda estudió IOl tipos de actividades rebcionadas con el trabajo que hkieron estadounideeSb que estaban de vacaciones en el \-erano.t en el oeste y ~ m d eoresre.terard! d. d. a. éCu. Sólo 42% ofrecen planes de retiro mientra> que 61 % ofrecen seguro de vida Suponga que 33% efrecm planes de retiro y stgUro de vida como prestaciones Si una pequeña compallla se selecciona al azar. un estudio encargado por Tht \\brld Almarw y Marunry .í orientada a b tecnología. Unido.t orimuda a b trcno1ogia.ti es la probabilidad de que la persona tenga 45 o n:W at\os? d.:~ NEGOCIOS 4. La compatlla ofrece un plan de retiro dado que ofrecen stgUro de vida. La com~la ofrece seguro de \ida o un plan de rt'tÍro. 78"il se registraron con el. ¿Ctúl e> la probabilidad de que la persona tenga 45 ailO> O m.tl es la probabilidad de que esta persona no espere ahorrar más dinero el afio préximo ni planee reducir su deuda el allo próximo? d. ¿Ctúl es la probabilidad de que al estar de vacaciones esta penona que respondió al estudio I~ el mate· ria! relacionado con el trabajo dado que se registró con el jefe? r m-a y American Express.42 Una encuesta por teléfono 4.ro de vida . Suponp que se sabe que la persona seleccionada est.39 ~ Link Resources. Veintiún por ciento de b pobbáón en EsudOl Unido. Conslru}-a una matriz de probabilidad para este problema.ü es la probabilidad de que d paaente viera a la doctora Sarabia? ¿Para q~ porcmtaic de todos los pacientes en ei.il\la no da capacitacién para mejorar procesos. cenificación. ¿Cuál Q la probabilidad de que al estar de vacaciones Qla pcMna que respondió al estudiono se regímara con el jefe dado que no leyó material relacionado con el trabajo? f. 81 Learning w .CAPITULO~ d. ¿Cuál es b probabilidad de que la compallla dé capacitación para retener empleados? 4. c. PROBABfUDAO 137 d. Varias otras quejas se observaron. La venia directes ( 14%). ron la venia directa por correo o ca1álog0).4. ¿cuál C) la probabilidad de que dé capaci1ación para mejorar sus procesos? c. dado que la persona ~leccionó \'tnta atención ni se queja por reclamaciones de pago. ¿cu. con 17%de 10) consumidoresparticipantes <ervicios. directa por correo o por catalogos. determine la siguien1es L El consumidor se queja por reclamadcnes de pago o probabilidades: atención de especialidad. Si un consumidor de atención venia directa o por representantes. Suponga que se sabe que la comp.Suponga que lo) resultados o venta por representantes. c. La doctora Sarabía pide pruebas sanguíneas a 5% de sus pacientes. En un estudio nacional de compañías. seguida por incluyendo atención inapropiada ( 14%). Un auditor sdccciona al azar un paciente de la semana ~da y descubre que la paciente se le rtalizó una prueba ~ como resultado de la visita de un médico. El porcentaje m~ alto de compal'lias escogieque Ja seleccionaron..tción para retener empleados ni para mejorar sus procesos? f.44 Health Righ1s Hotline publicó los tt)Uhado) de un estu. ¿Cuál es la probabilidad de que la compal\ia dé capacitación para retener empleados o para mejorar sus procesos! e. suponga que de las compañíasque dan capacitación para mejorar sus procesos. el doctor Tran pide pruebas sanguinas a 8% de sus pacientes y la doctora Jack. ¿Cuál Q la probabilidad de que al estar de vacaciones Qla persona que respondió al estudio no se regisirara con el jefe dado que leyó material relacionado coo el 1rabajo? e. especialidad.~ ~umerosas compmias dan capacitación a empleados d. 90% lo hacen para retener empleados. L ¿Cuál es la probabilidad de que la compañía dé capacitación para retener empleados y oo para mejorar sus procesos? b. Si se ~be que la compallia 01orga eapacuacién para retener empleados. Además. Esw ca1cgor1as de quejas venia directa por correo )' catálogos o ventas directas son mutuamenteexduyentes. entre las que se incluyen la lealtad por catálogos. reclamaciones con pagos ( 11%).Onocimdo esu información.46 Pimey Bowe) entrevisté a 302 directores y vicepresídenlQ de mercadeo de empresas estadounidenses grandes y dio de 2 400 personas en el norte de California. Si una de las compadirigida se selecciona al aur. a. servicio a clienventa directa o venta por representantes. El vendedor no seleccioné venta ditteta por correo o por díferemesrazones.47 Una pequeña práctica independiente de médicos time tres médicos.. Se seleccionó al azar una compaJ\ía que da capacitación. calidad y mejora de proceventa directa o por representantes..ta práctica se requieren pruebas sanguineas? 4.48 Una encuesta realizada por el Anhur Andmen Enterprise Group/Na1ional Small Busine<s United ua1ó de determinar cuále< son los prindpales dcsa~ para el crecí- . Suponga también que 41% de este e tudio pueden llevar-e a iodos los consumidono seleccionó venia directa por correo o cat. El consumidor se queja de atención inapropiada b.-on pide pruebas sanguíneas a 6% de sus pacientes. determine las siguiemes l'llas se selecciona al aur y se en1UV1sta a su mejor venprobabilidades: dedor acerca de este asumo. el doctor Tran a 32% y la doctora lackson el resto. atencién de especialidad ( 10%).:r\lems reportaron que 56% de las compaAias que respondieron citaron la retención del empleado como razón pñncipal para la capacitación. El vendedor seleccioné venta directa o venta por d. El vendedor seleccionó venta directa por correo o b. dado que el vendedor no seleccionó del empleado.tlogo) ni res de atención dirigida. ¿Cuál es la probabilidad de que la compallla dé capacitación para mejorar sus procesos? 4. C. representantes de ventas. El consumidor no se queja por demoras en obtener representantes. para determinar qué era lo que pensaban es se pidió a consumidores compartir sus quejas acerca de el mejor vehtculo para educar a quienes loman decisioatmción dirigida. demoras para obtener atención (8%) la por correo o por ca1álogo• fue seleccionada por 38% de las compal'lía-<. Suponga que 36% de las compatüas respondieron que otorgan capacitación pua mejorar sus procesos y para retener el empleado. El consumidor se queja de medicamentos de recela y por catálogo) y no seleccionó venta directa o por servicio a clientes. ninguna de cuales seleccioné y medicamentos de recela (?'lb). en el que medianas. La doctora Sarabia atiende a 41 % de los pacientes. sos. La queja nllmero uno fue la denegación nes sobre complejos problemas para vender productos )' de atención. c. ¿Cuál es la probabilidad de que b compal'úa no dé capacit. El vendedor seleccionó venta directa o venta por dado que el consumidor se queja de la atencién de representantes. ¿Cu. Un in' recibe de manera oculta un producto alimenticio de de estoi. ¿cuál e. se dio el no "Total" al producto en Estados Unidos: esta linica palabra~ sa que la pasta dental e> el paquete "total" de varios ben w . la probabilidad de que sea un hospiu! gobierno. Veintinue\"e por ciento "buena salud". por 30% de los negocios. la probabilidad de que una persona diera ni "fe en Dios" ni "buena salud" ni "un monio feliz"? ANÁLISIS DE LA BASE DE DATOS l. 4.uar tenga un valor de embarque. ~ im gadores de mercado dijeron a Colgate· PalmolM que co dores estaban cansados de tratar de dístinguir entre difí ventajas de varias marcas de pasta dental y deseaban <implifx> ción en sus vidas al comprar. p estadounidenses qué es lo que consideran ~ unre en sus vidas.50 Una encuesta realizada por la serie de media hora "The Great American TV Poli".. El pequeno negocio no cita reglamentos como desaAo dado que cita la carga impo iliva como desafio. 35% ~rían ca. no federal? ¿Cuál es la probabilidad de qac ho. f.': Debido a q:x le. d. ¿Cuál ~ la probabilidad de que una persona diera "fe en Dios"? y "buena salud"? d. 4. Si al azar se selecciona un pequeño negocio. aparecieron ot~ en lo. b. El pequeño negocio cita la carga impositiva o reglamemos como desafio. En la base <le <lato•~ manufactura). citada por 35%. ¿cuál o la probabilidad de que una industria de Código SIC seleccionada al azar este en el grupo industrial 13> ¿Cuál es la probabili· dad de que una industria de Cód1~0 SIC seleccionada al .1ndu. Por tanto. El estudiante debe obtener una matriz de i Con esta matriz. Aproximadamente 113% de carnes ~ra desayuao y m¡.hüdo. y se le dice que el producto no ta con etiqueta de información nutrimental. la palabra annbacttri. determine las siguientes probabilidades: a. de industria de :?? ¿Cuál es la pro· babilidad de que una industria de Código SIC selecdonada al azar esté en el grupo industrial 13 o tenga un valor de embarques de industria de 2? ¿Cuál es la probabilidad de que una industria de Código SIC seleccionada al azar no cst~ en el grupo industrial 13 ni tenga un valor de embarques de industria de 2? 2. Suponga que e to• porcentajes se cumplen para todo. lo.. resultado. El pequeño negocio cita la carga impositiva y regla· memo como desafio. ¿Cuál e.tnalo de 4? ¿cuál es la probabilidad de que una industria de Código SIC seleccionada al azar esté en el grupo industrial 13 y tenga un valor de embarque. Utilice la base de dato> del ho pita!. de Lifetime. Aunque cuando la economía y encontrar trabajadores calificadoi.. El pequeño negocio no cita reglamentos como desaAo dado que no cita la carga impositiva como desafio. Colgate-Palmol.pital esté en la región de las Rocallosas o sea un pita! que no persiga fines de lucro ni sea del gob ¿Cuál es la probabilidad de que un hospital persiga de lucro situado en California? CASO: COLGATE-PALMOLIVE HACE UN ESFUERZO "TOTAL" A mcdia(b de la década de 1990. aire· dedor de 1i% de todo> las ~ras en un ano reciente no contaban con etiqueta de información nutrimental. El pequeño negocio cita ya sea la carga impositi\-a o reglamentos pero no ambos como desafio. Colgatc-PalmolÍ\-c perí«cionó una nueva~ dentífrica para el mercado ot3douniderue. producto. fueron los principales desafíos. con un ingrediente anu"bactcriano que ya se \'m<Üa muy bien en el extranjero.ti es la probabilidad de que una perwna ra "un matrimonio feliz"o "fe en Dío6" o "buena c. o meno.ivclcnla que ~ugmr otra forma de vender ésta y otras aractcrísucas de <u '°' nueva pasu dental 1consumidores en Esudos l.ino no era pcmulida para eso. Suponga que 71 % de l<b compañlas que citan reglamentos como un desafio también cuaron la carga Impositiva como desafio. Con•tnm matriz de valores sin procesar para la ~n y para • control. En respuesta. tres grupos. Re\ probabilidades de que el producto sea de wpa. c. ¿Cuál es la probabilidad de que una persona diera "un matrimonio feliz" o "fe en Dios"? b. entrevistado no podía seleccionar más de una r a. El pequeño negocio cita reglamentos como desafio dado que cita la carga imposiliva como desafio. Da· mada Colga~ Total. 21% respondieron que "un mat feliz" y 40% conte.tó que "fe en Dio. por w ~ de la Food and DrugAdminbuation. y la carga impo itiva. para desayuno. peque· nos negocios. e.mtS desayuno y 5% serian ptrroj a1/1tnta. 59% de productos para ptrrosa1/1011a no taban con etiqueta de información nutrimcntal. No obstante.p1tal cm el sur. del estudio incluyendo reglamentos. y un producto de perro) cal1tntes. ~ que si estos tres grupo de alímemos se combí 60% serian productos de sopas. citado. preguntó cuál de estas cosas es lo mis imporwne.miento y continuación de operaciones de pequeños negocios. conteste 13) siguientes preguca (Consulte el capitulo 1 para miembros de cat ¿Cuál es la probabilidad de que un hospital selec • al aur es1~ en el Medio Oeste si se sabe que el persigue fines de lucro? Si se sabe que el ho.49 Sc!:ún la Public \'oice for Food and Heahh Policy. Durante este mismo ~o. 2. Suponga que 24% de los consumidores que compraron Total por primera vez durante el periodo inicial de 1 O meses eran de la categoría de edades de 45 a 64 años. la Colgate-Palmolive se apoderó de Ja _¡. calcule la probabilidad de que un consumidor estadounidense seleccionado al azar tenga edad de 45 a 64 años o compró Total durante el periodo inicial de 10 meses. Suponga que 32% de todos los consumidores de pasta dentífrica en Estados Unidos vio los comerciales Total.Colgate-Palmolive recibió aprobación de la FDA para IA:x::!J. 40% compraron Total al menos una vez en los primeros 1 O meses de su introducción. Utilice esta información para determinar si la edad es independiente de la compra inicial de Total durante el periodo de introducción. Suponga que al azar se selecciona un consumidor de pasta dentífrica y se sabe que compró Total durante los primeros 1 O meses de su introducción. De aquellos que vieron los comerciales. Con el uso de las probabilidades dadas en la pregunta 2.06% compraron Total al menos una vez en los primeros 10 meses de su introducción.r:icipación número uno del mercado de pastas dentífricas.an comprado Total por primera vez. Revise la probabilidad de que esta persona vio los comerciales Total y la probabilidad de que la persona no vio los comerciales Total .:. Entre tanto. Antes de tres meses. Un comercial que vende los beneficios de h:-? duración de Total tuvo especial éxito. cinco años después que la compañía lo había solicitado. l. Colgate Total habla sido exitosamente =oclucida en el mercado estadounidense. 21 % de todas las casas en Estados Unidos é:L::. Siguió =campaña de anuncios impresos. 3. E: producto fue lanzado al mercado en Estados Unidos en =de 1998 con el uso de comerciales que fueron diseñados '°"'ideas más exitosas de pruebas del grupo de enfoque. ¡Qué probabilidades se dan en este caso? Utilice estas probabilidades y las leyes de probabilidad. aproximadamente 20% de todos los estadounidenses están en la categoría de edades entre 45 y 64 139 años.S. ¡Es la categoría de edades independiente de la voluntad de probar nuevos productos? Según la U. Explique su respuesta. Census Bureau.CAPITULO 4 PROBABILIDAD Young & Rubicam inventaron varios comerciales que iii::suan los beneficios de Total y probaron los comerciales con ?::t!pOS de enfoque. para determinar qué porcentaje de familias en Estados Unidos compró Total por lo menos dos veces en los primeros 10 meses de su anuncio. 12. 43% de aquellos que inicialmente probaron Total la eeeapraron de nuevo. ¡Cuál es la probabilidad de que una persona seleccionada al azar comprara Total en los primeros 10 meses dado que la persona está en la categoría de 45 a 64 años de edad? 4.. en . De quienes no vieron los comerciales. ~meses después. 140 . Identificar el tipo de experimentos estadísticos que pueden ser descritos por la distribución binomial y saber cómo resolver esos problemas. con lo cual podrá: l. Decidir cuándo usar la distribución de Poisson al analizar experimentos estadísucos y saber cómo resolver esos problemas. 3. Decidir cuándo es posible calcular problemas de distribución binomial por medio de la distribución de Poisson y saber cómo resolver esos problemas. 6. 4. Saber cómo determinar la media y varianza de una distribución discreta. Decidir cuando usar la distribución hípergeometrica y saber cómo resolver esos problemas. Distinguir entre variables aleatorias discretas y variables aleatorias continuas. S. 2.CAPÍTULO 5 Distribucionesdiscretas OBJETIVOS DE APRENDIZAJE El objetivo general de aprendizaje del capitulo 5 es ayudar al estudiante a que entienda una categoría de distribuciones de probabilidad que produce sólo resultados discretos. Preguntas gerenciales y estadísticas l. Aun cuando 87% pensaron que los banqueros deberían interesarse por sus comunidades. Segun el estudio.En el lado negativo. asl como mala administración y pérdidas financieras por préstamos hipotecarios riesgosos y otros préstamos a finales de la década de 1980 y principios de la de 1990. 65% de iodos los consumidores financieros estan mur sansf«hos con StJ msmución principal. Una serie de quiebras bancarias debidas a la competencia dentro de la industria. Hoy dla algunos lideres empresariales piensan que los bancos han perdido contacto con sus clientes y ya no tienen utilidad. Suponga que efectuamos un estudio local de 32 consumidom de instituciones bancarias y encontrarnos que 26 se sienten seguros de usar caje~ autcmáucos. seguida por un servicio amable o bueno ( 19%). Los resultados del estudio fueron mixtos y variados.tmente 4 de los 7 se sientan seguros de usar cajeros au1omatícos? 141 . Setenta y nueve por ciento dijeron que los bancos eran muy ímportanr~ para la salud de la economb y 64% pensaron que los bancos son más competitivos hoy que hace cinco afto-. ¿Cómo es vista realmente la industria bancaria por el consumidor? Un estudio reciente efectuado por la GaUup Organization y encargado por la American 8anken A. Ochenta y siete por ciento de los entrevistados se sienten seguros con los cajeros automaticos. y buenas tasas de interés por préstamos ( 11 %). ¿cuál es la probabilidad de que 18 o m. en Estados Unidos o de consumidores financieros de otros paises? 2. 41 % de qwenes hablan solicitado un préstamo a un banco dijeron que el proceso era muy dillcil. la industria bancaria se ha enfrentado a numerosos desafíos y oportunidades. opciones alternativas de banca.sólo 31% estuvieron de acuerdo con que asl lo hacen lo) bancos. cambios en comisiones o servicios ( 18%). relación duradera (14% ). seguida por cambio de domicilio ( 18%). La buena noticia para los bancos es que 80% de los usuarios consideraron que un banco es su institución financiera principal y que 65'16 estaban muy satisfecho) con su institución. resultaron en una evidente calda en la confianza del consumidor en bancos. ¿cuál es el número esperado de estos 15 que esún mur sausfo:hos con su institución principal? 4. was de interés ( 16%) y comodidad/ubicación ( 13%). ¿estos estudios son caracterísncos de su regién geoglifica. Cincuenta y dos por ciento de consumidores pensaron que no era apropiado que lo) bsncos cobraran comisiones por sus servicios y sólo 33% estuvieron decididamente de acuerdo con que los servicios bancarios representaban buen valor para el dinero. Si al azar seleccionamos i de estos 32 para hacer algunas entrevistas adicionales. en particular después que la industria experimentó tres años consecutivos de ganancias récord. emisión de cheques ahí ( 11%). Otros piensan que la percepción de los consumidores respecto a la industria bancaria ha mejorado en años recientes. Suponga que al azar se seleccionan 15 consumidores ~con base en las cifras del estudio. Este estudio fue efectuado en iodo el país por la Gallup Organization. Sólo 29% estuvieron de acuerdo con que lo) bancos son Oexibles para satisfacer las necesidades financieras de los consumidores. El estudio sugiere que 80% de iodos los consumidores financieros consideren u banco como b institución financiera principal.ssociaúon entrevistó a 1 002 consumidores que actualmente hacen negocios con un banco. El mal servicio a clientes encabezó la lisia de las razones por las que el público cambió o consideró cambiar de insmuciont) financieras principales ( 19%).act. Si suponemos que el estudiante selecciona al azar 25 amsu:nídores financieros en su comunidad. En opinión del lector.El bueno y el malo de la imagen pública de la industria bancaria En años recientes. ¿cuil es la probabilidad de que ex. Algunos otros datos encontrados en el estudio incluyeron lo siguiente: 39% de todos los consumidores d1~ron que la comodidad es la razón más importante de mantener una ~)ación en su institución financiera principal.h de estos consu:nidorcs considere que su banco es la insutucién financiera principal s1 80% se alcanza en su cocmz::idad? 3. G. las variables aleatorias discretas producen valores que son números enteros no negau'"OS· Por ejemplo. n automóviles. o. 2 o 3 baterías defectuosas.1. Otros ejemplos de experimentos que dan '-ariable$ aleato~ discretas incluyen los siguientes: TABLA 5. suponga que un experimento es medir las llegada• de automóviles a una caseta de autopista durante un periodo de JO segundos. denota un resultado panicular en el que la primera y tercera bateri· as son defectuosas y la segunda barería es buena. Seleccionar al azar 25 pc™>nas que consuman bebidas gaseosa. o. Gz o. se "cuentan".. los resultados ocurren de manera aleatoria. continuas Una . toman valores t11 cada punto. ¿cuál es la probabilidad de que no lleguen clientes durante este tiem· po? ¿Cuil es la probabilidad de que más de cinco dientes lleguen en este periodo de do> minutos? ¿Cuál es la probabilidad de que menos de tres dientes lleguen en un intervalo de cuatro minutos escogido al azar? En experimentos estadtsticos que abarcan probabilidad. las dos Cllttb(lrlas de \Wbks aleatorias son: (1) variables aleatorias dismtas (2) \""Uiablcs aleatoria.no se miden. obtener valores de números no enteros e) imposible.S. cada dos minutos llegan al banco 3. y una bateria buena se designa con una G.idnu en la última elección.-uiabJe aleatoria es una variable aleatoria discreta s1 ti conjunto dt todos los poHblts ~·alom a a lo sumo un finito o un mimtro contablememe mfimto ele posibles valora. números posibles de zurdo. 3. 4. I. W• posíbles resuhados son. como ejemplo de este tipo de éxpcrimen10. 2. Determinar el número de defecto) en un lote de SO artículos.1 Todos los posibles resultados para el experimiento de la bate ria Gi Gz G. Suponga. Esw mediciones de tiempo son los valora de otra variable aleatoria. t11 un íntavalo cüuh En esta forma. O. o. Los valores van a variar de O scgundos a n segundos. En l:a$Í todas las 'itu~ nes csudistkas. En este capitulo examinamo las probabilidades de distintos resultados que pueden ocurrir con tipos paniculares de experimentos. 2. 1rabaio• en una linea de producción. . si $á5 personas se seleccionan al aur de una población y se ha de determinar cu~nw de las seb son zurdas. 1. cosa. Los resultados muestran que. 5. Esto números (O. Por ejemplo. No o posible obtener 1. Con base en ola información. Las variables aleatorias continuas. Cada batería seleccionada ha de dasifi. o. las variables aleatorias continuas no tienen brechas o valores no tomados. . G. 1.n) son los valores de una variable aleatoria.58 baterías defectuosas. las baterías están numeradas de 1 a 3. Dt G2 03. de la muestra de seb son 0. No puede haber 2. Suponga que otro experimento es medir d tiempo mire la terminación de do. votaron por el pre. 2. [refrescos) determinar cuántas prefieren bebidas de dieta. Gi Gz °' o. Un banco realiza un estudio de tránsito de dientes para determinar modelos de llegadas de 10 am a 11 am en días hábiles.75 zurdo) en un grupo de se~ personas. Gz G. La expresión. Cualquier intento del experimento contendrá O. una batería defccruosa se designa con una D. que un fabricante de baterías selecciona a! azar tres baterías de un lote grande de para probar su calidad. º• o. •uponga que al azar se selecdona uo periodo de dos minutos. W$ único. o. carsc como buena o defectuosa. Todos los posibles resultados se muestran en b tabla 5. ••• . Muestrear 100 votantes registrado) y determinar cuánto. S y 6. en promedio.8 dientes. 3. 4. D. l. 2.1 DISTRIBUCIONES DISCRETAS CONTRA CONTINUAS Una variable aleatoria e una variablt que cont1t11t los resultados dt u11 experinmuo de probabilidad. G. G. 1.•• . Contar el número de personas que lleguen a una'rienda durante un periodo de cinco minutos. El experimento de la batería descrito al principio del capítulo produce una distribución que tiene resultados discretos. Podria decirse que las variables aleatorias discretas suelen generarse en experimentos en los que ta. la variable aleatoria producida es discreta. o. Muestrear el volumen de nitrógeno líquido en un tanque. y asl sucesivamente.a y la des'"iación estándar. basadas en vanablts altaronas co111i1mas.04 . el tiempo que tarda en lograr este objetivo podría ser cualquier valor dentro de un lapso razonable.37 de probabilidad que no ocurra crisis.. el análisis de datos se facilita mucho si se usan distribuciones continuas en datos que originalrnente eran continuos. Por tanto. medida> descriptivas (medía. Cada una de csu. sin embargo.2.CAPITULO S DIST!UBUQOSES DlSCRETAS 143 Podrla decirse que las variables aleatorili conunuas se generan en experimentos en lo> que I~ c~ se "miden'. distribución ji cuadrada y distribución F. Las distribuciones discretas incluyen la distribución binomial. podemos ver que la distribución es discreta y qix no se muestran probabilidades para valores entre bs cruis de valoro enteros. Los resultados de variables altato~ y sus probabilidades asociadas se pueden organizar en distribuciones. o gr4· fica de barras verticales es probablemente la forma de grtfica más común para describir una distnbución discreta. . 0. El hi. ••• ) se usa para representarse a >I mismo.1 describe la distribución dada en la tabla 5. incluyendo el histograma y polígono de frecuencia.2 se muestra una distribución discreta que con· tiene el número de crisis que podrían ocurrir durante el día que salga y la probabilidad de que ocurra cada número._:io .cm-. Nótese que el eje x del histograma contiene los posibles resultados del experimento (numero de cnsis que podrlan ocurrir) y que el eje y contiene las probabilidades de que éstas ocurran. Una ejecutiva esú considersda en un viaje de negocios fuera de la ciudad para un viernes dado y reconoce que podría ocurrir al menos una crisis el dia que salga y está preocupada por esta posibilidad. distribución uniforme. Medir el tiempo entre llegadas de clientes a una tienda de venta al menudeo. distribución de Poi son y distribución hipergeométrica.. i2 DESCRIPCIÓN DE UNA DISTRIBUCIÓN DISCRETA Ull.. En la tabla 5. el uso del punto medio de clase no es necesario porque el valor discreto de un resultado (O.\f) para calcular ot~ medidas . Una lista de medidas para las cuales se podrían generar variables aleatorias continuas incluirla el tiempo. distribución exponencial.. .. Distribución discreta de sucesos ee crisis diarias . algunas distnbuciones contienen resultados sólo para cienos puntos de dato$ y dejan un vacío entre valoro.t/t . el histograma que se emplea a veces contiene lmeas delgadas en lugar de barras o rectángulos. que el numero mis proba· ble de crisis es de O o 1. peso y volumen. 3. en lugar de usar el valor del punto medio de clase (. Medir el peso de granos en un elevador en diferentes puntos de tiempo. altura. 2. 1.37 . Además.Ol Media. Medir las longitudes de automóviles recién diseñados. Una va medidos y registrados los datos conunuos se convienen en datos discretos porque se redondean a un numero discreto. no se "cuentan" Por ejemplo. si una persona otá ensamblando un componente en un producto. . existe 0. Otros ejemplos de experímentcs que dan va!Ubles altatorias continuas incluyen lo siguiente: l..tograma de la figura 5. Observe la distribución discreta de la tabla 5.ll . Las distribuciones continuas incluym la distribución normal.5169 segundos.-añanz¡ y desviación estándar) se caJcu)¡ en dati» agru~ median· te el uso del punto medio de clase como el valor para representar 1o$ datos del intervalo de clase. distribución r.l 5. . No obstante. Por ejemplo.31 de probabilidad que haya una. El histograma. Los dos tipos de distribuciones son distribuciones discretas. varianza y desviación estándar de distribuciones discretas ¿Qué otros mecanismos se pueden usar para describir distribuc. . Resulta evidente en el estudio de la gráfica de la figura 5. Por tanto.ll .2. en b pr4ctica casi todos los datos son discretos. En el capitulo 2 se realizó el análisis de algunos tipos de grtficas que podrían ser suficiente para este trabajo. En este capítulo vamos a explorar dístribuciones discretas. 2.2 ¿Cómo podemos describir una distribución discreta~ Una forma es construir una grtfica de la distribución y estudiar la gráfica. Con distribuciones discretas. El capitulo 6 aborda distribuciones continuas. Por tanto.. como podría ser tres minutos 36.4218 segundos o 5 minuto> 17. 4. la •-arianz. construidas d« variablts a/tato· rias diserttns y distribuciones continuas. . 3. ~ de describirbs grtficamente? Las medidas de tendencia central y medidas de ''ariabilicbd estudiadas en el capitulo 3 para les datos agrupados pueden aplicar-e a d1S1nbudon~ díscretas para calcular la medía.1.. 3 0.Qn los resultados (x) del experimento discreto.3 los valores resultantes. ~in embargo. calculemos el valor medio o esperado de la distribución dada en la tabla 5.04 o. el número medio o esperado de crisis en un viernes dado para esta ejecutiva es 1.115 115.JI 11 . o operado.4 Histograma MINITAB de distribución discreta de datos de crisis TABLA 5.IS Ilir fj• JI(&)) . el promedio de los resultado es mis probable que se aproxime al promedio a largo plazo. la frecuencia de cada inten-alo de clase se wa para valorar d punto medio de clase.15 crisis.. A largo plazo. 3 2 0.W.J1 JIO 1 . se U'. Valor medio o esperado El valor medio o esperado de una distribución discreta es ti promedioa largo plazo dt sumos. Ademú.18 0. los álculos de varianza y desviaciones estándar usan la media de la distribución discreta. P(x)] donde x = un resultado P(x) = probabilidad de un resultado dado µ = media .2 0. la ejecuti\-a nunca tendrá 1.1 • 1 .2.JI o 0. se calcula como sigue: VALOR MfDIO O ESPERADO DE USA DISTRlBUCJON DISCRETA µ • E(x) • ![x · P(x)] donde E(x) x P(x) = promedio a largo pino = un resultado = probabilidad de ese resultado Como ejemplo. valor esperado o valor medio.37 C61culo de la media de los datos de crisis 0.144 ESTADISTICA EX LOS NEGOCI~ 0.Ol . Varianza y desviación estándar de una distribución discreta La varianza y desviación estándar de una distribución discreta se despejan con el uso de los resultados (x) y probabilidades de resultados [P(x)] en forma semejante a la de calcular una media. descnpuvaspara datos agrupados.01 1 3 5 4 ' Número de crisis •·M . Con analísis de distribución discreta. Este valor medio. Al calcular e5W medidas descriptivas en datos agrupados..rt 16 • . Debemos saber que cualquier intento de usar una variable aleatoria discreta proporciona wlo un resultado. Véase la fórmula para calcular la varianza. la probabilidad de cada ocurrencia se wa como el valor.J6 .09 0.31 0.15 crisis. Por supuesto.3 0.M . Véase en la tabla 5. si el proceso se repite suficientemente (el juego se realiza en tiempo suficiente). VAJUANZADE UNA DISTJUBUOON DISCRETA q2 • :Wx -µ)2.o o 1 2 IW . 06300 .10479 .00063 .06010 .10479 .wl Probebllidad P(.8 millones al instante en 70 millones de billetes de $1.15>2.09612 .o\.02000 .00400 4 2 1 .IM). Db>1ACJON EST.1 Durante una temporada de vacaciones. v Premio l. - .19 crisis.00601 .08877 . 14.n (J-1 15>2.RDE UNA u= J~<x-¡1)2 • P(x)I DISTllBUClON Dt~ La varianzay desviación es1.1'>2 • P(.19aW1 La.tndar de los datos de crisis de la tabla 5. Premio l..'DA.00002 .12 La wriama de r (l. . PROBLEMA DE DEMOSTRACIÓN 5.00063 .08877 .J7) • .JI)• Al (G.CAPITULO S OISTll1Bl'CIO~E5 OLSCRETAS 14S tulA 5.Ll5)2 • l.2 se calculan y muestran en la tabla 5. Con este juego. La desviación estandar es 1.77176 Solud6n La media se calcula como sigue.08000 .15 crisis. (UZX. Utilice estos datos para calcular el valor esperado del juego. y la varianza es 1._adacllra La desviación estándar se calcula luego al tomar la rafz cuadrada de la varianza.01 (O.. Si una persona juega durante largo tiempo.77176 o µ... La medía de los datos de crisis es 1.10479 . la loterfa de Texas llevó a cabo un juego llamado Stocking Stuffer.3l (1-115>2.72X lt) • u (MJ)(MJ• .J2 04.12 (5..12)(. J.42 (4-1.wl $1000 100 20 10 .41.OU • 15 E[~ .02403 .wl 1t·Pl.JI 2 ••• 4 5 . con precios de billetes de $1 a $1 000. puede esperar un promedio de alrededor de 60 centavos en ganancias.wl $1000 100 20 10 . A continuación observe los diversos premios v la probabilidad de ganar cada uno de ellos.00002 .12X.)J • IAI = El~·p)l· ~)J • IAI v-JLii•l. Jl2 <2-115>2• .. la varianza la desviación estándar del juego.00601 E¡x¡ • Ux· P\xJ) • .4 de varianza V ~nestándar en datos cnsis o .4.00400 4 2 1 o .17754 .1.02403 .15>2• 1. habla premios totales de $34.00000 Ux P(x)] • 60155 60155 La recompensa esperada por un billete de $1 en este 1uego es 60 2 centavos.J2)(.JI Cl. . Utilice estos datos y las pro lidades asociadas para calcular el número esperado de defectos y la desviación estándar defectos. varianza y desviación estándar de la siguiente distribución discreta.602 • .50520 .001 2 3 4 5 6 i S.60155.398..02403 --0.<194 . .11 . . .285 2 . Dd'tctos ProbebWdad o .36186 1997595 -ó22443 . 99879126190 9680..12 • Plxll J28. Desde luego.IOJ .98351 (dólares)2 y la desviación estándar es $5.95566 0.1112 • PIMll • 2898349 ~ • Dlx • µ)2 PIMll • 28.01664 . 238 290 .246 .33086 11.ISS .r = Ju1x .'\ LOS 1''EGOCI~ A largo plazo.229 ..Oil .1.00400 -1. 5.3 Los siguientes datos son el resultado de un estudio histórico del número de defectos encontradCll en una tau de porcelana producida por una empresa fabricante. .05186 376. 1'!1tl "o ...038 .087 .µ.u.2n53 .. un individuo nunca ganará 60 centavos en ningún juego... lt $1000 100 20 10 . o sea unos 40 centavos por juego.17360 .15876 0. el panicipante perderá más o menos Sl.98349 4 2 1 o "= J.00063 (1t- µ12 (1t .1 PROBLEMAS S.µ. µ.00 .53067 . varianza y desviación estándar de la siguiente distribución discreta.129 3 4 .2 Determine b media. 5 5.98349 = 5 38363 La varianza es 28...12..146 ESTADISTICA E.13. Con el uso de esta media.38.l Determine la media.461 1 ..00601 --0. .10'79 --0.00002 .29986 88.77t76 --0 27927 Dlx. X P(x) 3 4 .54946 1..06877 --0. la varianza y desviación estándar se puede calcular como sigue. 246 . lo) términos p y q permanecen constantes en todo el experimento.714 piezas defectuosas no es posible.002 . si la población o grande en comp.ria considerar que un producto defectuoso tuviera wto aun cuando la compadía no considerarla como wto un producto defectuoso. 3.íscreta.ibJes. Por lo general. El otro po'ible resultado de una prueba en un experimento binomial se llama fracaso. o decir. defectuoso/bueno. la ~unda pieza que ~ saque no es independiente de la primera. Esta restriccíén signifia qix el experimento por naturaleza produce pruebas independiente> (por ejemplo lanzar al aire monedas o tirar dados) o el experimento se realiza con restitución.OIS 6 . suponga que 5% de todas las piezas de un recipiente estan defectuosas. Por ejemplo. 2. Sin embargo. Por ejemplo. que se marcan como bcito o fracaso. el multado de encontrar una en una prueba de un experimento es un mto.000 s DfSTRIBUCIÓN BINOMIAL Qu1ú la más ampliamente conocida de todas las distribuciones discretas es la distribución binomial. Utilice los datos para determinar el número medio de quienes toman Pepsi en una muo· tra de seis personas de la ciudad y calcule la desviación estándar. En los experimentos precedentes. permanece constante de una prueba a oua. Si la primera pieza saada no se resntuye.¡o 5 piezas defectuosas en b. Si los investigadores están estudiando personas zurdas. donde el término p es la probabilidad de obtener un éxito en cualquier prueba y el término q • ( 1 . Cada prueba e> independiente de las pruebas anteriores. las pruebas deben ser independientes.mbWá para el siguiente saque. Vari.CAPIT\. ni lo es obtener ocho piezas defectuosas. si al azar se seleccionan cinco piezas de un lote.4 Suponga que 20% de la población de una ciudad prefiere Pepsi-Cola como su refresco favorito. En un experimento de distribución binomial. el efecto de muestrear sin sustitución es mlnimo y la suposición de independencia se satisface en esencia. Númtt0 de quienes toman Pq)si o Probabilicbd 262 . un fracaso pod. cualquier intento puede tener sélo dos resultado) posibles. Como indica la palabra binomial. etcttera ). En una muestra de cinco pieus.15 suposiciones e¡tán detrás del uso de la distribución binomial: • • • • El experimento comprende n pruebas idénticas. pod.p) es la pro· babilidad de obtener un fracaso en cualquier prueba.l muestra. doode x es un número entero entre O y n. la probabilidad de obtener un bllo en una prueba.La p:obabilidad de sacar una pieza defectuosa en el primer intento es p • . el número de quienes toman Pepsi podría variar de cero a seis. hombre/mujer.LO 5 DISTIUJIUOO:"-'E~ Dl~AS 147 S. l. . El efecto del requisito de prueba indepmdlentc es que p. En n pruebas.ria ser obtener una pieza aceptable (opuesto a una pieza defectuosa) u obtener una persona derecha (opuesto a una persona zurda).082 . Por ejemplo. La palabrafriicaso se 11$3 ~en oposmón a txito. La distribución binomial no toma en cuenta p para cambiar de prueba en prueba dentro de un experimento. sólo x bito) son po. En un experimento binomial. mutuamente excluyentes (derecho/zurdo.OS. cualquier prueba individual de un experimento binomial contiene sólo dos po ibles resultados.393 2 3 4 . sólo son po)ibles o. obtma 2. que se ha empleado durante siglo). .vación ron d wna1lo muestra!. La distribución binomial es una distribución d. A conúnuación se ven los posibles números de quienes toman Pepsi en una muestra de seis personas y la probabilidad de que ese número de quienes toman Pepsi se presente en la muestra. el resultado de in terés al investigador se marca como txito. p permanece relativamente constante. Cada prueba tiene sólo dos posibles resultados denotado) como wto o fracaso. r el \-alor p a. si un analista de control de calidad busca produetos defectuosos. Si al azar se escoge una muestra de seis personas. R~ la probabilidad para obtener esta secuencia de trabajadores se calcula con la regla especial de la multiplicación para eventos independientes ($i se supone que los trabajadores se seleccionan independientemente de una gran población de trabajadores). el tamaño muestra! aceptable para u-ar la distribución binomial con muestras tomadas sin restitución es ti< 5%. Si 4% de 105 trabajadores que rechazan ofertas <k reubicación lo hacen porque reciben muy poca ayuda. Suponga que la marca X de baterías para automóviles tiene una participación de 35% del mercado. ¿cuál es la probabilidad de que el primer trabajador entrevistado rechace la oferta debido a la poca ayuda que recibió para su rtubicación y los siguientes cuatro trabajadores rechacen la oferta por otra> razones? Representemo con T la poca ayuda para su reubicación y con R otras razones. ¿cu. Suponga que una máquina que produce chi~ de computadora produce 6% de piezas defectuosas..o.\l es la probabilidad de que al menos 30 automóviles tengan una batería de la marca X? 4. ¿cu. la probabilidad de seleccionar al azar un trabajador que rechace ofenas de reubicación por otras razones quedaría entre 1 -O.o. ¿cu'1 es la probabilidad de que 40 o más tengan compailias con programas para compradores preferidos? Resolución de un problema binomial Un estudio de reubicación de administradores hecho por Runzheirner International permitió ver \"ari.148 ESTADISTICA e.p. Rz. la suposición de independencia no e. ~.96)(. el valor de p = . si el tamal'lo muestral. l. Esta condición es a veces el caso con muestreos de control de calidad de producto) de lotes grandes de producción. de cuales 4% de quienes contestaron dijeron que rechazan ofertas de reubicación porque recibían muy poca ayuda para su reubicación. Si al azar se seleccionan 70 automóviles. Si la primera persona selec. El otro 96% de lo trabajadores que rechacen ofertas de reubicación lo hacen por otras razones.'\' Donde: t1 • tamailo muestra! N • tamallo poblacional Por ejemplo.96> = . y el muestreo se realiza sin restitución.96)(.cionada es zurda.&.&)(.03397 . A continuación veamo algunos ejemplos de problemas de distribución binomial. con muchos experimentos la población se reabastece continuamente incluso cuando se realiza el muestreo.u que los trabajadores se niegan a aceptar ofertas de reubicación. La secuencia de entrevistas para este problema quedaría como sigue: '°' T¡. para inquietarse. En la lista están incluí· das coasideraciones de familia. Si se supone que 4% se cumple para todo lo> trabajadores a quienes se ofrece rtubicación. Por tanto. Un estudio de hica sugiere que 84% de las compailías en E>tad06 Unido tienen código de ética. razone financieras y otras. suponga que 10% de la población del mundo es zurda y que al azar se selecciona una muestra de 20 personas de la población del mundo. entonces la probabilidad de que una persona seleccionada al azar y que rechace ofertas de reubicacién por ba razón es O.. 10 tengan un código de ética? 3.o. la probabilidad de obtener e$la secuencia de cinco trabajadores que han rechazado ofertas de rtubicación ~ria: P(T1 n R2 n RJ n ~ n R5> • (. De una muestra tomada al azar de IS companías.96)(. 96. "· e menor a 5% de la población.mos que cinco trabajadom que acaban de rechazar ofertas de reubicación se seleccionan al azar y son entrevistado ..& . Si al azar se toma una muestra de SO comparuas. Supor. que es el valor de q. Por tanto.u razones por l.10 prácticamente no multa afectado porque la población del mundo es tan grande. R. Un estudio encontró que casi 67% de agentes de compras de una compailla dijeron que su compañia tenía programas para compradores preferidos. Además. Si una compañía compra 30 de estos chip~ ¿cuál es la probabilidad de que ninguno ~ defectuoso! 2.\l e> la probabilidad de que al meno. que es el valor de p. LOS SECOCIOS En general. CAJ>m.11.0 S DbTIUBOOOSES DISCRETAS 149 Ob\iammte, en la sckcción al aur de trabajadores que rechazaron ofertas de reubicación, debido a que recibieron muy poca ayu~ para su reubicación podría ser el segundo trabajador o el tercero o el cuarto o el quinto. A continuación \UJnOStodas las ~iblcs secuencias para obtener un trabajador que rtdwa· ra la reubicación por la poca ayu~ que recibió y cuatro trabajadores que la rechazaron por otras razone> T¡. R2. R3, R.. s, R¡, T2. R3, R.. Rs R¡, R2, T3, R.. Rs R1, R2. R,, T4, Rs R¡, R2, R3, R.. r, La probabdidad de que cada una de estas secuencias se presenta se calcula como sigue: (.04)(.96)(.96)(.96)(.96) (.96)(.04)(.96)(.96)(.96) (.96)(.96)(.04)(.96)(.96) (.96)(.96)(.96)(.04)(.96) (.96)(.96)(.96)(.96)(.04) - .03397 - .03397 ... 03397 - .03397 - .03397 Nótese que en cada caso la probabilidad final es la misma. Ca~ una de las cinco secuencias tienen el producto .04 y cuatro veces .96. La propiedad conmutativa de la muluplicación toma en cuenta el reordenamiento de las cinco probabilidades individuales en cualquier secuencia. Las probabüídades en eada una de las cinco secuencias pueden reordenarse y resumirse como (.04)1(.96)•. Cada secuencia contiene las mismas cinco probabilidades, lo cual hace innecesario \'OIVl!r a calcular la probabilidad de cada secuencia. Lo que sf es imponante es determinar CIÚ!ltaS deferencias de secuencias se pueden formar y multiplicar con esa cantidad por la probabilidad de que se presente una secuencia. Para las cinco secuencias de este problema, la probabilidad total de obtener exactamente un trabajador que rechace la reubicación por la poca ayu~ recibida para su reubicación, en una muestra aleatoria de cinco trabajadores que rechazaron ofertas de ubicación es: 5(.04)1(.96)4 - .16985 Una forma más fácil de determinar el número de secuencias es realizar una lista con todas las posibilidades y usar combinaciono para calcularlas. (El concepto de combinaciones se introdujo en el capltulo 4.) Cinco trabajadores se muestrean, entonces n • 5 y el problema es obtener un trabajador que rechazó una oferta de reubicación debido a la poca ayu~ recibida para su reubicación, x • 1. Por tanto, ,.Cx dará el número de formas posibles para obtener x áitos en n intentos. Para este problema, 5C1 es el número de secuencias de posibilidades. 5! sC1 = l!(5 _ !)! = 5 Al ponerle un valor a la probabilidad de una secuencia con la combinación se obtendrá. 5C1(.04J•(.96)• = .16985 Cuando se usan combinaciones se simplifica la determinación de las secuencias que son posibles para cieno valor de x en una distribución binomial. Ahora suponga que 70% de los estadounidenses piensan que limpiar el medio ambiente es un problema importante. ¿Cu.ti es la probabilidad de muestrear al aur cuatro estadounidense) r tener aactameme dos que digan que limpiar el medio ambiente es un problema importante? Representereos por E el bito de obtener una persona que piense que limpiar el medio ambiente es un problenu in:por· tante. Para este ejemplo. p • .70. Representemos por N el fracaso de no obtener una persona q\lt piense que limpiar es un problema importante (N denota no importante). La probabilidad de obtener um & estas personas es q • .30. Ahora veamos las diversas secuencias para obtener dos E en una muestra de cuatro. E,, E2. N,, N4 E,, Nz, E,, N4 E,, Nz, N3, f. N1, Ez, E,, N4 N1, E2, N,, E. N1, N2, E3, f. ISO ESTADISTICA E." ~Nl!GOCIO:. ~ ~xilO) en una muestra de cuatro pueden ocurrir en seis formas. Con el uso de combinaciones, el numero de secuencia> es La probabilidad de seleccionar cualquier secuencia individual e : (.70)2(.)0)2 - .04-41 Por umo, la probabilidad tolal de obtener exactamente dos personas que piensen que limpiar el ambiente es importame,de cuatro personas seleccionadas al azar, cuando 70% de los estadounidenses piensan que limpiar el ambiente es importante, seria: 4C2(.70J2(.30)2 • .2646 Si generalizarnos a panir de estos do) ejemplos obtenemos la fórmula binomial, que se puede usar para resolver problemas binomiales. FÓRMVl.A BlNOMIAL P(xl • ftCx· donde 11 •número de n' r· q"-"- --·· r · 'l"-" xl(n - xi! intentos (o número que se muestrea) x • número de éxitos deseado p • probabilidad de obtener un éxito en un intento q • 1 - p • probabilidad de obtener un fracaso en un Intemo La fórmula binomial resume los pasos presentados hasta aquí para resolver problemas binomiales. La fórmula permite la solución rápida y eficiente de esto· problemas. PROBLEMA DE DEMOSTRACIÓN - ..., ) El estudio de Gallup analizado en el Dilema de decisión encontró que 65% de los consumidora financieros estaban muy satisfechos con su institución financiera principal. Si esta cifra todevi.¡ se cumple, suponge que al azar se muestrean •O consumidores financieros. ¿Cuál es la probabilided de que exectamente 23 de los •O estén muy satisfechos con su insutución finenciera principal? Solud6n El valor de pes .65 (muy satisfechos). el valor de q • 1 - p • 1 .65 .35 (no muy satisfechos!, n • •O y x 23. Con la fórmula binomial se obtiene la respuesta final: .oC23(.65)23(.35)11 - 188732378800)(.0000'9775)(.000000018) • .078• Si 65% de los consumidores financieros están muy satisfechos, alrededor de 7.8•% del tiempo el investigador obtendrla exactamente 23 de los •o consumidores finencieros que estan muy satisfechos con su institución financiera. Las probabilidades están contra obtener 23 de los consumidores financieros que al azar están muy satisfechos con su institución financiera ¿Cuántos consumidores muy satisfechos serla posible obtener en •O consumidores financieros seleccionados al azar? Si 65% de los consumidores financieros están muy satisfechos con su ins litución financiera principal, uno esperaría obtener alrededor de 65% de •O o sea (.65H•O> • O 2! consumidores financieros muy satisfechos. En cualquier muestra individual de •O consumidores financieros, el número de los que están muy satisfechos es probable que difiera de 26. En promedio. el número esperado es 26. Un investigador que de obtenga 23 consumidores fina!\o cieros muy satisfechos puede ver este número en vista de los 26 que esperarla. '° '° PROBLEMA DE DEMOSTRACIÓN 5.3 Según el U.S. Census Bureau, aproximadamente 6% de los trabajadores en Jackson, Mississippt. están desempleados. Al llevar a cabo una encuesta al azar y por te16fono en Jackson, ¿cuál es la probabilidad de obtener dos o menos trabajadores desempleados en una muestra de 207 CAPITULOS OlSTlUBUOO'-"ESOl~AS151 Soluc:l6n Este problema debe resolverse como la unión de tres problemas: 1) cero desempleados, x • O 21 un desempleado, x .. 1 31 dos desempleados, x • 2. En cada problema, p • .06, q • .94 y n • 20. De la fórmula binomial se obtiene el siguiente resultado: x•O 20Co!.06)0(.94)20 .2901 XM1 + + 20C1(.061º(.94) 11 .3703 + + x•2 20C21.06)2(.94)18 2246 - .8850 Si 6% de los trabajadores de Jackson, Mississippi, est6n desempleados, el encuestador por teléfono obtendrla cero, uno o dos trabajadores desempleados 88.5% del tiempo en una mues· tra aleatoria de 20 trabajadores. El requisito para obtener dos o menos se satisface al obtener cero, uno o dos trabajadores desempleados. Entonces, este problema es la unión de tres proba· bilidades. Siempre que se use la fórmula binomial para resolver éxitos acumulativos (no un número exacto), la probabilidad de cada valor x debe resolverse y sumarse a las probabilidades. Si un estudio real produjo tal resultado, servirla para validar las cifras del censo. Uso de la tabla binomial Cualquier persona que resuelva suficientes problemas binomiales empezará a reconocer que la proba· bilidad de obtener x '"' 5 éxitos de un tamaño muestra! den • 30 cuando p .10 es la misma sin importar si los cinco éxitos de personas zurdas, piezas defectuosas. compradores de marca X o cualquier otra variable. Si la muestra comprende personas, piezas o productos no impona en términos de las probabilidades finales. La esencia del problema es la misma: n 30, x 5 y p .1 O. Al reconocer este hecho, expertos matemáticos construyeron un conjunto de cuadros binomiales que contienen probabilidades resueltas previamente. Dos parámetros, n y p, describen o caracterizan una distribución binomial. Las distribuciones binomiales en realidad son una familia de distribuciones. Todo valor diferenteden y/o todo valor dife· rente de p proporciona una distribución binomial diferente,y existen cuadros para varias combinaciones de valores n y p. Debido a limitaciones de espacio, los cuadros binomiales presentados en este texto son limitados. La tabla A.2 del Apéndice A contiene cuadros binomiales, cuadros encabezados por un valor den. Nueve valores de p se presentan en cada con la tabla tamaño n. En la columna situada abajo de cada valor de p está la distribución binomial para esa combinación den y p. La tabla 5.5 contiene un segmento de la tabla A.2 con las probabilidades binomiales para n • 20. = = P!OILEMA DE JIEMOSTRACIÓN 5.4 Resuelva la probabilidad binomial para n Apéndice A. = = 20, p • .40 y x • 10 con el uso de la tabla A.2, Solucl6n Para usar la tabla A.2. primero hallamos el valor de n. Como n • 20 para este problema se puede usar la parte de los cuadros binomiales que contienen valores para n • 20 represen-.-dü en la tabla 5.5. Una vez localizado el valor de n, busque el valor apropiado de p horilona!memeen la parte superior dla tabla. En este problema, p M .40. La columna bajo O contiene las proba· bilidades para la distribución binomial den - 20 y p • 40 Para obtener la probabílidad de x • 10, encuentre el valor de x en la columna de la extrema izquierda y localice la probabilidad en el euadro la intersección de p • .40 y x • 10. La respuesta seria 0.117. Si se resuelve este problema con la fórmula binomial se obtiene el mismo resultado. '° 152 ESTADISTICA E.~ l..05 !'IE(;()(.'IOS PROBLEMA DE DEMOSTRACIÓN 5.5 Según lnformation Resources, la cual publica datos sobre participacióndel mercado para varios productos, Oreos controla alrededor de 10C!I. del mercado de marcas de galletas. Suponga que de la población se seleccionan al azar 20 compradores de galletas. ¿Cu61 es la probabilidad de que menos de cuatro compradoresescojan Oreos? Soludón Para este problema. n • 20, p • .10 y x < 4. Como n • 20, la parte de los cuadros binomiales representadaen la tabla 5.5 se puede usar para resolver este problema. Busque a lo largo de la fila de p valores para 0.10. Determinar la probabilidad al obtener x < 4 comprende sumar las probabilidades para x • O, 1, 2 y 3 Los valores aparecen en la columna x en la intersección de cada valor 1<Y p 10. Velo." o 1 2 3 .122 .270 .285 .190 lx< 4) • .857 Sí 10% de todos los compradores de galletas prefieren Oreos y 20 compradoresde galletas se seleccionanal azar,alrededorde ~.7% del tiempo menos de cuatro de los 20 seleccionarén Oreos. Uso de computadora para producir una distribución binomial E.ud y MINITAB se pueden usar para producir la. probabilídado para prácucamentecualquier distribución binomial. Estos programa»de computadora ofrecen incluso otra opción para resolver problmw bínomiale», ademh de usar la fórmulabinomial o los cuadros binomiales. En realidad, los paquetes de computadora en efecto imprimen lo que seria una columna de la tabla binomial. Las ven· taps de usar paquetesde cstad~tíca para este fin son la comodidad (sí no '<e dispone fácilmente de los cuadros binomialesy de una computadora)y el potencial para generarcuadro>para muchosmás valores que los impreso>en las cuadros binomiales. TABLA 5.5 E1<tracto de la tabla A.2, Apéndice A • •lO X o 1 2 3 4 5 6 7 8 9 10 11 12 u 14 15 16 17 18 19 20 .1 .122 .270 .215 • 190 090 .032 .009 .l .ou .851 .137 .205 .218 .175 .002 .000 .109 .055 .022 .000 .O<fl .000 .002 .000 .000 .000 .000 .000 .000 .000 .000 .000 .000 .000 .000 .000 .000 .000 .000 .000 .000 .000 .000 - - - -..- -... .... - ..... ... ... ........ ........ ... .-. ...... ~.. .. - ...... ..... ;~ ..-... - -..- -- ... - .J .GOi JlllO Jl2I .oos m .uo .179 .192 .4 .5 JlllO .012 .000 .001 .QJ5 .G05 .u. .015 .llS7 ..,, ••• .G65 .oJl .160 .U7 .UD .160 176 .001 .015 1114 .ou .000 .000 .000 ..,. .... .7 .000 .G01 M!f1 .115 ...,, "11 .117 .IDO AllO .111 '.'W ... ~ .-.:...- .,, .124 .cm .012 JlllO .IDO .IDO JlllO Jll5 M6 .114 " .w JIOO.. • 1 .179 .1'9 612 * ., JD2 .21' ., .Z7t .012 .m CAPtrul.O S 015TIUBUOO!'-'I~ DISCRETAS 153 Por ejemplo, el estudio de dientes bancarios presentado en el Dilema de decisión indicó que 64% de todos los consumidores financiero» piensan que los bancos son más competitivo hoy de lo que fue. ron hace cinco aflos. Suponga que al azar se seleccionan 23 consumidores financien» y deseamos dererminar las probabílidades de que ocurran varios valores x. La tabla A.2 del Apéndice A no podría ~ porque esún incluidos sólo nueve valores p diferentes y p • .64 es uno de esos valores, Ademú, n 23 no se incluye en la tabla. Sin la computadora, quedamos con la fórmula binomial como la única opción para resolver problemas binomiales para n • 23 y p • .64. Particularmente si se formulan las preguntas de probabilidad acumulativa (por ejemplo. x s 10), la fórmula binomial puede ser una forma tediosa de para resolver el problema. En la tabla 5.6 se muestra la salida de MINJTAB para la distribución binomial den • 23 y p • .64. Con esta salida de computadora, un investigador podría obtener o calcular la pro!nbilidad de cualquier ocurrencia dentro de la distribución binomial den • 23 y p • .64. La tabla 5.7 contiene salida MJNITAB parad problema binomial en particular, P(x s 10) cuando n • 23 y p • .64, resueltos con el uso de la función de probabilidad acumulativa de MINITAB. En la tabla 5.8 se muestra la salida Excel para todos los valores de x que timen probabilidade» mayores de .000001 para la distribución binomial analizada en el problema de dem~ción 5.3 (n • 20, p • .06) y la solución a la pregunta formulada en el mismo problema. = Media y desviación estándar de una distribución binomial tllLA 5.6 ~ MINITAB para la bución binomial de - 23. p 6' P(S • :a) ...... 0.0000 o ..... .... O.tOOO 0.0000 0.0000 . oo 1.00 .oo .oo .oo • oo .00 .oo .00 .oo o.om o.otn O.OMO O.UM 0.1 .. 0.1712 0.1512 0.1114 º·°"° o.UOt ..... .oo O.tNO .oo = TABLA S.7 Salida MITAB para el problema binomial, P{x! ,. 10 n 23 y p .64 maannrn •t..Cel - D • 23 f p • 0.6'0000 •e•<• a 11.00 a) 0.0357 o ... 0.0031 0.0090 •00 .00 .oo Una distribución binomial tiene un valor esperado o un promedio de largo plazo que se denota conµ. El valor deµ se determina con t1 ·p. Por ejemplo, sin • 10 y p .4. entoncesµ • t1 • p • ( 10)(.4) • 4. El promedio a largo plazo o valor esperado ~ignifica que, si se muestrean n arnculos una y otra vez durante largo tiempo y si pes la probabilidad de obtencr un éxito en un intento, el número promedio de éxites por muestra ~ espera que ~ n · p. Si 40% de todos los estudiantes graduados de administración se seleccionan muchas veces, la expectativa es que, en promedio, cuatro de los 10 estudianres sean muieres. ·- 0.0110 TABLA 5.8 Salida Excel para el problema de demostración 5.3 y la distribución binomial de n 20, p .06 • , A •• 2 ProblJd 02901 03703 02248 4 e.ozaa l "9 IS ta l'r "o 1 , n.'\IUD ta R nnnn<> I• 7 0.0001 l4A A """"" '"12 D E f nn<UU\ e; CI e """""x s Th• nrobabilirv 1 1 2 when n• 20 and 1 1 a • .Ofl is: 0.8850 Lo..30 El capítulo 6 muestra que algunas dutribuciones binomiales son casi en forma de campana y puede calcularse con el u~ de la curva normal. Todas las otras probabilidades p. E.IS4 ESTADl$TICA EN LOS NEGOCIOS MEDIAY DESVlAOOS ESTANDAR DE UNA DISTJUBUOOS 811'\0\11A1 Al examinar la media de una distribución binomial multa una opinión intuitiva acerca de la probabilidad de un resultado dado.36) • 2. la media de la distribución k da un valor esperado del cual trabajar.2117 . a ~ \/100(..1605 y Ptx • 16) • . ¿cu. .1712.argo plazo. t\o obstante.90) • 3.20 la distribución ~ú sc-gada a la derecha y para p • .2nl . S1 al aur se seleccionan 23 coruwnidom finanános.80 la distriboción esl. ..10 es ( 100)(.-· . los consumidores financieres piensan que los bancos son mú compcuti~ hoy de lo que fueron hace cinco atlo>.cmn . esta cifra es mh alta para nm<» que nacen de mujem de m. • . La desviación est. supongamos que lo invesugadore generalmente estil: de acuerdo con que 10% de todu IOb pe~n~ son 1urd~.. •12 . En un intento por reunir cvidenciu..SO... l 2 J . n•8 .••2. µ • n •p • 23(. La media y desviación esúndar de una distribución binomial son las herramientas usadas para convertir estos problemas binomiales en problemas de curva normal. ¿ocurrieron al aur o la investigadora esú sacando dat<» de una población diferente que la población general que produce 10% de zurdos? Ella puede invntigar m.·• ."'5 . 23)(. La figura S.50..72 consumldores de 23 que piensen que IOl bancos 10n mú compctitiVQj hoy. zurdo& de la muestra de 100.indar para el problema de consumidores financien» descrito por la distribución binomial de la tabla 5.. Graficación de distribuciones binomiales La gráfica de una distribución binomial se puede construir con el uso de todo> los posibles valores de x de una distribución y sus probabilidades asociadas.1522.. ¿Es probable que eUa ebtuviera 20 zurdos en una muestra de 100? ¿Cu. P(x • 14) • ... Por ejemplo.72 A l. P(x • 15) • ... como ya otros lo han expresado..20.i en \'tfdad 64% de todos 105 consumidores finandero' piensan que lo' banc<» son mú competiti~ hoy..b este multado examina ~ probabilidades binomiales para este problema. 80. La desviación estándar de una distribución binominal se denota a y es igual a '-'" · p · q.72 personas de 23 que piensan que lo¡ banco' son m. .. la distribución es simétrica.9 es una lista de w probabilidades para tres diferentes cfutribucioncs binomiales: n • 8 y p • . ella $Clccáona al uar 100 nitlo¡ que nacieron de mujeres de mú de 35 at\os y 20 de eUos multaron $Cr zurdos. '' al uar se seleccionan 23 consumidores financi~ una y otra va y .? úte problema se puede describir por medio de una distribución binomial de n • ~ y p • ..b compet1th'O.lle' •11 .... y n • 8 y p .. ~ 20 niflo. hoy..5 7 . \'alores x suelen gr 1:.. ·a:. nunca obtendrá en realidad 14.. 1671 .64 dada en la tabla S. Observe cómo es que la forma de la distribución cambia cuando el valor de p aumenta. . que una invesugadora piensa que.6.. ..9 a» Probabilidades para tres distribuciones binomiales .JtJI 1 ~- \...i sesgada a la izquierda.x&mUle la tabla S.6.. SegUn un estudio. La media de esta distribucién binomial da el valor esperado para este problema. No obstante..U de 35 allo.-. El lector debe darse cuenta que como la distribución binomial es una distribució!l ducrct1. supongamo..64) • 14. Para e! ejemplo de zurdos. n • 8 y p • .... Para p • .intos debiera haber esperado obtener en una muestra clt 100? El valor medio o esperado paran • 100 y p • . • t.64)(. earse a lo largo del eje x y las probabilidades $C grafican a lo largo del eje y• la tabla S.ti es el numero esperado que piensan que I<» bancos son mh competitivo hoy de lo que fuerce hace cinco afio.6 es TABLA 5.. 64% de todo..10)(.- .JtJI • • • . ...ira csu distribución son menos que estas probabilidades. ..2 muestra grif1CB Excel para cada una de estas tres distribuciones binomiales. entonces d experimento dcbttú promediar 14.. Para p • .. . La media de la distribución de¡a ver la relativa probabilidad de cualquier ocurrencia indl \idual.10) • 10 zurdo . Esta figura es lógica porque la media de la cliwib . Nóte$C que las mh altas probabilidades son aquellas cerca de x • 14 7?. DUtnbución binomial: n • S y p • .:-11.80 O.1.20 ~.IS l 0.JS •8 O.J -o 0.a y p .2S ct O.SO 0.nornial: n • 8 y p • .os o o 2 ) 4 Valornx s Distribución bi.JS O.IS 0.J j 0.2 O.os o o 2 ) 4 Valornx .1 o. Distnbución binomial: " .2 0.1 o.2S "ª 0.1 o.IS 0.2 1 O.os o 2 ) 4 Valornx s 6 7 a 6 7 a 6 ..2S ~- 1 0..t¡¡ .:cas Excel para distribuciones CIOOlniales con O. encuentre P(x 2 7).6 Una compal\la fabricante produce 10 mil tarros de pléstíco por semana. = = 5. encuentre P(5 :S x :S 7). Entonces.40 . b. y p . x s 2. a. 12 y p "" . n = 100 y p •. que está en el medio de la distribución. encuentre P(x 2 7). 30.SO = .382 . Si" • 4 y p"' . n = 20 y p • . a.930) de que el lote sea aceptado por probabir Para valores més altos de o. En cualquier distribución binomial el valor más grande de x que puede ocurrir es n y el valor pequeño es cero. x:s 2.6 Resuelva lo) siguiente) problemas con el U$O de los cuadros binomiales (vtase la tabla A. la probabilidad de aceptación del lote por probabilidad se red Además.10 a . n 70 y p • . PROBLEMA DE DEMOSTRACIÓN 5. a. encuentre P(x"" 12).SO..clo P(x"' 2) . Si dos o menos de tarros muestreados son defectuosos. 20 y p .20 es 1..0 4. Esta compallla sun.30 .. d. cuando p aumenta.677 . c.. Sin "' 20 y p = . esta restricción resultara en que la grafica"se apila" en un~ mo y está sesgadaen el otro extremo.. Sin -= 10 y p .156 ESTADISTICA El' LOS NEGOCIOS binomial n = 8 y p = . movimiento reduce las probabilidades de aceptación del lote.10 . encuentre P(x • 3). 1.60. Si" 10 y p = . Sin • 7 y p .40.0 2. c.90. la segunda compal\ía acepta el lote. la gr.70. La media de la distribución n = p e.80 es 6. f.167 Núm•o npllf8do de defectos (µ) 1.0 3.40. Sin . 6 y x • 7.0 Estos valores indican que si la compañia fabricante esté produciendo 10% de tarros d tuosos.. Sin= 15 y p = . Por tanto.. segunda compallla al azar muestrea 10 tarros enviados del proveedor. el valor esperado se aleja de los valores aceptables. que resulta en las más altas probabilidades cerca de x .7 Despejela media y desviación estándarde las siguientes distribuciones binomiales. encuentre P(4 :S x :S 9). encuentre P(x :S 16).SO.. p Lote ec.SO es 4.70 b. el pico la distribución e~tá más cerca de 8 que a O y la distribución se estira hacia x . encuentre P(x > 8). c. y pvaria de .80.6. encuentre P(x < 12). la probabilidad es relativamente alta (.. Esta gráfica t" un pico al principio y se alarga hacia los valores más altos de x. Si n . b.tfica de cualquier distribución binomial está restringida por cero y Si el valor p de la distribución no es .2 y acu lando los valores tenemos la siguiente probabilidad de x s 2 para cada valor p y el valor rado (µ • n · pi.10. d. Si n = 20 y p .930 .pt. Sin = 20 y p = .35 c. n = 10.4.20 ..60. De la tabla A. que resulta en las más altas probabilidades cerca de x • 2 y x .5 Resuelva los siguientes problemas con el U$O de la fórmula binomial. O.. = = 5. La media de la distribución n . .2). 52 PROBLEMAS 5. encuentre P(x • 4).nistra tarros a otra compallla.45. que los empaca como pane de juegos para dia de campo. ¿Cu61 es la proba dad de que el lote sea aceptado si la compañia fabricante de tarros en realidad esté producie tarros que son 10% defectuosos? ¿y 20% defectuosos? ¿y 30% defectuosos? ¿y 40% defectu Solución En esta serie de problemas binomiales. . 88% de las compañías dicen que hay escasea de candidatos calificados. n•8yp•.icro se hi bccbo ~ frecuente que nunca an1e.13 En los pasados aftO$ recientes.ti es la probabilidad de que todas las companw digan que hay escasez de candidat0$ cali6cados? ¿Cuál es el número esperado de companias que dírlan que hay C$CUCZ de candidatos cali6cad~? S.10 Th« \\\:d/ Srrttr loumal reportó algunas e•tadi>liCb interesantes sobre el mercado de trabajo.h alta>? Calcule la desviación csú::ldz:. ¿Cuál es la probabilidad de que menos de 10 de estos consumidores hayan llamado a e número de teléfono 800 o 900 para información acerca de algún producto? L S. ¿Entre cuáles dos valores de x esú eu íoten-alo? ¿Cuál es el porcentaje de valores dentro de este intervalo? ¿Cómo se ~ esta respuesta con lo que darfa el teorema de Chebyshev o la regla empírica presentada en d l? S.8 Utilice 10$ cuadros de probabilidad de la tabla A. Un estudio reciente de la revista Purdiasing {Compras m&a que 20'!& de las compailías que realizan operaciones por contrato en el extranjero ~ cc:=!:o:l'C$.il es la probabilidad de que nueve o mis di~ran que si? ¿~les la probabilidad deque tres. • L ¿Cuál es la probabilidad de que exactamente 14 de estos compradores usarían la Internet para información de precios! b. Suponga que estos porcentajes se cumplen para iodos I~ compradores. y 70% dijeron que la usarfa para reconocimientos de órdenes de compra.9 La revista Purchasing(Compras) reporté los resuliado. Suponga que 16 trabajadores se seleccionan al azar y se les pregunta si cambiarían de Ira· bajo por•una paga ligeramente más al1a': ¿Cu..h. 60% de todos IO$ consumidores han llamado a un número de teléfono 800 o 900 para información acerca de al~ producto. Setenta y ocho por ciento dijeren que la usarfan para conocer información de precios. ¿cu.12 Grafique la distribución del problema 5. Suponga que al azar se seleccionan IS compailla. ¿Cómo o que el valor cspendo K compara con los valores de x que tienen las probabilidades m.ti es la probabilidad de que exactamente 1 O digan que hay escasa de candidatos cali· ficad<»? ¿Cu. No obstante. n•20yp•.cuatro.2 y trace la gráfica de cada wu de bs sigmmtes distribuciones binomiales.CAPfnJlOS DlmuBUOO~CSDISCRFT. ¿Cuál es la probabilidad de que todos los compradores usarían la Internet para enviar érdenes de compra? c. Determine el intervalo µ :!: 2'7 para esta distribución.50 c.ffan b Internet si pudieran resolverse la seguridad y otros problemas.i libre de problemas.ti es la probabilidad de que exactamente cinco compatlias que raliu. Una pregunta era de cómo uQ. Una esiadí•tica es que 40% de iodo.ts alus las~des? Determine el valor esperado de esta distribución. ¿Para qué valores de x son m. rnbzu ~DO ot. en compañías estadounidenses.cineo o seis dijeran que si? Si se consulta a 13 compaflias. ¿Cuál es la probabilidad de que m. Un investigador muestrea al aur 20 compradores y les pregun1a cómo usarían la Internet ~i pudieran resolverse la seguridad r otros problemas. los trabajadores dicen que cambiarían de 1rabajo por •una paga ligeramente más alta': Adem. ¿Cuí! es la probabilidad de que menos de 12 usarían la Internet para reconocimientos de érdenes de compra? S. de un estudio en el que a compradores se les hace una serie de pregun1as respecto al uso de Internet. L ¿Cuí! es la probabilidad de que IS o más de estos consumidores hayan llamado a un numero de teléfono 800 o 900 para información acerca de algún producto? b. Ano1e en la grá6ca el lugar donde cae la di. Suponga que una muestra alea1oria de 25 consumidores son entrevistados acerca de •US hábitos de compras.80 5. realizar operaciones por comrato en el cxtran..S 15i S.11 Un número creciente de consumidores piensan que deben estar atento en el mercado. 75% dijo que la usarían para enviar órdenes de compra.nn'bución.70 b.:1 opaaooocs por contrato en el extranjero usen un consultor? . Según un estudio realizado por la Yankelovich Partners para la revisia USA WEEKEND.is de 20 de estos consumidores hayan Uam. que realizan operaciones por cc:::ua:c. n • 6yp= .11. L (Cu.1do a un numero de teléfono 800 o 900 para información acerca de algún producto? c. L ¿Cu. y el número por ma podría ser descrito por la b tribución de Poisson.ti es la probabilidad de que ninguno tenga un promedio de wnatlo de cliente entre SI millón y SS millones? ¿Cual probabilidad o mis alta y por qué! 5. A veces la distribución de Poi. 30% de todos lo) asesores financieros (contadores públicos titulados. ¿Cual o la probabilidad de que nueve compai'l(a) que ittlíun operaciones por contrato en d extranjero usen un consultor? c.14 Según Cerulli Associates of Boston. los accidentes serios en una planta de productos qutmico) IOn poco comunes. ¿Cual o la probabilidad de que ninguna de las compallia) que realizan operadono trato en el extranjero use un consultor? por con· d. tres o cuatro asesores financiero) (CPT) tengan un promedio de wnano de cliente entre uno y SS millones? d.. mientru que un experimento binomial podría usarse para determinar cuinto¡ autlll hecho' en &tado) Unido. ¿Cuál es la probabilidad de que ninguno de lo) a~res financiero) tiene un promedio dt tamano de cliente entre $500 000 y SI millón? ¿Cu. La distribuáóe de PoiJM>n st concentra !()/o tri ti nunrtro dt s11cts0s discretos sobrt 11/gün inttrWllo o seri« cor111nuo. CPT) tienen un promedio de tama. (CPT) que tienen un promedio de tama· !lo de diento entre S500 mil y un millón? ¿Cual es el número esperado con un promedio dt tamaño de clientes entre uno y $5 millones? b. un experimento de ~wo:i podría enfocarse sobre el número de autos que al azar llegan a un taller de servicio durante un mtervalo de 10 minutos. Uc experimento de Poi510n no tiene un número dado de intentos (n) como lo tiene el experimento binomial.4 DISTRIBUCIÓN DE POISSON La dmnt>uaOn de Poisson es otra distribución discreta. la fórmtda de Poisson se ha atado como la ley de eventos improbablts. La distribución binomial describe una dimibución de dos posibles resultad0$ designados como éxitos o fracU06 de un número dado de imentos.ti o el numero esperado de asesores financiero. La distribución de Poisson describe la ocurrencia de eventos poco comuna. Si el numero de llegadas por intervalo ~ dema. ¿Cujl es la probabilidad de que dos. De hecho. La distribución de Poisson tiene las siguiente) características: • Es una distribución discreta. recibe ese nombre en honor a Simeon-Dena Poisson (J. Por ejemplo. e)tán en una muestra aleatoria de 20 auto.<on se utiliza para describir el numero de llegad¡j aleatoriu por algún intervalo.tribución en un articulo técnico en 1837. En vista de la gráfica y el valor espera· do. 1-1840). Construya una gráfica para esta distribución binomial. ¿Cual es la probabilidad de que al menos ocho uaores financiero. . el íntervalo se puede reducir lo •uficiente para que se espere un número poco comun de eventos. Suponga que existe una li>u completa de todos los asesores 6nancieros (CPT) y que de la lista al azar 18 se seleccionan. Tienen 34911 un promedio de wnlilo de cliente entre uno y SS millones. ( CPT) tengan un promedio de wnano de diente entre $500 mil y un millón? c. • Describe eventos poco comunes. Por eiemplo. Otro tjem-plo de una distribución de Poisson C) el numero de llegadas aleatorias de clientes por intervalo de ciDQI minutOJ a una pequeña boutique en las mananas de dlas hábiles. La distribución de Poisson y la distribución binomial tienen algunas semeja01u. La distribución de Poísson también tiene aplicación en el campo de ciencias admanistrati~. ¿Cual a la probabilidad de que entre cuatro y siete (inclusive) compmías que ruliun opera· clones por contrato en el extranjero usen un consultor? e. matemático francó que publicó I~ puntos esenciales de esta d>. S.iado frecuente. pero también algunas diferencias.1 S8 ~TADlSTICA E. lci modelos empleados en la teoría de colas (teoría de lineas de espera) por lo general están basado) en supcsícién de que la distribucién de Poisson es la distribución apropiada para describir porcentaia de llegadas aleatorias en cieno periodo.'1 LOS ~EGOCIOS b.l\o de cliente entre S500 mil y un millón. aplique por qué la probabilidad resulta de haber obtenido las panes (a) a la ( d t. Si se estudia un fenómeno de distribuciónde Poisson sobre un largo periodo.El numero de defectospor par de jcaru podrla nnar de a viernes. 2. t-iúmero de manchas de pintura por automóvil nuevo.El valor). >. La probabilidad de que cinco dientes lleguen al azar . Número de veces que una llanta se revienta en un avión comercial por semana. Aqul es oponuna una palabra de advertencia acerca del uso de la distribución de PolSSOD para estudiar varios fenómenos. Describe sucesos discretas sobre una serie connnua o intervalo. 3. • Promedio a largo plazo t = 2. Los sucesos en cada intervalo pueden variar de cero a infinito."t >. El invesrigadcrdebe ser cuidadoso y no aplicar una lambda dada a intervalo para los cuala am!:tit lambda. Cada uno de esto) ejemplosrepresenta un suceso raro de eventospara algún intervalo.. aun cuando el tiempo es un intervalo más común para la distribuciónde Poissen. 'óte-.ti es la probabilidadde que exactamente cinco clientes~ en un mtcn-alode 4 minutos en una tarde de dla hábil? La lambda para este problema es 3. 6. Este promedio se denota como lambda(>. I.718282 es la base de logaritmos naturales.2 dientes por 4 mmutos. La fórmulade Peisson se utiliza para calcular la probabilidadde sucesosen un intervalo para un valor dado de lambda. Número de derrames importantesde petróleo en b región de Nueva Inglaterra por mes. 2. x! 0.2 dimin cada 4 minutos. El investigador debe ser especifico al describirel intervalo para el cual se wa >.. El valor de x es Cinco clientes por cuatro minutos. Cada problema de Poi(son contiene un valor lambda del cual se determinan las probabilidadesde sucesos paniculares.. Por ejemplo.E POISSON P(x) =- donde X= >. ).y t • 2. es posible determinar un promtdio a largo plazo.718282 Aquí. 8.m. Número de llegadas a una caseta de cobro de autopista por minuto entre las 3 y 4 a. Número de llamadas telefónicaspor minuto en un pequeño negocio.). 9.3. Numero de defectospor pina de tela. Numero de defectos de CO)tura por par de jeans durante la producción. Número de casos de una extral'la enfermedad de la sangrepor 100 mil personas. Ejemplos de situaciones del tipo de Poisson son los siguientes: l. Además. S. debe mantenerse constante en todo un experimentode PoWon. Resolución de problemas de Poisson por fórmula Suponga que al aur llegan clientes de banco en la tarde de dtas habíles a un promedio de 3. en enero en la Kansas Tumpike. 7. dia a dla y mes a mes. FORMULA O. una distribución de Poisson puede ser descrita por>. El número esperado de suceso) debe mantenerse constante en todo el experimento. Diferenteshcras dd día o scmim podrian producir lambdas diferentes. Algunosde lo) intervalosde estos ejemplos podrian tener cero sucesos. Número de veces que una impresora de un afio de antigüedadse descompone por trimestre.Aun cuando n y p se requieren para describir una distribución binomial.eque.• • • • CAPnvLO S DlSTRlllUOO~"iS DISCRETAS 159 Cada ocurrenciaes independiente de los otros sucesos. 4.. ¿Cu. sola. lo) intervalo pueden variar de un condado de Estado Unidos a un par de jeans. el promedio de sucesos por intervalo para muchos de esto) ejemplosestá probablementeen un digito ( 1-9). .x es el número de sucesos por intervalopor el cual la probabilidad se calcula. 10. es el premedio a largo plazo. Número de basureros peligrosos por condado en Estados Unidos.el número promedio de clientes que llegan a una tienda Sears durante an u::nvale de un minuto varía de hora en hora. 2 clientes cada ' minut05.0000 131 81 • . PROBLEMA DE DEMOSTRACIÓN 5.2'2l<•"321 .2 que las probabtlidades se aproximan a cero. Esta respuesta indica que más de siete personas llegarían al azar en un periodo de ' minutos sólo 1.• "·En realidad.. es poco probable que mis de siete personas lleguen al azar en cualquier periodo de 4 minutos.2')(e 3 21 • .2''ll•"32I 111 • .2'lle ·3.2S)(r-J. xjuntas en v v . los oficiales de banco usan estos resultados para ayudarse a tomar decisiones de contratación de personal.2l • P(x Si el banco ha estado promediando 3. ¿Cu61 es la probabilidad de tener más de siete clientes en un intervalo de ' minutos en una tarde de día hábil? >. 12IA . la probabilidad de que cinco clientes llegucc durante cualquier intervalo de 4 minutos es 0.2 clientes por .C (3.2 clientes cada' minutos en las tardes de dfas hábiles.21 • . x- 3.0169 3.2 clientes cada ' minutos.0111 Pix • 9IA • 3.21•<3.0013 3.69% del tiempo. 11.2) • (3. ¿Cu61 es la probabilidad de obtener exactamente 10 clientes durante un intervalo de 8 minutos? 5. cada valor x se determina hasta que los valores están tan lejos de >..160 ESTADISTICA EN LO~ 1-"EGOOOS el promedio durante un intervalo de 4 minutos.l HI S! 120 Si un banco promedia 3.2) • (3. 111A 121 Pix • 13IA P(x > 7) 13·21311'"3 21 • .. 3.0004 Pix. los intervalos deben ser iguales para usar>.2) • (3.8 >. 3. 10. •.2 clientes cada 4 minutos. Las probabilidades exactas se suman entonces para encontrar x > 7 Pix • 8IA • 3.2 clientes/' minutos 10 clientes/8 minutos Este e1emplo es diferente de los primeros dos ejemplos de Poisson en que los mtervalos para lambda la muestra son diferentes.. la solución requiere obtener los valores de x • 8.2) • 13·2'ºHe 101 a .7 Al azar llegan clientes a un banco en tardes de día hábil a un promedio de 3. PROBLEMA DE DEMOSTRACIÓN Un banco tiene un porcentaje promedio de llegadas aleatorias de 3.3. 13.14.54)(.2 chentetl' minutos x > 7 clientes/' minutos En teoría.0040 81 91 Pix a 3 21 10jA • 3.1141.0001 Pix .2) • (335. 12.0408) "". 9. cuando minut~C5 de largo pluo ha sido de 3. 18 minutos (6. PROBLEMA DE DEMOSTRACIÓN 5. 1. .9 Si una oficina de bienes rafees vende 1.CAPfTULO S 01Sl1UBUCIOSES Dl'iCRETAS 161 fórmula de probabilidad.0011 8 9 . Una vez ajustada lambda para un intervalo de 8 minutos.6.4 clientes cada 8 minutos Si xfuera para un intervalo de 2 minutos. h611ense las probabilidades de x • 6.6 casas/dfa Plx 41 >.18 minutos x 10 clientes. debe ajustarse a un intervalo de 8 minutos. x •a. la probabilidad para cuatro lugares decimales es cero. el valor da lambda se reducirla de 3. No existe garantfa de cómo tos 10 clientes se distribuyan en el intervalo de 8 minutos. la misma. La tabla A. La tabla 5.10 da tas probabilidades para >. ••• x • 1.tlquiera que sea la naturaleu del intervalo asociado con una lambda.iva Para determinar P(x> 5).19% de los dlas. la compal'lfa no venderia ca.0551. debe promediar el doble.10 se detiene cuando indica un valor x de cero en cuatro lugares decimales A con:r nuación veamos la respuesta para x > 5. x • 9.6 casas por dla. Siempre ajuste el valor de lambda. si tas ventas son distribuciones de Poisson con>. de modo que >. más de cinco casas. sólo 5. x. en x • 9.2 clientes cada 4 minutos. contiene las distribuciones de Poi»son para valores seleccionados de lambda.6 casas vendidas por día.2 a 1.6 casas en un dla h6bil promedio y las ventas de casas en dias h6biles son distribuciones de Poisson. sin embargo. . la distribución de Poisson para una lambda en particular e. y xtengan el mismo intervalo. Nunca ajuste ni cambie xen un problema. La columna izquierda contiene los valores renglón x 4 da ta probabilidad .0060 . El renglón 1 de la tabla 5. Lógicamente. Et X Prol>M>lllded 6 .1.20191. si el banco promedia 3. la solución es: >. Si una empresa de bienes rafees ha estado promediando 1. x • 7. y la tabla 5.0000 .10 pre· senta una parte de la tabla A. La tabla 5.6 clientes por intervalo de 2 minutos. Sólo porque 10 clientes lleguen en un Intervalo de 8 minutos no significa que habría necesariamente cinco clientes en un intervalo de cuatro minutos. Cu. Esto es.10 muestra la probabilidad da no vender casas en un dfa (0. El intervalo para xes 8 minutos. ¿cu61 es la probabilidad de vender exactamente cuatro casas en un dla? ¿Cuál es la probabilidad de no vender casas en un dfa? ¿Cu61 es la probabilidad de vender más de cinco casas en un dfa? ¿Cuál es ta probabilidad de vender 10 o más casas en un dla? ¿Cu61 es ta probabilidad de vender exactamente cuatro casas en dos dias? Soludón >.•0528 Uso de las tablas de Poisson Todo valor de lambda determma una distribución de Poisson diferente.1.51% de los dfas vendería exactamente cuatro casas y todavía mantendría el valor lambda.10 no es acumitr. Las probabilidades se muestran en la tabla por cada valor x asociado con una lambda dada si la probabilidad tiene un valor diferente de cero a cuatro lugares decimales.0047 7 .4l'ºe 101 ª' .4 clientes. El mlltodo erróneo para este dilema es igualar los intervalos al cambiar el valor de x.3 que contiene las probabilidades de x s 9 si lambda es 1. Aptndice A. en 20.6.3. 6.• 1.0002 x>5• . La forma correcta de abordar este dilema es ajustar el intervalo para lambda de modo que>. o sea 6.61w1 la tabla 5. 5.. Paraµ = >.55. 3.5 y O' = 2. si >.. Los números resultantes de x sucesos en 20 muestras aleatorias diferentes de um distribución de Poisson con >.6 deberla incluir al menos 75% de todos los valores.5 podría ser como sigue: 6 9 7 4 8 7 6 6 10 6 5 5 8 4 5 8 5 4 9 10 El cálculo del número medio de sucesos de este grupo de 20 intervalos da 6. 6. probabilidad es 0."1 b distribución de valoro para >..6 • o . Nótese que >.. Raras veces se presentan sucesos de 1.75 de los valores. la figura 5.1781 . Es el promedio a largo plazic de sucesos para un intervalo si se toman muchas muestras aleatorias. el rango de 1.55. se presenur varios 5 y 6. Apéndice A. 8 teorema de Chebyshev expresa que al menos 1 . Con una medía de 1.0000 • 1378 .r para una distribución de Poisson con >.4 a 11. Para investigadores que deseen usr valores de lambda con más precisión. 75% de los valores deberían estar dentro del rango de 6. Lambda por lo general no es un número entero. • 1. • 6.3: ..5 :t 2(2.3 debe usarse para resolve· este problema.5. La respuestase encuentra al buscar>. la probabilidad de x <!:: 10 es esencialmente0. la varianza de una distribución de Poisson también es >. • 6.0551 6 . ¿Cuál es la probabilidac de vender exactamente cuatro casas en dos días? En este caso. de modo que debe hacera un ajuste:una lambda de 1.6.. como son las probabilidades de valores grandes de x. los paquetes de software de estadística son una opción atractiva. el intervalo se ht cambiado de un dfa a dos dlas.6 para un dla se convierteen una lambda de 3. la desviación estándar es \/X. En teoría.2514 '5 .. o que tengan la impresión que la computadora es mas conveni que cuadro· de libro) de texto. De las muestras. sin embar go. de modo que casi siempre observar sucesos lambda en 1o. Tabla de Poisson para ). = 6. las tablas de Poisson estan limitadas por la canti de espacio disponible. Media y desviación estándar de una distribución de Poisson El valor medio o esperado de una distribución de Poisson es>.0047 7 . 2. 1. cuando>.10 ya no aplica.10 . se pueden usar para graficar una distribución de Poisson.0002 9 .55) = 6. Esto es.. son más rápt. . 11.5. 3. Considere.« valores x están en el eje x y las probabilidades sobre el eje y.3 es una gnifica M INITAB pL. = 6.ble rango de x de cero al infinito. das de usar que la fórmula de Poisson: no obstante. . 81! prácticamente imposible vender 10 o más casas en un dia.6. • 6.0000. • 6. 4. los valores obviamente se van a "apilar" en O y 1.162 ESTADISTICA EN LOS SEGOCIOS TABLA 5. = 6. 7 y 8. la grtfic:~ revela una distribución de Poisson sesgada a la derecha. para muestreo infinito el promedio a largo plazo es 6. la combinación de la desviación estándar con el teorema de Chebyshev indica la dispersión de una distribución de Poisson..5 :t 5. es 6. Gráficas de distribuciones de Poisson Lu> vaiores de la tabla A.2019 1 . si la of.13. nótese que cuando>.2 para dOll dias. Uso de computadora para generar distribuciones de Poisson El uso de la fórmula de Poisson para calcular probabilidades puede ser tedioso cuando uno trabaja preblernas con probabilidades acumulativas.4. intervalo es imposible..3.0011 8 .l//c2 valores están dentro de le desviaciones estánda: de la media.. 12. ••. la varianza también es 6.5 muestra que en realidad 100% de valores están dentro de este rango. las tablas de Poisson de la tabla A.1. Por ejemplo. El intervaloµ :t 20' contiene al menos 1 . suponga >.3 sólo incluye valores de probabilidad para distribuciones de Po· con valores lambda a los lugares de décimas en casi todos los caso).3.2 y x • ' en la tabla A.6 casas vendidas por dfa.(12/2) • . es decir. l.5/intervalo para algún fenómeno con distribución dt Poísson.. Lambda es para un día. la gráfica tiene menos porque la probabilidad de suceso de valores cercanos a cero es pequeña.5. La tabla 5. Por ejemplo..5 en la figura 5.0176 ¿Cuál es la probabilidadde vender 10 o más casas en un dia? Como indica la tabla en x 9.32'0 2 3 . la grtfica ~fl!'IITAB de la distribución de Poisson para >.6 y un posa. y la tabla A. 6. cina de bienes raíces ha estado promediando sólo 1.5. Comprender la media de una distribución de Poisson da sentido para los sucesos reales que es probable que ocurraa.5 y la desviación estándar es 2. Un examen de los 20 valores generados al aza. de modo que la tabla A. Apéndice A. bs probabilidades son máximas para los valores de 5. 6 O. Por tJelllplo...en.... ~ meDllr pequeftol. • 6..02..os ~o: 1 Gr•flCI MINITAB de la distribución de Poisaon para l. lambda es 1. clemans en pilta con poco o ninpa 100 mil es poc:o c:am6lt y puede....12 muesua la.. US Airways CIOD O.. pero un adinero awdenlr 1t eubew. probabilidado produd~ por Exul para ti problema de bienes ralees del problema de demostracién 5.. el promedio subió 1 0..la piobebilidld • peujmll _.... IÍ 100 mi pmljaul de...-n (1.08'3~ •• - En un do ndente.. de~ hui Clpftlldo Qinriaealll cm 1.it~ potmcialcs para usar la <fuanbución de Poisson.. la.. NonlMal MI> el D6mao promedio nW antes.1.. Lo~ problema$ binomiales con grandes ~~ muestrales y pequeños valores de p. llpida por Alub Airlincs cb 11111... Ea esu cmo...1.9 usando una lambda de 1..Glqaejal (Jln-so..54._._en el U. 0-66 En aftol lipimla.. e1 Dqatmwl ol'lblllportlDon... promedio IÚI beJO de 7.74.. ¿Qué aspecto tiene la distribución de probabilidad de Poisson para esta lambda? La tabla 5.IS 0. aproximación es suficientemente cercana para usar la dutribución de Poisson para problemas binomiales. En Ndenta. P'oilloD.el . si n > 20 y n • p s 7.. Por ejemplo.A... SouthlllllMrlm e1--....9 por ano.... un estudio realizado por el 'ational Center for Health Stati.9 enfermedades o ksiones agu<bi por afto.1... Cálculo de problemas binomiales por la distribución de Poisson Cierto) tipo de problemas de dumbuc:ión binorru.16 . Laa queju induJm demoru en lol YUC1o1..........) ! J o. Si esto casos son distribuciones de Poisson. Dlba Ü LiDa cm 0.o o 1 ' 1 s 1 • • o s 10 . Dtpuuneat ol TruuporUlioa poddl calaallne CllllDO promedio de qurju por 100 mil paajm)s de abonlo .. La tabla 5. en promedio.. .0713 . Exul puede también generar probabilidades de dif~tcs valores de X para cualquier di>tribución de PoÍ>50n. • -.a y el iDllerwlo es 100 mi .-... 100 mi . l aepiaeala el nllmero promedio oo ttduádo debido a vuelol cm mú pu11e.llde1990.1 o..S.11 contiene la wida MINITAB para esta distribución.. llcb rcm.... Gráfica MINITAB de la distribución de Poisson para>..de .. . G. que.pu el DeplrtmeDt ol'lnlllpor· ¡¡..25... .Ñ •npltmmte eoartm y lOpClltlD.. Cl.. .. un estadounidense time 1. FIGURA 5... Deputmaaol de .ti~ indica que..J se pueden calcular con el U$O de la distribucién de Poisson.mis grmdo mucha m6I m.5 0. .. puege qae el ndmero mi de quqAS por pept cxtRYi8do.U...-. La mayorta de awiadofta -1 .O S DlSTIUllUOO!'-'ES DISCRETAS 163 •Hf'..CAP1nll. C11111 0.aperimcm en vuelo O IÓlo IOD U naidolol. Como ttgla práctica.¡111H·Ii1.10 0.4 .¡•~----------------MIObneu Quejas ..111epad8ClllcmUI qilljaapor IOOmil ~ Debido 1 qae .!f''ii'!111... No es duo li lol ~ estú en ralidad maM» llmdeque. boldo fUcrlD .11:i... son candid.ailflorida por el semao 8áeo qur nunca de &lados Uaidol. ..¡1... lol . al TílülpOltllim. welos cm amo de~.una diltrlbudón de mviao a bordo.de lDll añceer...6..oa de a bordo. tltl de ellol pia:allllD .-).._dio IOll rcbtl\~ rausi«bol por .. que entonces gmeran eventos poco comuoes.. vuelol ance...r 1m pltltDUdo MIN"ITAB producirá una <fulribudón de Poisson para prkticarnmte cualquier valor de lambda.111e111 .os . del acmpo CDdlmallle bel bubW~ por 100 mi cm 0..79.... . • 11cWc.. DmllO de 111 10 aaai.. -..-.. este problema es un candidato para la aproximación de Poisson.97)46 • . A continuación veamos una gráfica MINITAB para esta distribución binomial. resolver el problema con la fórmula binomial da los siguientes resultados: soC4(. el siguiente problema de distribución binomial se puede resolver con el uso de la dis tribución de Poisson: n = 50 y p .11 TABLA 5.. de la distribución de Poisson. de hecho.1411 O. el procedimiento se inicia con el calculo de la media de la distribución binomial.03) = l. Como ejemplo.3 a.¡e. Debido a que n es el valor esperado de la binomial.. A. se traduce al valor esperado. por lo cual imposibilitan el uso de técnicas de cálculo binomial.0471 para la aproximación de Poisson.. .9 Salida Excel para la distribución de Poisson A 1.~ .µ • n · p. El uso de la distribución de Poisson como aproximación a tal problema binomial en tales casos es una alternativa atractiva.Jtq 0.¡¡ e 0. Parx • 4. .3 da una probabilidad de . 'pr¡f 1'K'Y1di ·~ • l'(Z • .3 -e "ª. o. U= µ como el valor A y usar el valor x del problema binomial permite el calculo de la probabilidad a par· tir de un cuadro de Poisson o por la fórmula de Poisson.o o 1 1 1 3456789 Valon:sX 1 1 1 .03) =? Para resolver esta ecuación. puede ser la única alternativa..S Cuando n > 20 y n · p :S 7. Grandes valores den y pequeños valores de p suelen no incluirse en cuadros de distribución binomial.111• Si se satisfacen estas condiciones y el problema binomial es un candidato para este proceso.12 Salida MINITAB para la distribución de Poisson A• 1.164 ESTADISTICA EN LOS l'o'LGOOOS TABLA 5. t.03. ...0012 respecto al resultado obtenido al usar la fórmula binomial para resolver el problema.03)4(. P(x = 4ln = ~ y p = .a 0.0456 La aproximación de Poisson tiene una diferencia de 0.__. la tabla A. 0. ¿Cuál es la probabilidad de que x = 4? Esto es. primero determine lambda: = A=µ= n · p= (50)(.6 . . En comparación cor esto.2 ::. cuando no se dispone de una computadora. . la aproximación de Poisson est6 cercana lo suficiente para analizar x » 6.9) c. 9.S DISCRETAS 165 Con~ • 1. • 4.0003)7(. P(x • 21>.2 ~ 0.o o 1 • 1 s 1 1 1 1 6 7 11 9 Valora X Al comparar las dos gr. • 3. P(x s 31>.0003. este proceso no es pr6ctico y hace de la aproximación de Poisson una alternativa atractiva.5.0081 .3) b. es dificil distinguir entre la distribución binomial y la distribución de Poisson debido a que es cercana la aproximación de la distribución binomial por la distribución de Poisson. P(x • OI>. Si se auditan 10 mil depósitos In). . 10.) o.9997)9913 Este proceso continuarla para valores x de 8. P(x • ll>. hasta que las probabilidades se aproximen a cero. .CAPITVlO 5 Dl.3 t 0.SiRIBUOO~"E.0001 033!> Para resolver este problema con el uso de la fórmula binomial es necesario empezar con"• 7.30 X Probeblllded .0027 .0003) • 3.4) L (..10 Suponga que la probabilidad de que un banco cometa un error al procesar un depó11to es .3 da las siguientes probabilidades. lS Encuentre los siguientes valores con el uso de la fórmula de Poisson. P(4 <X< SI>.lficas. 11. 5. ).> 20 y n · p"" 7.0218 7 8 .ifia Ml~ITAB para esia dis1ribución de Poísson.0002 9 10 11 12 x>8 .0008 .3 PROBLEMAS *' • 5. ¿cu61 es la probabilidad de que se cometan mb de seis erro· res al procesar depósitos? Soluclón ~ µ • n · p • 110 000)(.• 5.•.0 Debido a que n .- 4. 0.7) e. 10 ooo~l. PIOBLEMA DE BEMOSTRACIÓN 5.4) . La tabla A. P(x • 2. puede generarse la distribucién de Poisson. Veamos en ~ui<U una gr..1) d. • 2. Obviamente. ¡Q porcentaje del tiempo tendrá que estar abierta una segunda ventanilla? d. P(x = OIA = b. Una vez reunida información.19 La gerente de un restaurante está interesada en tomar un método más estad1stico para pron car la carga de clientes.m.166 ESTADISTICAEN LOS NEGOCIOS 5.9 d. A= 8. Calcule la media y desviación esta= dar para cada distribución. Localice la media en la gráfica. A= 0.9) P(x s 6IA = 2. ¿Qué valor de lambda encontró ella? Su que estos clientes llegan al azar y que las llegadas son distribuciones de Poisson. el First National Bank tiene abierta sólo una ventanilla de cajera parad tos y retiros.2) 1. se abre una segunda ventanilla. Ella inicia el proceso con una recopilación de datos. de un sábado por la n Número de llegadas Semana 1 3 6 4 6 2 3 1 5 l o 3 3 Semanal Semana3 2 4 3 5 3 5 4 7 3 4 8 1 3 o 2 6 4 2 5 3 4 .17 = 2. ¿Cuál es la probabilidad de que exactamente tres personas lleguen al banco durante un de 2 minutos la mañana de lunes para hacer un depósito o retiro? ¿Cuál es la probabilidad que cinco o más clientes lleguen durante un periodo de 8 minutos? 5. A= 1. ¿Cuál es la probabilidad de que una mañana de lunes lleguen exactamente seis clientes en intervalo de 4 minutos? b.18 Los lunes por la mañana. Suponga que una cajera puede atender a no más de cuatro clientes en cualquier intervalo 4 minutos en esta ventanilla en un lunes por la mañana. Estas llegadas aleatorias a este banco los lunes por la mañana están distribuidas por Po· a. ¿Cuál es la probabilidad de que no llegue ningún cliente a hacer depósito o retiro durante intervalo de 4 minutos? c. P(S 5. a.7) Trace las gráficas de las siguientes distribuciones de Poisson.9) f.8. Observe la forma en que las probab lidades se grafican alrededor de la media.8) c.m. Use el valer lambda calculada por la gerente y ayúdela a calcular las probabilidades de las partes (a) a la para cualquier intervalo dado de 5 minutos entre las 7 p. A= 6.3 c. P(x e. a 8 p. la cajera no pueda satisfacer Ja deman ¿Cuál es la probabilidad de que la cajera pueda satisfacer la demanda? Cuando la demanda pueda ser satisfecha durante cualquier intervalo dado. A continuación aparecen los datos. la gerente calcula lambda con los datos de las tres semanas como un conjunte datos como base para el análisis de probabilidad. P(3 > 7IA s Xs d. La experiencia ha demostrado que el número promedio de clientes que llegan en un inR:I' valo de 4 minutos los lunes por la mañana es 2. todos los dos por la noche durante tres semanas.m. ¿Cuál es la probabilidad de q: durante cualquier intervalo dado de 4 minutos.3 b. 9IA = 4. P(x = 6IA = 3. y cada cajera puede atender con eficiencia más de número.6 5.m.16 Encuentre los siguientes valores con el uso de las tablas de Poisson del Apéndice A.9) <X s 8IA = 5. y las 8 p. Uno de los empl de recepción del hotel se asigna a contar clientes cada 5 minutos de 7 p. a. ¿Cuál es la probabilidad de que exactamente ocho clientes lleguen en cualquier intervalo de 15 minutos? 5. El número de defectos por caja es una distribución de Poiss. ¿La familia hizo dos o más viajes a parques de diversiones el año pasado? d. ¿Cuál es la probabilidad de que una caja contenga más de tres plumas defectuosas? 5. Suponga que la distribución del número de días que exceden los estándares por periodo de tres semanas es una distribución de Poisson.2 plumas defectuosas por caia producida (200 plumas).cuál es la probabilidad de que siete o más personas tengan esa rara enfermedad de la sangre? ¿Cuál es la probabilidad de que más de 10 personas tengan esa enfermedad? Suponga que el investigador obtiene más de 10 personas que tengan esa rara enfermedad en la muestra de 100 mil pero que la muestra fue tornada de una región geográfica particular.21 El número promedio de viajes anuales por familia a parques de diversión en Estados Unidos es una distribución de Poisson.20 De acuerdo con el United National Environmental Program y la World Health Organization. ¿qué podria concluirse? 5. ¿Qué podría concluir el investigador de los resultados? . ¿Cuál es la probabilidad de que el estándar sea excedido exactamente 6 días de un periodo de tres semanas? c. Suponga que el número de colisiones son distribuciones de Poisson. ¿Cuál es la probabilidad de encontrar ocho o más plumas defectuosas en una e. ¿Cuál es la probabilidad de que seis o más clientes lleguen durante cualquier intervalo dado de 5 minutos? c.2 colisiones cada cuatro meses. a. India. ¿La familia hizo exactamente un viaje a un parque de diversiones el año pasado? c.6 días en cada periodo de tres semanas. a. ¿Cuál es la probabilidad de que ocurran exactamente dos colisiones en un periodo de dos meses? c. con una media de 1 .6 viajes por año.5 Dl:>CaETAS 167 a. Si el investigador selecciona al azar 100 mil personas de la población. ¿Cuál es la probabilidad de que ocurra una o menos colisiones en un periodo de seis meses? Si ocurre este resultado. ¿Cuál es la probabilidad de que no ocurran colisiones en un periodo de cuatro meses? b. .CAPITULO S DISTRIBUOO:\'E. en Bombay.ja) c. Suponga que un comprador de estas plumas deja de comprarle a esta compañía si una caja contiene más de tres plumas defectuosas. ¿Cuál es la probabilidad de seleccionar al azar una familia estadounidense y encontrar lo siguiente: a.22 Las colisiones en el canal de navegación de Houston son raras.24 Un investigador médico estima que .00004 de la población padece de una rara enfermedad de b sangre. La familia no hizo un viaje a un parque de diversiones el año pasado? b. con una media de 0. ¿Cuál es la probabilidad de que el estándar no sea excedido en ningún día durante un periodo de tres semanas? b. los estándares de contaminación del aire por rnacropartículas han sido excedidos un promedio de 5. ¿qué podría concluirse acerca de las condiciones del canal de navegación durante este periodo? ¿Qué podría concluirse acerca del conocimiento de seguridad del canal durante este periodo? ¿Qué podria concluirse acerca de las condiciones del clima durante este periodo? ¿Qué podría concluir el estudiante acerca de lambda? 5.23 Una compañía fabricante de plumas para escritura promedia 1. ¿Cuál es la probabilidad de que entre tres y seis (inclusive) clientes lleguen en cualquier intervalo de 10 minutos? e. ¿Cuál es la probabilidad de que durante un intervalo de JO minutos lleguen menos de cuatro dientes? d. ¿La familia hizo exactamente cuatro viajes a parques de diversiones durante un periodo de seis años? 5. ¿La familia hizo tres o menos viajes a parques de diversiones en un periodo de tres años? e. ¿Cuál es la probabilidad minutos? de que no lleguen dientes durante cualquier intervalo dado de 5 b. ¿Cuál es la probabilidad de que el estándar sea excedido 15 o más días durante un periodo de tres semanas? Si este resultado ocurre en realidad. a. ¿Cuál es la probabilidad de seleccionar una caja y no encontrar plumas defectuosa>? b.n. 25 Una empresa de regístro contiene gran cantidad de datos.5 DISTRIBUCIÓN HIPERGEOMÉTRICA Otra distribucién ntadísuca discreta o la distribución hipergeométrica. Entonces. binomiale sin restitucién. ¿Cu. . la distribucién binomial 'C puede . ¿Cuál es la probabilidad de que menos de cuatro no con ulte al médico! c. • El muestreo se hace in resutucién. el 111. ¿úúl n la probabilidad de que exactamente cinco no consulte al médico? b. En otrb palabras. posi resuhadoc éxito o fracase: pero el usuario debe: conocer el tamaño de la población y la proporción txllO> y frac:uos en la población para apli<•r la distribución hipergeométrica. Históricamente •• 9% de las pa¡: de datos rcgimadoa por la compar\1a contienen errores. Si al azar se seleccionan 200 paginas datos. Aun cuando la dístnbucién mlal teóricamente aplica sólo cuando se hace muestreo con restitución y p permanece constante. • La población. ¿cu. en ría. ¿cu!I o la probabilidad de que menos de 5 páginu contengan errores! 5. a.A y n. Considere una muestra en la que 300 personas ~ selecci al aur y que se han fracturado o dislocado un hueso. consta de do. la multitud de posibles combinadonn de oto> tre parámetros.i.-estigador que seleccione la di~tribución hi métrica para analizar datos debe: usar la fórmula para calcular cada probabilidad. La distribución hipergeornétrica tiene las siguientes caracterisricas: • fa una dimibución discreta.tral. la informa' acerca de la compo kión de: la poblac:ión debe ccnecer-e para volver a determinar la probabilidad un hito en cada mtenro sucesivo a medida que cambia la probabilidad. en Ja población.5.i> de 1 O p. J\.lgina contenga errorc ? d.l es el número esperado de personas que no venan al médico! 5. d1Stribucizn bipergeométrica aplica sólo en experimento que intentan hacerlo sin resutucién.26 Un aho porcentaje de personas que se fracturan o dislocan un hueso consultan un m Suponga que el porcentaje es 99%. lo expertos en e tadl•ll veces usan la distribución hípergeomérríca para complementar los tipo de an.il o la probabilidad de que ninguna p. a. La distribución hipergeométrica.iginh contengan errores! c.cuál es la probabilidad de que m. FORMUU.ilisis que <e pu hacer con el uso de: la distribución binomial Recordemos que la distribución binomial aplica. d a que la distribución hípergeometrica se 11$3 cuando el muestreo se hace •in restitución. es finita y conocida. HlPfRGEOMtTIUCA donde . '>C' conoce. • El numero de éxito. en la población x = número de éxito en la muestra: el muestreo '>C' hace sin restitución Una dh1ribuaón hipergeométnca ~tá caracterizada o descrita por tres parámetros: N. Por unto. • Cada resultado consta de un éxito o un fracaso. solo a experimentos en los que lo intente se hacen con restitución (evento independientes). la mayona de investigadores Usan la di tribucién hipergeométrica recurso cuando trabajan con problema. N. sí la población es uficiememente grande en comparación con el tamaño mue. ¿cuál o la probabilidad de que seis o mas paginu contengan errores! b. al igual que la distribución binomial.\' • tamaño de la población n • tamaño muesrral J\ • numero de éxito. Como este t puede 5C1' tedioso )' lento. crear cuadros para la distribución h geométrica es pnlct1camentc imposible. impacto de muestrear sin restitución en p o minimo. r demos que. do: lo. v el tamaño muestra! es 16 6% de la población.\' • 5/24 • 0.lela. Existen 56 formas de obrener tres mujeres de un grupo de ocho y 120 form~ de obtener do> hombre.4853 + 12C1 tCo 1aC3 2696 • •• 9755 .\' . consídere el siguiente problema. que es mayor al 5% de la población (ni. Si al u. X•l X•2 ~+~+ 1aC3 . hay 42 S<M formas de seleccionar cinco personas do: 24 pcr. la> formas posibles de obtener n muestra. A• 12 y x 2:: 1 Este problema es en realidad tres problemas en uno: X X X 1 2 3 El muestreo se realiza sin restitución. Si se seleccionan al azar tres de estas compañías de la lista.CAPliUUl 5 DL~TRIBUCIOXE\ DISCRETAS 169 en algunas situaciones cuando el muestreo SC' hace >in restuución. El muestreo se: reafüa sin r<~titudón. 2.abilidad ex.La probabilidad de obtener x • J muieres en la muestra de 11 • 5 es aC.o11a>.u .\'.jguientC'S condiciones: l.x fracaso. la combinación en el denominador de la fórmula hipcrgcomctrica da toda.x fra~ se calcula. incluyendo aquella> con resuhado desea • do. En resumen. n ~ 5%N. ¿cuál es la probabilidad de que una o más de las compal'lias seleecionadas estén ubicadas en Silicon Valley7 Solución N • 18. de 24. Como aplicación de la dimibución hipergeométrica. • 1~C2 • (56) 120) -= _1581• 42 5(M 24Cs Conceptualmente. Como regla pnktica. A éxito' di~ponibles )' n . este problema es un candidato pare la distribución hipergeométríca Veamos la solución. Se toma una muestra de cinco ~licitante>. o n = 5.o• disponibles de la población. la distribución hipcrgcométrica debería usarse: en Jugar de la dístribucién binomial cuando cst~n presentes l.A • 24 .A íraca. ¿cuál e> la probabilidad de que exactamente tres de los muestreados sean muiere>? Este problema contiene una población pequeña. forma.11 Suponga que 18 imponantes compal'lias fabricantes de computadoras operan en Estados Unidos y que 12 están ubicadas en Silicon Valley de California. el uso de la distribución binomial en lugar de la dístribucién hipergeornétrica C'S aceptable cuando el muestreo se hace sin mutución. El numerador de la fórmula hipcrgcométrica calcula todas lai.21 ). . Veinticuatro personas. y la distribución binomial da una buena aproximacién de la probabilidad en esta• suuacíones. Debido a lo~ cuadros existentes es preferible el uso de la dístnbucién binomial en lugar de la distribución hipcr¡:comctrka -iempre que ~ posible. solicitan un traNjo.u se seleccionan cinco de lo. po-ibles de obtener x éxitos de lo.2206 1aC3 + . La distribución hipergeométrica e> la apro· piada para usarse. solí· citantes. o 5C3 11 = 24. El tamal'lo mu<~tral e> 21% de: la población. n • 3. La \Ubdivísión de la población es A • 8 mujeres (éx11os) )' n .8 • 16 hombres. la> combinaciones de cada una se multiplican en ti numerador porque la probabilidad conjunta de obrener x hitos y además n . si el tamai\o muestral e> menor a 5% de la población. de una población • . PROBLEMA DE DEMOSTRACIÓN 5. En este problema. finita. Las probabilidades hipergeométricas SC' calculan bajo )¡ suposición de un muestreo igualmente probable de demento> restante del espacio maestral. La distribución blpergeométrica da la prob. porque los cinco -olicnames seleccienados para la muestra son cinco personas diferentes. ocho de las cuales son muieres. de un grupo de 16. Por tanto. El muestreo se hace sin restitución. il es la probabilidad de que las seis compañías sean de propiedad privada? d. A = 5 y n = 6 c. n • 3. La sali<U Excel para este mis problema se presenta en la tabla 5. Ambo) paquetes de software requieren de la entrada de N. A = 2 y n = 3 d.0245 . a.P{x • OIN • 18.O si N = 9.4 PROBLEMAS 5. En cualquiera de los dol paquetes. La sali<U MINIT para el ejemplo presentado en esta sección.tado del Estado Prh'llcb Pnvacb Privacb cid Estado Privada Privacb Privada del Estado .28 A continuación se muestran las principales 19 compañías en el mundo en términos de capacicb! de refinación de petróleo.h/Shell BPAmoco Totiliin¡tlf Pñrólcos de \'ennuela Sinopec SaudiAnm<o China P'1rochemical ~tróleo Bmildro ~tróleo1 Mw<¡n°' National lraniam Oil Texaco Chevron Rtp10l·YPF Kuwait Petroleum Agip Petrolí Nippon Miuubi>hi Oil Marathon Mhland P'1ro Pnumina Privada Privada Privada Privada dd Estado Privacb del Estado del Estado cid ütado dd E. ¿Cuál es la probabilidad de que ninguna de las compañlas sea de propiedad privada] CompaJ\11 Estatus de propiedad Euon~1obil Ron! Dut. c. ¿Cuál o la probabilidad de que exactamente una compañia sea de propiedad priva<U? b. la salida resultante es la probabilidad exacta para ti valor particular de x. La probabilidad de x < 2 si N = 15. donde n • 24 ~™>nu de lu cuales A • 8 son muitM n • 5 se seleccionan al azar.e.il e) la probabilidad de que exactamente cuatro compañlu sean de propiedad priva<U.13. La probabilidad de x . 1- nCo . A • 8 y n = 4 b. 1.170 ESTADISTICA EN LOS SEGOClOS Un método alternativo de solución que usa la ley de complementos sería 1 (uno) menos probabilidad de que ninguna de las compafllas Htuviera situada en Silicon Valley.27 Calcule las siguientes probabilidades con el uso de la fórmula hipergeométrica. ¿Cu. 5. ¿Cu. Suponga que al azar se seleccionan seis compañías. La probabilidad de x > 4 si N 20. Algunas de las compañias son de propiedad privada y otras ~o gobiernos. n y x. A. o sea 1 . se ve en la tabla 5. A• 121 Por tanto. y x • 3 son mujeres. La probabilidad de x 3 si N = 11..14.9755 18~ Uso de la computadorapara resolver probabilidades de distribución hipergeométrica Con MINITAB o Excel e) posible resolver probabilidades de dístribucién hipergeométrica en la comp tadora .. A 5 y n = 7 = = = S. a.. CA 80000 4 Atlanta. Este experimento requiere que un partid· pante tome la bolsa y al azar seleccione cinco cuentas sin restitución. Penney. lL 6 7 Washington. !\'Y Da!W.31 A continuación aparecen las principales 10 ciudades de Estad~ Unidos clasificadas por número de cuartos de hotel (información compilada por Smilh Travel Researeh). DeU Competer es la número uno. Edwards Deming. pua promoción lubi. Once de 1o$ 1 son de origen hispano. ¿Clúl es la probabilidad de que exactamente tres de las ciudades tenga m~ de 70 mil cua. Una o men~ computadoras defectuosas S.ay y J. en su experimento de cuentas rojas. tenía una caja de cuatro mil cuentas.30 W. ¿Clúl es la probabilidad de que el participante seleccione todas las cuentas rojas? S.ssi"ippi' c. L ¿Clúl es la probabilidad de que el panicipante seleccione exactamente cuatro cuentas blancas? b. Dos o más computadoras defectuosas d.GA 73 100 S. TX San Diego.a b. ¿Clúl es la probabilidad de que las cuatro empresas estén en algun tipo de negocio rdacionado con computadoras? c.ocho est~n en algún upo de negocio rdacionado con eomputadoras. Suponga que al azar se seleccionan cuatro empresas. ella tiene una boba de 10 cuentas. Si los oficiales escogido. En su experimento. Suponga que sólo cinco de I~ oficiales son escogidos para promoción y que uno es de origen hispano. La companla que compra las computadoras hará pruebas minllomas a tres de las computadoras y puede detectar el alambrado defectuoso. OC ll:ueva York. Fl 92 200 3 LM Ángdes·Long Bach. de las cuales cuatro eran rojas y 16 blancas. L ¿Clúl es la probabilidad de que exactamente dos ciudades estén en California? b. L ¿Clúl es la probabilidad de que ninguna de las empresas esté en algún tipo de negocio rela · cionado con computadoras? b. NdnMro Ciuclacl NdnMro de CUU10S ta. ¿cuál es la probabilidad de que uno o ~ de b cinco o6ciales promovido. CA 8 9 10 Anaheim-Sanu Ana. \'eg¡u.C.CAPm11.32 Una compallla produce y envía 16 computadoras personales sabiendo que cuatro de ellas timen alambrado defectuoso.an sido sde-cdonados sólo al azar. hubiera sido de origen hispano? ¿Qu~ podría indicar este resultado? ."tOS? S. ¿Úúl es la probabilidad de que ninguna de las ciudades esté al este del río Mí. NV 106100 2 Orlando. CA 71 000 68 700 66600 48 500 47 200 44 600 Suponga que al azar se selecdonan cuatro de estas ciudades. ¿Cuál es la proNbWcbd de que la compallfa compradora encuentre lo siguiente? L Ninguna computadora defectuo.· Suponga que una investigadora va 1realizar una versión modificada del experimento de la cuenta roja. Exactamente tres computadoras defectuosas c. seguida por Gatew.0S DISTlUBUOO~~DISCRETAS 171 La publicación Oira/og Agt contiene una lista de las principales 17 empresas de ütados Unidos por ventas anuales por caúlogo.29 s Chicago.33 Una ciudad del oeste tiene 18 oficiales de policía elegibles pira promoción. de las cuales 800 eran rojas y 3 200 blancas. ¿Clúl es la probabilidad de que exactamente dos estén en negocio no relacionado con computadoras? S. ¿Clúl es la probabilidad de que el participante seleccione exactamente cuatro cuentas rojas? c. De las 17 empresas de la lisu. en promedio. El valor de n es 25 es .75. De igual modo. Uno esperaría que 20 de las 25 perso seleccionadas consideran que el banco es su institución financiera principal. La probabilidad de obteoe menos de tres dientes en un intervalo de 4 minutos es . Suponga que un estudio local de 32 consumidores de banco> revela que 26 piensan que e> ~ usar cajeros automáticos. significa que sólo alrededor de: 8. 18 o más dirán que su banco e> su institución financiera principal si en verdad 8~ todo> los consumidores financieros asi lo piensan. en la muestra de 7. La probabilidad que 1 mas considere que su banco es su institución principal se puede obtener al sumar valores de x de 1 25 en la tabla A. La probabilidad de que más de cinco cliente. La probabilidad. tución primaria y se seleccionan al azar 15 consumidores financieros. obstante. emonces es probable que preguntas de probabilidad acerca de llegadas específicas de cliente. Si se emplea un intervalo de 4 minutos.80. 8 frecuente que lo> problema> de llegadas aleatoria> sean descritos por Ja distribución de Pois Si. 80''0 de todos lo> consumidores financiero> considera qtx su banco es su institución financiera principal..N= 32.. y n • 5 X o. las probabilidades para los valores x alrededor de e:.65) • 9. En esta población.75 consumidores financieros de 15 que están muy sati5!e cho>. El número esperado es u n · p (25)(.172 ESTADISTICA E!' LO!> SEGOCIO~ TABLA S.106 El bueno y el malo en la imagen pública de la industria bancaria Si los resultados del estudio de Ja banca nacional pueden ser aceptado> como cifras de población. p = .88% del tiempo se presentarta al este resultado (4 de 7) en esta población. número esperado de los que consideren que el banco es su insurución financiera principal se puedec determinar junto con Ja probabilidad de cualquier número panicular de O a 25. se puede aplicar la distribu · binomial (n 15. numerosos porcentajes presentados se pueden usar como valoro p y aplicados al análisis muestra) el uso de distribución binomial.65). 0.O 188. = 7. si 65% de todos los consumidores financieros están muy satisfechos con su inst.14 Salida MINITAB para el problema hipergeométrico Probability Denaity Punction Salida Excel para un problema hipergeométrico 1 1 1 A a 1 e Ri~ico con N • 24.8 y siendo de 2 minutos el intervalo.ta cantidad deberían ser los alto' para esta distribución. ¿cuál es la probabilidad que exactamente 4 de lo> 7 se sientan seguros de usar cajero> automático>? En este problema hipergeemétrico. sólo 4 o sea alrededor de 51% piensan que e> seguro usar cajeros aut> maticos.997. lambda" ajusta al duplicar lambda para satisfacer intervalo duplicado que resulta en una lambda de 7. La probabili de que no haya llegadas en un periodo de 2 minuto> (x • OJ es . X• 8. sin embargo. El número esperado es 11 n · p = 15(.oo P(X • X) 0. Si al azar se -eleccíonan 25 consumidores financieros.0888.2 que resulta en . Por ejemplo.80) 20.1844.A = 26 y x • 4. 26 de 32 o sea 81% piensan que e> seguro usar cajeros automáticos. un banco tiene 3. Vemos que con distribución discreta nunca obtendremos 9. = = = = = r .13 TABLA S.0224 obtenida con el uso de la t A.8 clientes que llegan cada 2 minutos. Si al azar se toma una muestra de 7 de estos 32. lleguen en un periodo de 2 minutos . La aplicación de Ja fórmula hipergeométrica da una probabilida! de 0.0888.6 para 4 minutos. Casi todo el tiempo en una muestra aleatoria de 25 consumidores financieros.3 del Apendicc. se puedan contestar con el U'>O la distribución de Poisson con lambda igual a 3. La Jistnl>udón de: Poisson e> propia de suceso de algun intervalo.. La distribución hípergeométrica () una distribucién di>· creta que sude usarse para experimentos tipo binomial cuando la población es pcqueila y finita y el muestreo se rcali1a \in restitución. son la dístribución binomial. la única información necesaria para generar una distribución de Poisson es el promedio a largo plazo.::suibucionesdisaetas variable aleatoria variables aleatorias continua> \-ariablo aleatorias discretas valor medio o esperado FÓRMULAS \'alor medio (esperado) de una distribución diKrcta Oe$'iadón estándar de una distribución binomial µ • E(x) • ~[x · P(x)] \'arianu de una distribución discreta q2 • L{(x -µ)2. Debido a que usar la disrribucién hipergeométrica cs un procese tedioso. La fórmula bmomial se U$. Tres distribuciones discreta.orios.on.. se construyen de variables alea· lOria. La media.generalmente m. las probabilidades de Poisson se pueden determinar ya sea por la fórmula Je Poisson o las cuadro.x!(n-xl! Media de una distribución binomial ¡1 • r1·p Fórmula hipcrgcomttrica . Las variables a:eatoria) tal~ que el conjunto de todos (0$ posibles valores es a lo sumo un numero finito o contablemente infinito Je valores posíbtes se llaman variables aleatorias discretas. y numero de llamadas por minuto en un conmutador. La distribución binomial se puede usar ~ analizar estudio.~ Ol'>CRETAS 173 RESUMEN Los expenmentos de probabilidad producen resultados aleade un experimento aleatorio \C denomina variable aleatoria.1n1. La probabilidad de obtener un resultado deseado en cualquier intento se denota como p.i A.::stribución binomial =nbuciones continuas .a de una distribución de Pois-. Una cuadro binomial se puede . que es J. Las suposiciones son que cada suceso e> independiente de otros sucesos y que el valor de lambda permanece constante en todo el experimento. la distribución de Poisson y la distribución é:pergrométrica. TÉRMINOS CLAVE distribución hipcrgeom«rica distribución de Poisson lambcla(X) t.2 dd A~ndice A contiene cuadros binomiales para valores seleccionados den y p.). p O pl"<¡Ucna y 11 • p :S 7.'cruz. tina variable que contiene los resultados construir por cada par ditcrcntc de valores n y p. La distribución binomial se adapta a experimentoscuando posible> sólo do> resultados mutuamente exclusivos.s continuas. La distribucién Je Poisson se puede usar para calcular problema> de distribución binomial cuando n es grande (n > 20). discretos que comprendan cosas como . La distribución Je Poisson se utiliza por lo general para analizar fenómeno que producen >UCCSO> poco comunes. id tam:iilo pobbcion:al e• suficientemente grande en relación con tamallo cuestral (n < 5%S).igina de papel. · P' • q"-~ • .c.ua. P(x)] Fórmula de Poisson Desviación estándar de una distribución discreta "= J~(x-¡1)2 · P\x)I Fórmula binomial . de Poisson Je: la tabl.. En rrorla. numero de accidente> por 1 000 vuelo> Je aerolíneas comerciales. de una Jímíbudón binomial es m = n • p. que se denota por lambda (>. la tabla A.U ventaioso. No obstante.' toman valores en todo> los puntos sobre un i::::tm-alo dado y se denominan variables aleatorias discretas.1 para determinar la probabilidad de obtener x =ltados en n intento' Lo· problemas de di\tnbución binose pueden resolver mas rápido con el uso de cuadros bom1tles que por fórmula. · P" • q"-" . Algun~ ejemplo de experimemos del tipo Je Poisson son el número Je errore por p. cada intento en un experimento binomial debe ser in· dependiente de 10$ otros intentos.3 dd Apéndice A. . Las distribuciones continua. usar la distribución binomial siempre que sea posible c. la distribución binomial se puede usar donde sea aplicable en caso> donde (0$ intentos no son independientes. Lambda es tanto la media como la \"UÍ. defectuoso/bueno y hombre/mujer. La desviaeién están· dar de una disrribucién binomial l'S Vn · p • q..a probabilidad dt obtener un suceso. La> varia· bles aleatoria. o promedio a largo plazo..CAPITUW S 01~TRIBUCIO'l:E. ..._el wlar _... l -lllftltlO ele .H Resueh11 las prob.. Si N • 1 O.... DO lllilfarl8p MM lWI puede raullar 111 ..W.. Suponga qut se loma mucsira al azar de 25 im~rsionistas en acciontS.39 En un estudio .2) c....ae. para encontrar los \'alOl'e$ los siguientes problema$ de distribucién binomial. p._ facmt al mu la dilaillud6u ele PoillOll pera calc:uJar v..uu rnoh'tt las pro!W>ilid... ~cuál es la probabilidad quex .. a.1796. l'tx< Slri • c._tlwlar•A panel..._..1a pl'oWlAWdratllqaia'wlat.... . ...Ju? ¿Cu. Sin • 14 y pe: .... Alguw luwlllplaM puedm pmdudr 1 t fo .•cildD.. da ....37 S . ~cuál es la probabilidad de que X> i? d._.so.. Ea.... Aptndice A.. />(2 <X S . ¿Cuil la prubabílidad de que c:xacumente siete i<'an peno jubila... ¿cuál es b pr<>Nbilidad de que x <:: 2? Pruebe aua conocimiento• htdio por Pfter D....zhrU: 1 ..3.dr .'. c•uál es la probabilidad de que xs 3? r '2 S..mr. eledBoaaunadmdaele. lbadda ele Poilloa.. ¿cuál es la probabilicüd de qu~ s H c..imm La eD . 6....SS.3) • 2. es b prob3bilid3d de que 6 y p • ._dl. P(x <:: 12ln • d..w.. • 6.......-pw1t...1 probabilidad de que x > 5? P<x ·JI>.1) sp.. • 2. ¿cuál es 1..... 1 •lsl IUplllicbler 1plicado11alplOpiadu dt ettu t«lllCIL La mapaddlll eMa di 111 's 'jan ...cumclo 11 a hice . proMllen•• apertolell•~·· hacerlo 111 lbtt el canuno pen tomas de decisiones no fticls... PROBLEMAS COMPLEMENTARIOS C. lo> invtrsionístas de acciones son penona5 jubila~Adanis.._..lbilidadcs de los siguimtr$ problemasde distribución binomial con el uso de la fórmub binomial.35 Uiilkt la tabla A...._. 1 a de los cb ca-.. se dctmninó q11t 20% todo.. a.23... 40% dt todos 10:1 adultos m üudos Unido& invierten en fondos mutuos...1...o..._an dradwclf..40) S. • 1....30) IS .. 'J ...I es b probabilidad de que x s 1? c._ qmel wlardrA Clllllbla atadlo.....&Comocldeuae • 1111 mes8Clho en ele elmocletlllpera ... entre loe aJlles diYidir . P(x > 20ln • lOyp • .._ fllllL Cuando 11 -. el _. pdllll'' da ...50. . Si)..4.. . 2. ~" Deben destacane ftriol pullCol ~del ~y/OA!pCllKKlllelelelllnllocleben Sltu8C10IMI doadetl... aun camelo 50 w el valor aperedo dt esca clilcribad6a •.. Han Research ~ para la :-.......• 3.CONSIDERACIONES ÉTICAS de cliltribucianel dilama . b. S.. e1e._ ... 11_.. n • 5 y A • 3..ira encontrar los siguimtes valores de: distribución de Poisson. Si).... br te mtacir ponp hlY . .. 6111 illd110DV..._ •• .. Si S .. Aun cuado 111 .._.36 Utilia b fórmub de PoWon p. rst• a prMlltz n --Jl(s 50) .y p • . Si ~ 13.... pn>WIW rr be. "" 4.. P(ic • 14ln • b...60) IOyp • . UIO • .? b. lllfa luipwoplrlllo. problble ... .. ccW... no aklD.ucUq S1ock Markct.. Si n m 11 y p e . Apfodice A.. P(x <:: 31>d..... . .-w.. de diltribucionft binomilla .i· des de los siguimtcs problmw de distnbución de Polsson.latlilb lllltituci6n.. PorfjempD... ll t1m11oy..... 51 Use la tabla A.._ • ....olllemm libim • l da Ba cWI.. ri • 4 y A • 5...-... Si ). Loe tmlftll dt Jalcio CIOlllO IOD 1'1111 • cllio ile {tllt MI lit ftlca.3....... Si n • 9 y P • . 3~ b... . clk:leat........ ¿cuil a. de 1l 50el .60) 25 y p • .lculo de ntad1sticas 5.U o la probabilidad de: que 10 o m4> S.... ¿cuál es la probabilidad de que l c... pan tomar decilionea. ee.. ..38 Re>ud\"a los siguimto problmw con d wo dt la fón= hí~eomttrica.....-fts 50 En _ _..ci .. .--.. -. E' fr1 ele valor "se hlcr .-ntiwncDlfcanma.. .. (cuiJ es la prebabílidad de que X• 4? b.100.. a.25..... de a.2....s> P(x < 51>. n • 3 y A • 5. cieno paneo.Sla fllle .. " . de 40 hor<b a la $CJT11Da.:en que d consqo más anpo:umc es tmcr listo un buen linandamicnto.' inviertan en fondos mutuos? ¿Para que! número exacto de adulto~ o la probahilidad más alta? ¿Cómo se compara ~ta cifra cnn el número esperado! 5. ¿qué con· cluyc usted a. con padecimiento crónico del corazón en una muestra de 20.4.i. el lector rcafüa una encuesta tde· fónica aleatoria de 20 persona» de entre 65 y . Una máquina (B) es mis nueva y mis rápid.40 Una gasolinera tiene una bomba que dimibuyc com. pedía trabajar m. uno de otos lotes se selecciona al arar y se prueba en busca de defectos. ¡qué podria co<1c d lcaor~ 5. Suponga que al azar se IC!ecdona una muestra de sxtt trabajadores. frecuento de salud? ¿Cuil es el número esperado de trabaiadore que dicen que el estrés del trabaio lo causó frecuentesproblemas de salud' b.• bustible dibcl a automéviles. 5. que dipn cpe . ¿Cuil es la probabilidad de que: siete.ad de que más de siete digan que el ntr~• del trabajo les cawó problema. de pcqudlos negoaos dm cpe d COD· 5<'jo m~ importante' pa.i. Suponga que sólo una persona en ota encunta time un padecimiento crónico del corazón. ¿Cuál es la probabilidad de que los . Suponga que el propietario necesita cerrar la bomba de diésel durante media hora para hacer reparaciones. e. ¿Cuál es la probabilidad de que la mitad de las piczu se hicieran en cada máquina? c.~1 En una planta manufacturera en particular. lleguen a 11$.S DISCRETAS 175 peno~ jubiladas? ¿Cuánw personas jubiladas esperana u red encontrar en una muestra aleatoria de 25 inver6ionisw en acciones? Suponga que se toma una muestra al var de 20 aduhOi de a. Suponga que se scl«dona una muestra aleatoria de 10 trabajadores estadounidenses.0 FJ l\ational Cerner for Health Statistia reporta que 25% de todos los ntadounidcmt~ entre 65 y 74 aAos uenen un padecimiento crónico del corazén. •· Con base en la cifra del National Centtt for Health Statisucs.1d de que cinco o más autos lleguen durante un periodo de 1 hora a usar la bomba de di6d? Si en realid.45 De acuerdo con Padgcn Business 5ervia:5. Para inve tigar esta teoría. y que las condicione:~ en ese estado promueven corazones sanos. ¿Cu.4 son de· fectuosos. ocho o nueve picz~ se hicieran en la máquina B? dounidenses dicen que el estrt. ~tadounidcnso. Suponga que se selecciona al aur una muestra de 1 S trabajadorc. Treinta r cuatro por ciento dijeron que el allo pasado pensaron seriamente en renunciar a \U trabajo por el mm.CAPmJLO 5 OISTlUBUCI0:-01'.:crca de su estado nattH S.li adulto.e para larg. Cno de cada tres dijm>n que esperaban consumirse en el trabajo en un futuro cercano.e con<umirán en un futuro cercano? ¿Cuál es la probabilidad de que ninguno de los trabajadores d:p que se con.tado. ~-in~ por aemo dicm que: tener un buen plan es el consejo más unporunte. L . ¿Cuál es la pro· babilídad de que exactamente ocho adultos in\ icrtan en fondos mutuos! ¿Cuil es la probabilidad Je que menos de seis adultos inviertan en fondo• mutuos? ¿Cu. del trabajo In causa pro· blemas frecuente. un promedio de 1.t. En un periodo de 5 minutos se produce un lote formado por 32 piezas.i aflos de su estado.44 t:na encuesta rcalíl. dos maquinas (A y B) producen una pina especial. ¿Cuil e~ la pro· babi.iet<' digan que con &ecuenc ... ¿QUI es la probabilidad de que tro auto. ¿que! podría conduincl L 5. ¿cuál es el numero aperado de personas entre 65 y 74 afio¡ en JU encuesta que timm un padecimlento crónico del corazón! b.. El propietario estima que sólo unos 3.ga el ltaor S. (Cuil o el número cspe· rado de estos trabajadores muestreado. Suponga que un inspector selecciona al azar doce píeus de este lote. ¡Cuil es la probabilid. Suponga que las llegad. aun cuando le disgusta perder un negocio.1da por la l"orthwntcm Nauonal Life lnsurance Company m~16 que 70% de tratMjadom esta· ¿Cuil o la probabilidad de que exactamente tres pie· za• se hicieran en la máquina A? b. si 25'!11 de la población de esta edad time este problema de salud? A partir de los daros muotralo. de salud.al o la pro· babilídad de tener una o mCOO) penona. a. ~de lodos 10> propietaria. cCuil es la probabilidad de que toda> las piezas se hicieran en la máquina B? d.urnirá en un fururo cercano? c.id OCWTC este resultado. Suponga que cinco autos U~ durante un periodo de una hora para usar la bomba de: diésel.lr la bomba de Jikt-1 durante un periodo de 1 hora? b. ¿Cuál es la probabilidad de que el comprador acepte los lotes? Suponga que los defectos por lote son una distribución de Poisson. cl comprador mhazan todo el lote enviado en esa remesa.'I frecoencia se lci.e les pide uabzja: ch de 40 hora. horas y trabajar duro.il es la probabilidad Je que ninguno de los aduhos inviertan en fondos mutuos! ¿QUI es la probabilidad de que 12 o m.ra inicu. por semana' Si realidad ocwu es:t resultado. upor.u de usuarios de la bomba de diésel son una djstribucién de Poisson.r un DC'toOO es pnpa· ran. por cada lote de 100 chips de computadora que produce una compai'úa.u cuales son producidas por la máquina By el resto por la núquina A. ¿Cuál es la probabilidad de que no lleguen autos a uar la bomba de diésel durante el periodo de mtdia hora? c.2 autos usan la bomba de diésel cada 2 horas.. Unidos. 22 de l.? Suponga que.lid.¡ el lote probado contiene mis de tres defectos. de los cuales 5)% dijm>n que con much. Supongamos que el lector vive en un estado donde el ambimtc es propido para una buena salud r estr~ bajo. 18% dken que cstudiar b industria es el consejo más importante y 1 'líi citan otros consejos. Otra compat\ia compra muchos lotes de esto• chips a la \~1. \'cmtlCUXl) por ciento di. A continuación \'Ca/110$ los 25 principales diarios de Estados Unidos. ¿Cuál es la probabilidad de que .116 ESTADISTICA E~ LO) l'EGOCIOS que se entrevista a 12 propietarios de pequd'l<» negocio. azar ella muestrea ocho de estos periódicos.te por· cenuje es el m.4 baio de los SO ~os de la l:nión.46 De acuerdo con un estudio reciente. vivan en zonas metropolitana>? b. S. Pncnburg TunQ ( fl) Suponga que una investigadcra de-ea muestrear parte de estos periódico> y comparar los tamañosde secciones de negocios de los periédicos dominicales. ¿Cuál es b probabilidad de que más de scü pasajero> pmcmm qucja5? S.ida. la probabilidad de que la muestra cont exactamente un periódico localizado en el estado Nue. en promedio ocurre .48 Según el US Ccn5u¡ Burau.abo? ¿Qué podría con· cluir eUa acerca de lo> dato> del censo? 1. Sesenta por ciento de sus diemes entran sin cita. Si una familia hace de» viajes dé m. la probabilidad de que un pasajero presente una queja ante el Department of Transportation. ¿cu.¡. Suponga que la analista obtuvo más de 10 personas que viven en zona> metropolitanas del grupo de 25.4 importante? c.000014. el consejo ~ imporunte? d. 1. ¿Cuál es la probabilidad de que exactamente cinco pasajeros presenten quejas? b.eü o más de los propietarios diga que prepararse para largas horas y trabajo duro e. ¿Qué podrta concluir db acerca de la lista de la compañta de consumidores de Id.U es la probabilidad de que la familia no tenga problemas de neumáticos en ninguno de esto.. ¿Cuál es la probabilidad de que ninguno de periódicos estén localizados en California? d.-a York? b. Suponga también qÜe toda la distribucíón del numero de fallas de neumático.h de 2 mil millas. a. ¿cuiJ es b probabilidad de que tres o menos entren sin cita? Si en realidad ocurriera este resultado.. enue los 10 primeros por circulació:: c. (1''Y) Lo• Angele> Times (CA) WaJiington Po5t (DA) Kcw "•rk Daíly ~ews (KY) Oücago tribune (IL) Long lsland K~scby (ISY) Housten Chronicle(TX) Dallas Morning K~·• (TX) Otiago Sun-Times {IL) Boston Globe (MA) 5An Francisco Chroniclc (CA) PhotnixAru. de ldaho.is. ¿Cuál e. Suponga que al azar se seleccionan 100 mil~ que volaron en es1a aerolínea en p. Si al uar muestrea ocho de las personas de la füta de clientes de la 1ernana p.ona R<publíc (AZ) Kcw York Poo1 (~'Y) Denver Roclq·Moun1am "~"' (CO) Deneer Poot ( CO) !\cwark Slu· Lcdgcr (NI) PhiWklphu lnquittr (PA) San D1q¡o Ynion-Tnbune (CA) Dctroil Pree Pm> (MI) OC\dand Plain Dealer (OH) Orangc Country ~lér (CA) Portland OrcgoniAn(OR) Maami Htrald ( FL) MumeapoJi. ¿Cuál es b probabilidad de que ningún pasajero presente quejas? c. el consejo m. en esta muestra que vivan en zonas metropolitana6? c.60 de falla de neumáticos. ¿Cuál es la probabilidad de que exactamente cinco propietarios digan que tena lllto un buen financiamiento e. Lugar 1 2 3 4 s 6 7 8 9 10 11 12 13 14 IS 16 17 18 19 20 21 22 23 24 2S Pttiódko !\""'York Time.. ¿Cuál es la probabilidad de que exactamente tres los periódicos estén localizado> en estado> empiezan con la letra M? . ¿Cuál es la probabilidad de que una familia haga un viaje de mis de 2 mil millas y no tenga fallas de neumáticos? ¿Cuil es la pro· babilidad de que la familia tenga tres o más fallas de neumático.49 Suponga que. ¿Cuál es la probabilidad de que la analista obtuviera más de 10 persona. Su analista de mercado selecciona al azar :!5 personas de esta lí$ta.irtkulu. Una compafúa de ventas por aaUJoso de Georgia acaba de adquirir una füta de consumidor-e. por cada viaje de vacaciones familiares en auto de m. ¿cu. ¿Cuál es el número esperado de prop~ que dírian que tener un bum pbn es d consejo ~ importante? S. y suponga también que los porcentajes se cumplen para todos los otros propietarios de ptqumo> negocios. por viaje de más de 2 mil millas es de Poisson. en ese viaie? Suponga que los viajes son independientes y el valor de lambda ~ cumple para todos lo> viajes de ~de 2 mil millas.-mm zonas mctropoti~ i::.ilcs iCrlan aJgmw de las explicaciones para ello? S.Sm Tribune (MN) St. ¿Cuál es la probabilidad de que la mitad de los~ estén dasj6oit!o. ¿Cuál e> la probabilidad de que exactamente ocho persona. do.4 de 2 mil millas durante un verano. viajes? S.. :tara de una aerolínea estadounidense en particular. 1.47 Un otilista de pduqunú ba estado un ano en este nego- cio. clasificado> de acuerdo con >U circulación..alttdedorde 20%de I06 residentes de ldaho . es .SO La publicación Editor and Publisher Ytarbook publica cifras acerca de lo> principales periódicos de Estado> Unido>. ¿Cuál es la probabilidad de que ninguno de lo> propietario> diga que prepararse para~ horas y trabajo duro es el consejo más importante! b. 'Y) (l~'l Indiana Uni.ity (:-.:turadón a b siguiente es constante y un audítor muestrea al azar mil facturas. Si una operadora puede manejar a lo sumo cinco llamadas por minuto. traba· dedor de 36% de todos 10> m~ÍCO> estadounidenses de jadores no viajen de un suburbio desde el lado oeste meno. Suponga que las llamadas tele· fónicas a un conmutador llegan a un ritmo promedio de 2.in transpone público. ¿Cuil es la probabilidad de que menos de cuatro fac· viaien de un suburbio a su trabajo desde el lado oeste ruraciones contengan un error de registro? dd no Grande? b..5. Si se seleccionan al azar 25 de contratación.57 El siguiente cuadro es una lista de las 32 m.Duiuans 'itate Unhnuty (U.·rn.S. aire· d.6 '6 '6134 '6015 JS2J7 JH60 JJ951 33 713 "I 315. a. Census Bureau. Ocho de~ trabajadores \'iaian de un suburcorporación. ¿Ciúl probabilidad.Angda (CA) Univnsity of Wuhington( W:\ Univmity oí South Florida t FL) Rut8ff1 Uni•~nity (:-111 Unh~nity of Arizona (AZI Florida Statt Uni\Tnity ( FL) Unl\-mityof Cmtral Florida (FL) Unh·mítyof Maryland-ú>lkge Park (MD) Brigham foung Unl\Tn11y(UT) Un"-mityof Houston (TXl Florida lntmiatíoml Unh'mÚV (FL) San Diege State Uni.!.55 Suponga que en la operación de contabilidad de una gran do b gercnda. Un analilta de mercadeo de televisión selecciona al azar 160 familias estadounidenses.\ll:uua usan transporte publico. ¡Cuil es la probabilidad de que la mitad de lo. la probabilidad de un error de registro en bio a su trabaio dock d bdo oeste del rio Grande (Bra•'O).47 31 2SS 30916 30861 30405 . ¿Cuil es la probabilidad de que una o menos llama· das lleguen en un intervalo de 15 segundos? 5. ¿Cuil o la probabilidad de que ninguno de lo.'Cr>lty-Bloomington (1~") Uni•tt>ity of California at Los .11quicr facturación es . 177 Una oficina de Albuqum¡uc tiene 24 trabajadores incluyen· 5.. a.ta muestra. Supongamos que el lector muestrea al azar 25 de inscripciones de \\orld Almanac.CAPfnlLO S DIST1UBUOO.tl es d numero esperado que en estos número•? Utilice la distribución binomial para use transporte público? Gra6que b distnbución binomial determinar la probabilidad de que el resultado de la con· para e. a. (r..'t'nlty (CA) Univ~ty of Califonm at Bcñdn. (OH 1 Univmity of Mínnesota (~t!\) IJnh-mity of Florida t FL) Arizona Smt IJnh-míty (AZ) Tcus A&~t Univmiry--Collegt Station (TIC) \lichigan Statt Unh·mity (~U 1 Uni~ty of W'11COnsin-Madison (WI 1 Pmnsyh-aniaSuie-UnivmityPark (PA) Ul\l\-mityoí lllinoiJ.lCA) Uni•·rn. ¡Cuál es la probabilidad de que entre do> y sei> familía> [inclusive) no tengan televisor a color? Uni\usiry ofTeras at Ausun (TIC) Ohio Sme Uni•'m11}'-Columbu..i6 durante un intervalo de un minuto? b. 150 3.54 $ólo 1% de todas las familias esudounidenses no tienen televisor a color. ¡cu. ¿tendría usted un caso dificil con base trabajadores de Atbnta. ¿Cuál es la probabilidad de que lo> ~b trabajadores a. de un error de regí~tro de una fa.SE5 DISCRETA:. ¿Es probable este resultado? Univtrsi¡y of Phoenix (AZl 66SJ4 <Cómo podria explicar usted este resultado? ~ s. cu.iles son b medja y la desviación tratacién de la compañía ocum al azar y comente sobre esúndar para esta di)tnbución? ¿Cuál es b probabilidad de la potencial justificación para una demanda. Unido~ de acuerdo con cifras dad. (a) o (b) es mejor? ¿Por qué pim>a no contengan errores de reg~tro? eso.Ownpaign t IL) Purdue Uni.? ~ d U.965 3.005. ¿Cuil es la probabilidad de que ocho o más familias no tengan televisor a color? c.) Waym \me UnMni1y (MI) 49996 47952 45481 45 11~ 44126 44 026 4) Jó6 41 219 405il 3. ¿cuál es la probabilidad de que la operadora no pueda manejar las llamadas en ningún periodo de un minuto? c. ¿Cuál es la probabilidad de que la. 5.8il 37 59S 3. ¿Cu. que más de 12 de los trabajadores seleccionados usen transporte público? Explique conceptualmente y a par· 5.ity of Gorgü (GA) California State Uni. Algunos analistas generalmente piensan que las llamadas telefónicas aleatorias son dutribuciones de Poisson.-enityLong 8rach (CA) l. trabajadores de Atlanta y en realidad obtiene 14 que Ull. Si un grupo de doctoras mujeres desea . ¿cuil es la probabilidad de que no haya lla· mad.'tmty-\\est u~1e Univnsity of Michipn (MI) ~tw York Uni.56 De acuerdo con la American Medícal Association. Su companla del río Grande? acaba de contratar ocho médicos de menos de 35 ai'io> y ninguno es muier. de 35 ai'i0> de edad son mujeres.. 20% de ~ traba~ra de demandar a su compañía por práctiau discriminatorias •. mil facturaciones c. ¿Cu!I es la probabilidad de que mí$ de JO íactura· cienes contengan un error de facturacién! baiadores viaje de un suburbio desde el lado oeste del rio Grande? c. trab.<I llamadas por minuto. ¿Cuántas familias esperana ti que no tengan televisor a color? b.ÍYa'Sidad hucritos us. Si una operadora desea tomar un descanso de un minuto.S4 31123 31945 31609 31 ). ¿Cuil n la probabilidad de que exactamente tres llamadas lleguen en un intervalo de do> minuto>? d.is grandes ur de la gráfica por qué obtendría usted esta probabiliuniversidades de futado. Suponga que b proNbilidad Suponga que Iris de b olicinbw al azar se sdeccionan.J lina de las primeras aplicaciones de la distribución de Poisson fue para analizar llarnadas entrantes a un con· mutador telefónico. il es la probabilidad de que dos o menos san universidades de Michigan o Arizonal c.16« 00858 0.00 10.00 3.0030 0. El estado con el número mas bajo fue Mmncsota.00 5. que al evaluarlas resulta que valen casi lo mismo.tad~ Unid~ y no encontrar acciones severas tomadas? b.00 1.62 Estudie la salida gráfica de Excel.00 4.iles de las casu que obtendrá el contratista está sujeta a retiro aleatorio? b.78 0.0055 o.0118 0. desviación estándar y la razón por la que las probabilidades caen como se ve aqui.oo 9.00 14.1002 0. Si se muestrean cinco universidades.0006 0.•· Si de la lista se seleccionan al azar cinco universidades difcttnt~. ¿Cuál e> la probabilidad de seleccionar al azar mil doctores de E:.0411 0. Suponga que las universidadesse seleccionan al azar de la lista y con restitución. ¿Son estas probabilidades bs que se esperarían! ¿Por qué si o por qué no? o 1 2 3 '5 e 7 8 9 10 11 Poiaon Probebilities: A • 2. ¿Cu. ¿cuál es la probabilidad de que tres de ellas tengan 40 mil o mú alumno.0001 0.0104 0.il es la probabilidad de que las cuatro casas selecdonadas por el contratista estén en el lado oeste de la ciudad? 5.0620 0. que se tomaron durante un año reciente a doctores no federales en Estados Unidos El promedio nacional fue 3.00 11. .59 El Public Citizen's Health Research Group estudió las -cvcr.00 2. ¿Cu.0398 0. a.6 acciones severas por mil doctores. ¿cu. Analice el tipo de distribución. Si de la lista se seleccionan al azar ocho universidades diferentes.0798 0.0158 0. Probabílity Binomial X 0.0000 0.0005 0. ¿Cuál es la probabilidad de seleccionar al azar 2 mil doctores de Estados Unidos y encontrar seis acciones severas tomadas? c.00 7. Suponga que los números de acciones severas por mil doctoro en Estados Unidos y en ~linnt. Describa la distribución y explique por qué la gráfica toma la forma que K ve aquí.1963 0. ¿Cuál es la probabilidad de que las cuatro casas seleecionadas por el contratista estén en la lado norte de la ciudad? c.00 8.1419 0.0349 0.1692 0.36000 with P(X •X) 0. el gobierno tiene 14 cuas recuperadas.0000 5. ¿cu.00 6. inscritos? b.0012 0.il es la probabilidad de que la muestra contenga exactamente dos universidades de Texas? 5.u acciones disciplinaria.2093 0.00 13.58 En una ciudad de la Región Central.)Ota son distribuciones de Poi-wn.00 Oenaity Function n • 15 and p • 0.00 15.2397 02221 0. la media. Explique la distribución en términos de forma y media.60 Estudie la salida Mll'ITAB. casas están del lado norte de la ciudad y el resto est¡n en el lado oeste.0001 5. Un contratista de la localidad remite una cotización para comprar cuatro de las casas.00 12.61 Estudie la salida Excel. Diez de la:. con 1.84 acciones severas por mil doctores. ¿Cuál es la probabilidad de seleccionar al azar 3 mil dcetores en Minnesota y encontrar menos de siete acciones serias tomadas? Interpretación de le Nllde 5. a.1725 0. 17 0. .l.. O.Kión en d mercado. aceptación de clientes.2 1 0.. Ademá). se lanzó el nuevo ~ de 24 mili. ¿Cuál es la proba· bílidad de que una indus1ria de código SIC al azar seleccionada 1enga un valor de embarques industriale.l.~~41.1 0.64 o.63 ütudie la grtfia ~llNITAB. ¿cuál es la probabilidad de que exactamente ocho tengan un valor de embarques industriales igual a 2? 1.idores se sintieran frustrado . ¿cuál es la subdivisión entre hospitales que son hospuales generales y hospi1ales ~iqui. ¿cuál es la probabilidad de que meno) de tres tengan un valor de embarques industriales igual a 2? Si usted seleccionara al azar 25 industrias de código SIC. Ahora use la fórmula binomial para determinar la probabilidad de seleccionar al azar 30 hospitales y obtener exactamente 1 O que sean privado . de 35 mili..atricos? Con d uso de estas cantidades como subdivisión de la población y la distribución bipergeométrica.metro'. USA. Afonunadamcnte. Anilisis Supongamos que el lector es parte de un cqwpo Fu¡i CU)'3 tarea es examinar problemas acerca de b partJCJp.~~ O 1234 S 6 719101112Ul41Sl6171119l02122 • \'llom. Utilice la base de datos financiero) de compal\ías fabricantes de productos químicos.1...) 0. 0. a~ de que se tuvo una ~ube)timación consickn· ble de la demanda por este producto. calcule p probabilidad de que ~ un hospital privado. En 199 .~-.. Use la base de datos de hospital En esta población de 200.08 ~ 0.cormo s nisTRIBUOO:-b Ol>lnbuáón binomlol: " .L.r o 10 ANÁLISIS DE LA BASE DE DATOS t.u.. unió con cuatro de sus rivales para crear el sistema avanzado tografia (APS) como el primer perfeccionamiento imporen la industria de películas desde que se introdujo la tec. I~ =. ¿Cuál es la probabilidad de seleccionar al azar ocho compañías de seguros y obtener exactamente cuatro de ellas con rendimientos promedio de menos de 1 %? CASO: FUJI FILM INTRODUCE EL APS pnnap1os de la década de 1990.22 'p .stla publicidad como el producto lo fabricaban cinco industrias rivales. induvendo el personal de conocerla IOl detallo sobre el producto ha)ia que cada copa!tla introduicra sus productos APS el mismo dia. qutjas y las razones por las que los nuevos productos uenen éxito.11 0.>afilasllegaron a un acuerdo secreto en d que nadie fuera ~ b admm~tración de la compal\ia.i . Cuando producto se introdujo.lol:i. la falla de comunicación abasto l.a 0. Los producto$ APS estaban camino dd hito.. = 3.11> 0. ¿cuál es la probabilidad de que exactamente tres tengan un rendimiento sobre capital contable de 15% o m. las ámara:s APS n tenían 20% del mercado de airnaras para apuntar y cljsparar.IJu.u1 Su~~ncia: use la dístribución hlpergeométrica y una subdivisión de esta población de 19 compañías para calcular esta probabilidad.14 ~ I DISCRETAS 179 5..1 .metro) que prometía fotografbs ITlU claras y nlúdas..i. Si usted fuera a seleccionar al azar 12 industrias de código SIC. aumentó su un ción para comprobar mejor la posición y tamÚIO dd merado.02 04-.En febrero de 1996. igual a 2? Use esto como el valor p para un experimento binomial..a. ¿cuál es la probabilidad de seleccionar al azar 16 hospitales de esta base de datos y obtener exactamente nueve que sean ho piules ~qui. .06 0. Fuji pmionó al adoptar la J)O'IUra de que la honesddad es b 1DtJOf politica y explicar a vendedores y otros clientes lo qix babia ocurrido y les pidió paciencia. Para finales de ese afio. Discuta la distnbuctón incluyendo tipo.04 G.itricos? Con el uso del número de hospitales privados en esta base de datos..i. Para 199i.. habla multiplicado la producción para Atisfxer b demanda y aumentó la promoción a dientes. en realidad llegó con poca informaaóa a vendedores a detalle sobre el producto y pnlctiarnente capacitación a representantes de \'tola) del producto (de ~ modo que pudieran hacer demostraciones y aplicar las carac· leristicas ). Casi no exi.u. forma y resuhados de probabilúbd. fuji Photo Film.12 0. Use la base de datos de manufactura.~ . Si cinco de estas compañías se seleccionan al azar..~~~~~~~~~~~'--~~---.imítado de productos hizo enojar a vendedo~ y~ =um. Aparece otro menú descendente. x. Supongamos que al azar se seleccionan 30 clientes del mercado de estas cámaras. Distribución binomial Para obtener una distribución binomial. ¿es esto suficiente evidencia para convencer a la administración de que el porcentaje promedio de quejas aumentó o se puede escribir como un suceso aleatorio que ocurre. seleccione el nombre de función.EGOCIO~ J. n. n. y la cuarta linea es para el tamaño de población. la segunda e> para el tamaño muestral. ¿es esto suficiente evidencia para convencerse de que la participación del mercado no es de 40%? ¿Por qué si o por qué no? 2. El proceso empieza por seleccionar la opción Qt)c la barra de menú. Distribución binomial Distribución hipergeométrica Para trabajar un problema de distribución binomial con el uso de Excel.. además. el proceso se inicia al seleccionar la tecla Paste Function. la respuesta ser~ dada como probabilidad exacta. N La salida será un valor de probabilidad exacto.f. 34 fueron lanzados con crecimiento de ingresos como su principal objetivo y el roto se lanzó para aumentar la satisfacción del cliente o crear nuevos mercados. La primera pide el número de éxitos en la muestra. Si se supone que es inaceptable para la administración que el porcentaje promedio de quejas aumente. la probabilidad de un solo éxito. ¿Cuál es la probabilidad de que este resultado ocurra al azar? ¿Que nOI dice esta probabilidad sobre la premisa básica con respecto a la importancia del objetivo principal? USO DE LA COMPUTADORA EXCEL Excet se puede usar para calcular probabilidades exactas o acumulativas para problemas con el uso de distribuciones bino· rniales. es un valor lógico que determina si la respuesta se da como probabilidad exacta o probabilidad acumulativa. que pretenden aumentar la satisfacción de clientes o crear nuevos mercados. con lo cual aparece la caja de di~ Paste Function (Pegar Función). Ahora suponga que sólo 10 de estos productos tuvieron éxito (los demás fracasaron) y siete fueron productos lanzados para aumentar la satisfacción del cliente o crear un nuevo mercado. Para cada uno de estos cálculos. la~ da pide el tamaño muestral. aparece otra caja de diilogo. de la caja de diálogo Paste Function. x. la respuesta se dará como la probabilidad acumulativa de valore> entre cero y x. Si la participación del mercado es en realidad 0. La primera línea pide el número de éxitos. A. Distribución de Poisson Los problemas de distribución de Poisson se pueden resolver con el uso de la opción POISSON seleccionada de la caja de diálogo Paste Function. La primera pide el numero de éxitos.180 E.40. Con base en la probabilidad que acaba de calcular.STADIS-nCA E.' LOS :-. se pone TRUE en la línea. Para usar esu función deben completarse cuatro lineas de información. puesta. con lo cual aparece el menú descendente Seleccione la opción frobability ~i5tributions. x. En la ca¡a de diálogo POISSON que aparece. ¿cuál es el numero esperado de clientes que compran una cámara APS? ¿Cuál es la probabilidad de que seis o menos compren una cámara APS' Suponga que usted en realidad obtuvo seis o menos clientes de APS en la muestra de 30. La tercera linea e) el numero de éxitos de la población. seleccione la opció= D. Para usar e)ta función deben completarse cuatro linea. En 2003 la participación del mercado se aceraba a 40%. Si el usuario responde con FALS! en la linea. Suponga que las quejas de clientes sobre la película de 24 milímetros son distribuciones de Poisson a un por· centaje promedio de 2. en la barra de herramientas. El resultado es el valor de la probabilidad. 3. Cuando el usuario selecciona la opción HIPERGEOMDIST de la caja de diálogo Paste Function.4 quejas por cada 100 mil rollos vendido>." con bastante frecuencia? Elabore la distribución de Poisson para ola pregunta y analice su implicación para este problema. deben completarse tres lineas para obtener una res- MINITAB MINITAB Window) permite producir una distribución bi!'l>rnial. Un estudio de 52 lanzamientos de productos encontró que los emprendidos con crecimiento de ingresos como principal objetivo. una distribución de Poi son. )' la tercera es un valor lógico que determina si la respuesta se da como probabilidad exacta probabilidad acumulativa. tienen más probabilidad de fracasar que Jo. Suponga que de los 52 productos lanzados. Suponga. Si el usuario escribe FALSE en la línea. para 1998 las cámaras APS tenían 20% del mercado de cámaras para apuntar y disparar. que Fuji tiene problemas con embarques que llegan tarde y que un lote de 100 mil rollos proporciona siete quejas de clientes. la segunda es para el valor de ). como el sis· tema APS. Como ya se dijo. acumulativa. hipergeométricas o de Poisson. BINOMDIST. la respuesta será la probabilidad exacta de obtener x éxitos en n intentos: si escribe TRUE. La cuarta linea. En la ter· cera linea ponga el valor de p.. Aparece la cara de diálogo BINO~IDIST. o una distribución hrpergeométrica. seleccioee la forma en que las probabilidades se calculan para selecciomr . De la caja. la respuesta ">Crá la probabilidad acumulativa de obtener de cero a x éxitos.inomial Aparece una caja de diálogo. Inverse Probability da el ÍO\'tnO de lil> probabilidades acumulativas. frobabiluy da Luprobabilidades eucw para cada . seleccione la opción HYP"Seomctric del menú descendente. 'umulative Problbility. Inverse Probability da el Ín\'e™> de las pro· es acumulativas. n. x.i el número de txitos que desea evaluar. y ~ility o( 1 suceess es el valor de p. frobability da la> probabilidades exacw para cada valor x: Cumulative Probability da la probabilidad acumulativa para tod<» y cada uno de los numero> de posibles txita> de cero 1x. o Inverse ~ility. Aparece una caja de ~ Sdcccione la forma en que la> probabilidades~ calculan .:z: CumulJIÍ•~ Prob. póngalas en una columna.. En la cuarta línea escriba el tamaño poblacional.u/~r. Si desea tener probabíhdades calculadas para varios valores de x. Distribución hipugeomttrica Para obtener una distribución hipergeométrica. Si sólo c:akular la probabilidad para un valor de x en particular.:/1<' en InputcoptlUlly cs. :::&::ñbudóndePoisson obtener una distribución de foisson. La salida será la probabilidad exacta. Si el usuario daca tener :lid. o la probabilidad acumulati\'a inversa. frobability da las probabilidades exactas ~ valor x. La Wida será la probabilidad exacta. En la siguiente linea. o la probabilidad acumulativa inversa.ibiliry ds /.Jp .l!n'n'5C Probability dad inverso de Lu probabilidades acu" Numbcr of trills es el rama"º maestral. la probabilidad acumulati\"a o la probabílidad acumulativa inversa. y b !uta de la ubicación de columna de lo> valores :c. En la siguiente línea. póngalo> en cnlumna. escriba el u. Si 5610 desea calcular la probabilidad para un valor de A" en p. S. Seleccione cómo se calculan las probabilidades al seleccionar ya sea Prob1bilid1d.pónpl:u en una columna. la proba· acumulativa. seleccione la opción de columna de entrada. x.CA.PmJlOS l>l~TRJBUCIOSESOISCRETAS 181 Ra frob1bility.irru. Si <ólo dCRa calcular la probabilidad para un valor de x en particular. Cumulative Problbility._ sO:caonar ya sea froblbility. o ~ Probability. La salida sera la probabilid. y haga la füta de la ubicación de columna para los valores x.x. seleccione la opción de columna de entrada. seleccione la Polsson del menu descendente.loro de x.Jbilid. A.1dcs calculadas para vanos \-a. Aparece una caja de diálogo.1prob. h.Jd scumulniv» :a:a todo> y cada uno de I<» números de ~ibles mios de cero a. Cumul1tive Problbility o Jnverw Problbility. y haga la fura de ubicación de columna de la> valores x. die en Input const1111 y escriba el número de txitos que evaluar. x. la probabilidad acumulativa. . haga clic en lnput const1nt y escriba el número de éxuos que desea evaluar. seleccione la opción de colum- na de entrada. escriba el número de hita> de la población.-rib. n.mmo muestral. En la linea Mean escriba el valor de ~ tener probabilidades calculadas para varios valores a 1.ld exacta. Cumulati\'e Probability da la probabilidad m-a para 1od0> y cada uno de los numeres de posible) de cero a x. CAPÍTULO 6 Distribuciones continuas OBJETIVOS DE APRENDIZAJE El objetivo fundamental de aprendizaje del capítulo 6 es ayudar al estudiante a que comprenda distribucionescontinuas. 3. Entenderá los conceptos respecto a la distribución uniforme. 182 . con lo cual: l. Reconocerá los problemas de distribución normal y cómo resolverlos. Decidirá cuándo usar la distribución exponencial para resolver problemas en negocios y cómo resolverlos. 2. 5. 4. Apreciará la importancia de la distribución normal. Decidirá cuándo usar la distribución normal para calcular problemas de distribución binomial y cómo resolverlos. Preguntas gerencialesy estadísticas l. a... con un costo medio de S592 y una desviación estándar de Si . ¿entre cuáles dos valores estarían 50% de la media? Si los data. excepto en lugares donde la cobertura de seguros e» obligatoria. 19% por seguro de vida y otro> se· guros perscnales y 9% para duei\os de viviendas y seguros relacionados. por ejemplo. El promedio de familia estadounidense ~ta S2 100 en todo tipo de seguros. sin incluir a AJa.U es la probabilidad de que un propietario de vivienda en part1culu ~~nos de $-100? Suponga que los costos de seguro de vivienda están distnbutdos de manera uruforme en el estado de Texas. seleceionado al aur.Los rostros cambiantes de la industria de seguros La industria de~ en&m1ó muchos desaños en la década de 1990. De hecho. En Estado> Unidos. La cantidad promedio en E!>tado. aun distribuidos de manca normal con una media de $691 y una desviacién estándar de Sl09. En esta década. Es1a cantidad no incluye seguro de servicio medico y de vida pagado en su totalidad o en parte por empleadores. ¿cu.a como otros tipo de aseguradores enfrentan situaciones difkilcs similare». ~w y otras tenden~ muJ1an menos dependientes de un seguro de vida. Es mh probable que familias con aduhos de mediana edad e hiios gasten m. Las tarifas más alw están en r. como ríe goso • incluyendo familias con padres solteros o de bajO) ingr('S()> . para realíur nuevas \'tnla..ncn uniforme. una encuesta realizada por Life lnsurance Marketing and Research Associa1ion mostró que sólo 59% de los estadounidenses creen que un seguro de vida es la mejor manera de proteger financieramente una familia contra la muerte prematura del sostén de la famiha. donde a de "6lo S27'1.da contra la muerte prematura del sostén de la familia. lo> vendedores de seguro observan de cerca otros mercados que antes eran poco utiliudos. f~ tradicionales que contaban con un solo ingreso se apoyaron en la cobertura de seguros de .ts en seguro El gasto en seguros de servicio médico también aumenta con la edad. ¿qu~ porcentaje de consurmdores pagan más de S874? 2. lOi anafü1as de esta indu 1ria dicen que e 1a caída cue ta a las compar\iu de ~uros unos 700 mil millonl!li de délares en coberturas y 4 700 millones en ingreso por primas.ueva Iersey (SI 100 al afio). . Si lo> CO$IO$ para asegurar una son distribuidos de rm. E!>ta cifra es menor a 72% de principios de la década de 1980. Texas registró el costo anual más alto por asegurar una vivienda en $592. el costo promedio anual de un seguro para automévil e) S69 l.in. donde el promedio de tuifa por allo es $402. Financieramente. ¿cuál distribución de probabilidad describe mejor los costos anuales de seguro para aucomóvil en Estados Unido)? ¿Estos datos eswi distribuidos de manera uniforme o normal? Si IO$ dato> estan dístribuidos de manera urufo:me. el costo promedio para ~ar wa 'ivlmda en Estados Unidos es de S420 al a/lo. El promedio anual mh bajo se encontró en Wiscon. la. Puesto que ata cantidad varia por estados. pague entre $500 y $650 por asegurar su vi\'ienda? 183 . Según el estudio de la Bureau of Labor S1a1i>1ics'.ka y Hawai. de acuerdo con la Bureau of Labor Staristics' Consumer Expendhure Survey. En pro· medio. 10) tradicionalmente considerado. propietario de vivienda y de automóvil. Los costos de seguro> también varían según el valor del vehtculo y el tamano y ubicación de una casa. Maswchustll) en segundo lugar con SS48. Los mercados tradicionales se desgastaron y surgieron nuevas oportunidades. 33% por vehículos. En décadas puadas. localidado e individuos. lu parejas se c<Wn a mayor edad.' baj~ eslin en Oakota del Norte. lo> seguro> de servicio medico. Un desglose por tipo de seguro es 39% por cobertura de servicio médico. Unido> para asegurar una vivienda era de SHO. Las tarifas ma.. Ahora. Nueva York (S960 al aflO) y Hawai ($959 al año).Cuil es la probabilidad de que un propietario de vivienda de Toa. tienen meno> hijos y a veces son dos quienes sostienen la familia. La ubicación geoglifica inOure mucho en las tarifas de seguro pagadas por consumidores. un consumidor estadounidense gasta S69 l al al'IO en asegurar su automóvil.. .Abop. a veces llamada distribución rcc1angular es continua y rdarivamenre lla t11 la que la misma 11l111ra o f(x} ~ ob11cnc r11 1111 m11go de valores.__ _1_ I .1999). El estudio reportado por la Life lnsurance Marketing and Research Associaucn mc»tró que 2 de los consumidores de seguro.1 DISTRIBUCIÓN UNIFORME La distribución uniforme.tloml ~ w. ~ num distribuciones continuas en c•tadistica incluyen la distribución uniforme.- Árn• '-----0. valora La figura 6.Comrnlssóonm.1ScwYork:a.71111\1111~ Jovnw/Alnwrw 1999.r. por definición.. prefieren comprar seguros por teltfono o por correo.3. y aplicaciones de distribuciones creus. SJ·S7. 6. En una distribucién uniforme o tangular.. la distribución no la distribución exponencial. Dado que la di~tribución se encuentra. RocWcl J. entre IOi valores x de a y b.pp. el área bajo la curva es igual a 1. la distribución normal y la dismbucién exponencial. ¿Cuál es la probabilida:!: de que 21 o más de lo• seleccionados piense que un seguro de vida es la mejor forma de proteger financieramente una familia contra muerte prematura del sostén de la familia? 4. la disrnbucién 1. en promedio."lnwran<t 11 Rislr.. el capitulo 6 se concentra en información sobre distribuciones continuas.. el área total bajo la curva es igual al producto de la longitud y el ancho del rcct!ngulo igual a 1. La · iguiente función de d de probabilidad define una distribución uniforme.llan1111e lloab.': ~" ~"" oetubr< 1995.1 e) un ejemplo de una distribución uniforme.a). 1.8 ~ hora son destruidas por incendio en Estados Unidos.cd. Mientru que el capitulo 5 ~ concentró en las característica.. la distribución ji cuadrada y la distribución F.. Al combinar el cálculo de e)la área con el hecho de que el área es igual a altura dd rectángulo \C puede resolver como sigue: f{xl Distribución uniforme •~o -----------. Adcm.p.h. ¿Cuál es la probabilidad de que t~ rra una hora y media sin que una casa sea destruida por incendio? Fwnu:: adapudo dt ün Lanon. la lo del rectángulo es ( b .. que se construyen variables aleatorias continuas.. Este tulo presenta la distribucién uniforme.'NlfORME f(x)• 1 1 -b-a O para <x <b para todos l~ otro.. Suponga que los cuadros con la anualidad de seguros muestran que. S. lu probabilidades de resultados que ocurren entre puntos particulares se determma:: calcular el área bajo la curva entre esos puntos. Supo que se realiza un estudio de 80 estadounidenses seleccionados al azar. X . en las que \C toman valores por cada punto respecto a un intervalo y suelen generar experimentos en los que 101$ cosas se "miden" r no se "cuentan" Con dístrlbu continuas.. FUl\OOS DE DENSIDAD DE PROBABILIDAD DE UNA DlSTRlBUCIOS l. -.732 ___. desviación están · dar y altura de la distribución.a) Longitud• Por tanto.°1Th1:.\S Arca de rectángulo • (Longitudl(Altura) 185 =1 Pero (b . No existe área bajo la curva para un punto individual.._112 3. • b-a 47-41 6 Deviaaón estándar = ~ = ~:: -.'!SC0)... ~uponga que se prepara una línea de producción para manufacturar broches de máquina en lotes de cinco por minuto durante un turno. ¡1=-- a+b 2 b-a u=7i'í Surgen muchas situaciones posibles en las que los datos podrían estar uniformemente distribuido). (b .A . . Cuando lo) lotes se pesan. . entre los valores x de a y b. La )Íl(uiente ecuación se usa para deterrmnar las probabilidades de x para una distribucién uniforme nitre a y Ir.06 DIST1UBtl00!1. la fun(ión de probabilidad proporciona el valor de la probabilidad. Para distribuciones continuas. cualquier valor individual es posible pero tiene probab. lPnos> ¡ X _/.2 proporciona la distribución uniforme para este ejemplo.. 1 y Altura•-1(b-a) ~tos cálculos muestran por qué.indar de esta distribución son: Media= a+b = 41+47 2 2 =~-« 2 . con su media._112 . La media y desviación estándar de una distribución uniforme están dadas como sigue. /(x) :i:s:nbución de :esos de lote ----------! ___ ----.---..732 La figura 6. la variación entre 106 pesos se detecta con pesos de lote que van de 41 a 47 gramos en una cllitribución uniforme.CAl'fTUl.464 = 1.a){Altura) .. La altura de la distribución es: 1 1 1 f(x)= Altura=--=---=(b-11) (47-41) 6 La media y desviación est.!!cUd cero. Detenninación de probabilidades en una distribución unifonne Con distribuciones discretas. Con distribuciones continuas. Como eiemplo.---µ--. la cllitríbución tiene una altura constante de l/(b . I~ probabilidades se calculan al determinar el 4rea sobre un intervalo de la función..al. u• 1. . Como 40 o menor que el valor más bajo del rango de dis ción uniforme (41 ).-: LOS S'EGOOOS l. porque x • 48 es mayor que el superior. Un argumento similar proporciona la probabilidad que un lote pese menos de 40 gramos. Describa la di bución. El tiempo medio es 33 segundos con una desviación dar ele 3. La probabilidad para cualquier intervalo que in a y b o l. Suponga que en el problema de los broches de máquina deseamos determinar la probabilidad que un lote pese entre 42 y 45 gramos. Esta probabilidad se calcula como sigue: P(x)= x2 -x1 • 45-42 =!=. La probabilidad de que un lote pese más de 48 gramos es cero.~ Tiempo (aegundotl ---x 39 .SOOO b-a 47-41 6 La figura 6.5000 41 PROBABWDADES EN\JNA OISTRJBUCION UNlFORME ------x 42 45 Pno. x • 47. PROBLEMA DE DEMOSTRACIÓN 6.'. La probabilidad de x 2! bode x sao cero porque no hay 'rea arriba debo abaio de a. f{x) Probabilidad rHuelta en una distribución uniforme .~fl¡f f$ .1 Suponga que la cantidad de tiempo necesario pare ensamblar un módulo de pl6stico varía di a 39 segundos y que el tiempo de ensamble est• uniformemente distribuido.'64 segundos. la probabilidad o cero. (gramos) 47 P(x)• donde: a Sx1 Sx2 S -xi b-a xi b Recuerde que el irca entre a y b o igual 1 l. ""' ((xi.3 muestra ~ta solución./) I 27 ><•33 v•3. ¿Cu61 es la probabilidad de que un conjunto dedo tome entre 30 y 35 segundos? ¿M de 30 segundos? Solución La altura de la distribución es 1 12.186 ESTADISTICA E. de la distribución uniforme. .. 283 .1•._ 200 '10 " .PIJO< - X< - 35-30 39-27 35)- . Esto es.891 825 .P(410 s x s 25)..2 puede resolverse con el wo de MIS'ITAB..26% de todos los estadounidenses pagan en ese rango. PROBLEMA DE DEMOSTRACIÓN 6.5 _. Entonces la probabilidad x < 30 es la misma que la probabilidad de x s 30. b • -¡. x2 • 825 4226 La probabilidad de que una persona seleccionada al azar pague entre $410 y $825 anualmente para asegurar su automóvil en Estados Unidos es ... fM __ . P{x < 30) se determina con usar sólo el intervalo 27 s x < 30 En una distribución continua. •.. El calculo resultante es una probabilidad acumubU\11 desde el enmno 12quittdo de la distribución para cada valor x. P(x < 30) a~• 39-27 2. .. ¿Cu•I es la desviación est•ndar de esta distribución uniforme? ¿Cu•I H la altura de la dtstribución7 ¿Cu•I es la probabilidad de que el costo anual para asegurar un automóvil en Estados Unidos sea entre $410 y $8257 Solución La medía est• dada como $691 El valor de a es $200 y bes $1182.2 Según la Natíonal Auociation of lnsurance Commissioners.001... by x. MINITAB tiene la capacidad de calcular probabilidades pan b dis· tribución uniforme.4226.4167 de probabilidad que tome entre 30 y 35 segundos ensamblar el módulo. del problema de demostración 6..__" 1 182 Uso de la computadora para resolver probabilidades de distribución uniforme Con el uso de los valores de a.. el costo promedio anual para un seguro de automóvil en Estados Unidos es $691. x1 • 410 y 825-410 -~1182 200 982 . la pregunta de probabilid. Como no hay •rea menor a 27 segundos. 5 • ~2 • . no hay •rea en ningún punto (sólo sobre un intervalo). 2500 12 Hey un . Como ejemplo..2500 de probabilidad de que tome menos de 30 segundos enHmblar el módulo.ad. 283. alrededor de 42. Suponga que los costos de asegurar un automóvil est•n uniformemente distribuidos en Estados Unidos con un rango de $200 a $1 182.:¡- (T La altura de la distribución es: 1_ 1 182 200 Pj410 S X S 825) 1182 Ji2200 . 4167 12 Hay un .. ¿cuál es la probabilidad de que sea entre S3.0000 410.S La familia estadounidense promedio gasta S2 100 al afio en todo tipo de seguros.tiD_. Probabilidad de (x > 230) • ? d.racterislÍC3$ e:. Probabilidad de (10 s x < 17)•? d. c.tndar de precios en esta distribución? Si de esta lista se seleccioca azar un precio. entre otros.01 onzas de liquido? ¿Cuál es la probabilidad de que ti volumen de Uenado sea entre 11 y 12.ta distribución. tienen diversas ca. peso.01 onzas? 6. ¿Cuál es la de esta distribución? ¿Cuál es la probabilidad de que una lata seleccionada al azar contenga mb 12. Determine la media y desviación estándar de e:.00 y S3. I O? 6. ¿Cuál es el valor de ftx) para esta distribución? b. velocidad. animales e insectos.00 C• .lán normalmente distribuidas.188 blADl~TICA E.&HS 0.. Determine la media y desviación estándar de e:.4 El promedio de volumen de llenado de una lata normal de refrescos es 12 onzas.6365 - .03 onzas y uniformemente distribuido. Suponga que cifras están uniformemente distribuidas entre los valores de $400 y S3 800.80 y S3. l 4. logros académicos y ailos de esperanza de vida.1TAB calcula la probabilidad de x s 825 y la probabilidad de x s 410. y estos resultados se maatran en la tabla 6. altura. ¿Cuál es el pr promedio y desviacién est. Suponga que estos precios están uniformemente distribuidos.1.ooo 125. Suponga que volumen al llenarlas está entre 11. 6.1 Salida MINITAB para distribución uniforme c:o. La respuesta final a la pregunta de probabilidad del problema de demostración se obtiene al restar estas dos probabilidades: P(410 S X S 825) = . TABLA 6.0000 PI 1 to 1112.3 El precio al publico de una caja mediana de una conocida marca de hojuelas de malz cuesta S2. c.1 PROBLEMAS 6. a. Probabilidad de (x 2: 7) • ? 6.97 y 12. todos los vi\"O~en la naturaleza como arboles. .2138 = .4227 Excel no tiene la capacidad para calcular probabilidades directamente cuando se usa la distribu uniforme. ¿Cuál es la desvi estindar y altura de esta distribución? ¿Qut proporción de familias gasta mú de $3 000 al alío $CSUros? ¿~lh de S4 000? ¿Entre S700 y SI 500? = 62 DISTRIBUCIÓN NORMAL Probablemente la más conocida y empleada de todas las distribuciones es la distribución normal ajusta a numerosas caractertsticas humanas como la estatura.2UI MI!'. Probabilidad de (205 S X S 220) • ? e. Por otra parte.2 x está uniformemente distribuida sobre un rango de valores de 8 a 21.1 Los valores siguientes están uniformemente distribuidos entre 200 y 240.'HO~ SK. entre otras. ¿Cuál es el valor de f{x) para esta distribución? b. O.ta distribución. Probabilidad de (x < 22) • ? e. a. • aauon oe zoo. coeficiente · lectual ( IQ).o<:JO!. Probabilidad de (x s 225) ? 6. uc el capítulo 18). ejemplo.5. la distribución normal y sus probabilidades asociadas QtJn integradas al control Je procesos cstadisticos (vt. variables mencionadas que e>tán normalmente distribuidas.tribución normal contienen valores de probabilidad para sólo un lado de la disrribucíén porque lo. aniculm producidos o llenados por m!qumas están normalmente distribuidos.a es 1.De Moivrc determinó que la distribución binomial se aproxima a la distribución normal como un limite. Una analogla moderna de la obra de GaUS> podN ser la distribución de mediciones de pina. 'RogrrE. rlw Bc/Mn'iom! Wn<n 1~i. Debido a que la dístribucién es simttrica. d CO>lO de: rentar por pie cuadrado d espado en una bodega y la satisfacción y apoyo de gerentes por la propiedad de una b.4 es una rcpn:smt.4 la curva normal JI Historia de la distribución normal El descubrimiento de la curva de errores normal se acredita por lo general al matematíco y a•trónomo Karl GallS) (17i7-1855)...imttrica.. casi todo. IR~IIRA 6. mucha.CAl'tTULO 6 DlSTRlBUOO!'-"ES 00!'-'ll!>'UAS 189 Muchas variables en negocios e: industria también están normalmente: distribuidas. Adem. Es a•intó1ica al eje horizontal. La distnbucién normal Q ...tribudón normal es sumamente importante. Suttmaf#~-' ~(Sao Dic¡o: twcoun Btaa ~ Plzblishcts. El ma bz. la disrribucién normal o a<intótica al eje: horizontal: e• decir. valol"Q de probabilidad para el otro lado de la distribución son adtn· ticos debido a la ~imetria. La distribucién normal en rcalid. Cuando se toman tamaños muestrales que son sufieieetemen te grandes.. En teoría. por sus ''~u en inglb) son analíudu por la distribución oormal. Cada mitad de la distribución es una imagen reflejada de la otra mitad. • • • • • • Es una distribución continua. ln¡ramy Jotcpb C.6cación media.. Debido a sus difen:n10 aplicaciones." La distribución normal tiene las siguientes características. ~ tssun: A Rt. El área bajo la cur. muchas personas ahora piensan que Abraham de Moivre (1667-17S4). aun cuando las calificaaorxs de exámenes de aptitud escolar (SAT.nun.tan a veces normalmente distribuidos. de variables que: podrían producir mediciones normalmente distribuidu incluyen el costo anual de: ~ro familiar. En menor medida. ti drca toldl baio cualquier distríburi6n normal n 1. E. la distribución normal \C conoce a veces como dísrribuci6rr dt Gauss o cun'll nomraldt mor. producida.ad es coa familia de curvas. de dí:. de modo que el 1otal para una dí:. 0 'lohnA.. . Alguno. el centro de la curva.quien reconoció que los errores de mediciones repetidas de objetos e.ifica de la distribución normal: la curva normal. Es una familia de curvas. BtooLJCok Pllblisbio¡ eo. no toca al eje x )' n sino· pre en ca da dirección. matemárico francb fue el primero en entender la distribución normal. Ademh.tn'bución normal es l. No obstante. CA:. Cada valor único de la media y cada valor único de la desviación estíncLu rcsulu en una curva normal diferente.uión gr. ~lucho~ cuadro. el rango de cahficaeiones en cada parte del SAT o '6lo de 200 a 800. Por ejemplo.. en máquina que a veces proporcionan una curva normal de: error alrededor de una espc:ci.Ucub de cinco punta.wr ¡. también tiene algún credito Pierre-Simón de Laplace {17-i9-1827) por descubrir la distribución normal. lo. A veces la curva normal se conoce como mn·a tn forma dt camparra.. estadi>ticas cst.in normalmente disinbuida» cualquiera que sea la forma de la distribución fundamental de la cual se toman (como se m0>tró c:n el capítulo 7). De ~loi\'l'e trabajó con exactitud asombrosa. unimodal porqae n!otts ~amontonan en una parte de la gráfica.1m¡. Adem.. \lonb. la dil. 1989). Sus valores de tabla publicados pua la curva normal están a sólo unos cuanto) dícunilbímos de lo) cuadros de valores publicados actualmente. • Entcnces.\ que la mayor parte de aplicaciones de la curva normal son experimento) que tienen límites finitos de resultados potenciales.o b curva proporciona lu probabilidades.is de las dininta. Es unimodal. La realidad C'. La figura 6. Kirl. el árt"a de la distribución en ada lado de b mcdia es 0. Es una distribución simétrica alrededor de su media.L-. Debido a que la fórmula tiene esta complejidad ~la para determinar áttaS bajo la curva es un tra engorroso y lento.. Distribución normal estándar Cada par único de valores de ¡1 y a define una distribución normal diferente.. µ•50yt1•5 2.• y t . la distribución z.ui6n estándardt /.14159 . y la doviación c.5 muestra gráficas MISITAB de distribuciones normales para le» ¡iguicntcs tres pares de parámetro : l.µ. una por cada ca::: binación diferente de I' y"· Por fortuna se ideó un mecanismo para que las distribuciones normales puedan convertir en una sola distribución: o decir.10 ~ót~ que todo cambio en un parámetro (µ o '1) determina una distribucién normal diferctr:t. tita caracteri)tica de la curva normal (una familia de curvas) resulta tedio¡¡ euando se analiza la tribución normal porque se requerirían los volúmenes de tablas de curva normales. Prácticamente todo..2.Cualquier valor de x en la media de una z. Una e-tadistica z oúndar se puede usar para encontrar probabilidades para quier problmY de curva normal que se convierta a estadísticas La distríbueíén z es una disrríbu normal ain una media de O y una ~vi. la <!$Udbtica z es po'iti"a. i el valor de x es menor que la media. le» investigadores usan valores de tabla para analizar problnm: de distribución normal en lugar de usar esta fórmula. La figura 6. si el valor de x o más que media.Función de densidad de probabilidad de la distribución normal La distribución normal se caracteriza por do) parámetro»: La media.•. u .71828 .5 J. t-(112ll{i-p)lo)t donde: µ=media de x a • dc~'-Ución otándar de x -:: .J. la estadística z es negativa. la estadística z asociada es ce: Esta fórmula permite la convervién de la distancia de cualquier valor x desde su media. UM'PUm& Curvas normales para tres diferentes combinaciones de medias y desviaciones est~ndar IT o to 20 \'alorax . lai valores de µ y" producen una distribución normal y la función de densidad de la distribución nomli es: f(x)= 1 "ji.. µ "' 50 y o . \'eamO) la fórmula de conversién para cualquier valor x de una tn'bución normal dada: 1 FORMUU: z=x-µ.80 y t1 . y si el valor de x o igual a la media. en unidades dmiación csúndar. o.tándar. a """º La estadistica z es e/ número dt dcsviacionts estándar cuandoun 1·alor x tStá arriba o abajo ih mtdui. el cual proporciona la distribeción normal estándar (o curva). l'tw Jersey lo usan mucho las escuelas de administración para graduado> de Estados Unidos como requisito de admisión.! La figura 6.5. Si se supone que las calificaciones están normalmente distribuidas <e pueden determinar las probabilidades para aleanur calificaciones en diversos rango. como es tan frecuente su uso. Las áreas o probabilidades que se muestran en la tabla 6. Por tanto. Para esta estadística z. el área bajo la curva entre z y O es igual si z es positiva o n~tiva (el ~ipio del valor z designa si la estadü. La regla empírica que vimos en el capitulo 3 se basa en la distribución normal la cual dice que alrededor de 68% de los valores están dentro de una desviación estándar de la medía.94 a» 100 <•> x • 600 (b) . En la parte superior de la tabla t tán los valores de la parte de centésimos de b q• 100 estadística z.3554. sin embargo. es decir: P(494 ::lelcr1peión gráfica del área e:::re una calificación de 600 y l"'edia en un GMAT s xs 6001µ . La parte de numero entero y de décimos de la estadistica z aparecen en la primera columna de la tabla 6. En la tabla 6.06 es . é(a es ti área deseada. cualesquiera que sean los valores de µ y <T. del GMAT. La porción sombreada de la curva de la parte supcrior de la tabla indica que ti valor de probabilidad dado siempr« es la probabilidad o área entre un valor de x y la media.06 100 100 El valor z de 1.2 para z "' 1.494 yq • 100) . 600. Los valores de distribución z de la tabla 6. z=~= (1 x. aproximadamente 68% de los valores z estan entre z • -1 y z = +l. ti valor de centésimos es 6. Hasta hace poco tiempo la calificación media GMAT era de 494 y la desviación estándar era alrededor de 100. Los valores de probabilidad de distribución z se muestran en el apéndice A.2 (la parte 1. El valor de probabilidad de la tabla 6.:? -e presenta una lista de valores de distribución z para a)'Udar a su análisis.7 ' S:tuciones grificas • . la distribución z también está impresa al final de este libro. Un ejemplo es el de los mucho> valores posibles de probabilidad de calificaciones GMAT que se examinan a continuación: El examen de aptitud de administración para graduado> (GMAT. A.. En este ejemplo particular. pro· ducido por ti Educational Te ting Service en Princeton.5 proporciona el área total bajo la curva z entre O y cualquier punto del eje z povirivo. Como la curva es simétrica. En una distribución :. está alciado de 600-494 = 106 =l.6 es una representación gráfica de este problema.normal es cero desviaciones estándar desde la media.3554 de las calificaciones del examen de aptitud de administración para graduados (GMAT) 1 1RGURA'6.á arriba o abajo de la media). ¿Cuál es la probabilidad de que una califica· ción seleccionada al azar ~ entre 600 y la medía?.tica z est.::rot>lern• del :::MAT µ•. Resolución de problemas de curva normal La media y desviación estándar de una distribución normal y la fórmula z y tabla 6. La tabla A.2 hacen posible que un investigador determinelas probabilidades para intervak»de cualesquier valor de una curva normal. La fórmula z da el número de desviaciones estándar que ti valor la media.2 son siempre positivas. por sus siglas en inglés).2 dan la probabilidad de que un \-alor esté entre este valor de x y la media.06 deja ver que la calificación GMAT de 600 es 1. la respuesta es que .0 de esta esta· µ • 494 x 600 dística z).06 desviaciones estándar más que la media. Cualquier valor de x que e<té a una desviación estándar arriba de la media tiene un valor z de l. 2190 .S .4992 .4997 .4319 .1179 2157 .8 1.4971 M79 ..8 0.3907 . estan entre una calificación de 600 y la media de 494.4992 .49153 .6 2.4781 ..4932 .4564 .'944 .4732 .0871 .'962 .41164 .4916 .4121 .4279 .0910 .4991 .4965 .4995 .(7b) muestra la solución en términos de valores z.4625 .4686 .0675 .2224 .4573 .4664 .TABLA 6.4015 .1664 .0398 .2 2. .2704 2734 .47'7 .0832 .4913 .4978 .4941 2.3869 .4989 .4996 .4981 . ..2088 .3264 .4967 .1443 .4'15 .4993 .4934 .4973 .3665 .4943 .7 2.4993 .4750 .4911 ..4731 .4495 .4134 .4993 .4997 .2517 .2 Distribución z ~ o 1 .4803 .4842 .499999999 .1 1.2257 .4463 .)708 .4418 .6 1.7 1.4997 .4979 .4157 .4370 .4974 .3531 .4997 .0557 .4875 .1915 .480 .07S3 .4345 .4192 .4251 .4987 . u figura 6.4U7 .4916 .4916 .4970 .1736 .3186 .4106 . .3 3.4969 .4783 .41n .1144 .494S .1 3.3980 .2324 .4994 ..0279 .s 0..4830 .3212 .S 5.3599 .1141 .4920 .0 1.4904 .7 0.4 3.2 .0987 .4990 .4082 .4991 ..4406 .0359 .4693 .4484 .4990 .4 1.4977 .4535 .0517 .4974 .4332 .3554 .3106 .4956 .3997 .4966 .4906 .4608 ..4871 .2823 .4671 .4878 .0 6.4931 .23S7 . .1700 .1293 .2673 .4981 .49J7 .3315 .0714 .4901 .4994 .l939 .4998 4.4996 .4972 .4960 .4452 A5S4 .4994 .1950 .4922 .1026 .1591 .2852 .os .1103 .4814 .3749 .00 UI G.4975 .4951 .3645 .3577 .2454 .49113 .0596 .4850 .3770 .2 1..4982 . u figura 6.2881 .8 .2642 .0478 .4312 .3621 .1 0.4990 .S .1255 .4936 .49997 .cm .0 4.49'11 .0948 .3238 .3078 .3729 ..4778 .wn .4505 .2 0.4394 .1808 .4357 .0 3.2054 .1n2 .4991 .4961 .4793 .4911 .41611 .4912 .0120 .4474 .4994 .3485 .4946 .4146 .3 t.4964 .9 1.499997 .4925 .4831 .4049 .4147 .4953 .3849 .1628 .4962 . .2422 .1217 .0 .4207 .3 1.4984 4981 .3051 .4987 .2967 .4941 .4222 .4994 .0040 .4112 .6 0.9 U) 2.4808 .4896 .0431 .4525 .o 0.1179 .2123 .0080 .3438 .4811 .0793 .4429 .4756 .4131 .J413 .4515 .4977 .2995 .7(a) describe gráficamente la solu en términos de valores x.4099 .0160 .4992 .0199 .2291 .4117 .4909 .4999997 .4719 .4671 .3461 ...4995 .0636 0#1 .4940 .4292 .3925 .1517 .4995 .1331 .4656 ..4976 2. .4 2.4162 .4154 .4115 .2019 .1 2.4306 .2549 . .2764 .3810 .4993 3.4957 .0239 .4998 i.4992 .4193 .4961 .3159 .40J2 .4995 .4591 .1406 .4995 .4761 .2389 .4959 .1554 .4952 .4955 .1368 .84 o.4726 .4126 ...4649 .4996 .4980 .02 UJ 0.3790 .5 1..3289 .3830 .4996 .4911 .2'11 .1480 .2580 .2486 .9 3.4987 .4265 .4582 .4996 .4066 .4699 .4927 .1064 .3)40 .4995 .2794 .4915 .3188 .4791 .3399 .l686 ..OJl9 .4 o.4191 2.4997 .wn .0000 .4931 .4997 .3508 .J02J .4996 . SEGUNDO WGAR Dll!CIMAL EN s • o.4441 .4599 .4S4S 3365 .1985 .4949 ..3 0.4744 .4713 .313) .4161 .2910 ..4929 .4236 .4633 .4641 .4616 . La estadística z para este problema es: Z• X-µ (T 700 494 100 206 100 2. Et resultado es . que es la cola de la distribución.4 1 2 • lb) l•I PROBLEMA DE DEMOSTRACIÓN z.0197 Nótese que un intento pare deter· minar el área de x '1' 700 en lugar de x > 700 no seria diferente porque en distribuciones eontinuas. Un segmento de recta no tiene ancho y por tanto no tiene área .5000 el valor de probabilidad de . . Para el mismo examen GMAT. ¿cuál es la probabilidad pera sacar al azar una calrfic. Encontrar la probabilidad de obtener una calificación mayor de 700.3 ¿Cu61 es la probabilidad de obtener una calificación mayor a 700 en un examen GMAT que tiene una media de 494 y una desviación estándar de 1007 Suponga que tas calificaciones GMAT están normalmente distribuidas.0197 (probabilidad de x mayor que 7001 -L~O~(probabilidad de x entre 700 y la medial La solución se describe gráficamente en (al para valores x y en (bl para valores z•O 6.06 Dl~TRIBUCIOS~CO'lm:O."UAS 193 PROBLEMA DE DEMOSTRACIÓN 6.ción que su 5500 menos? P(x s 550jµ • 494 y tr • 1001 7 .2 se proporciona una probabilidad de 4803 pare la estadística t.5000 del área.4803 porque cada mitad de ta distribución contiene . Plx > 7001µ • 494 y " '9' 100 cr • 1001 7 Soludón Examine el siguiente diagrama.CAPm:l. requiere restar a . el área ba10 un número exacto como es x 700 es cero. q Este problema pide determinar el área de la cola superior de la distribución. 5000 (probabilidad de x mayor que la medial . que es el valor necesario para saber la probabilidad de sacar al atar un GMAT con una calificación entre ta media y 700.06 En la tibia 6. 100) .7123 (probabilidad de valores s 550) :t.1ill Esta solución se describe gráficamente en a) para valores x y en b) para valores z: µ..5000 » los valores son menores a la media. tT 494 100 X 550 z •O (•) PROBLEMA DE DEMOSTRACIÓN ó. .56 es . • '94 tT 100 La fórmula z proporciona X • 550 el érea entre 550 y la media. • '94 v • 100 La estadística z para este problema es: ..2123 es la probabilidad de obtener una califi~ entre 550 y la media.? Solud6n En la siguiente curva se comprueba que el problema es determinar el érea de la cola inferior la distribución: X• 400 µ.0. la probabilidad de x s 550 se encuentra como sigue: .5000 (probabilidad de valores menores que la medial (probabilidad de valores entre 550 y la media) .'EGOCJOS Solución Veamos un bosquejo de este problema y determine el érea bajo la curva para todos los valOfm menores que o iguales a 550. µ.e o iguales a 550 requiere incluir los valores menores a la media.56 El érea bajo la curva para z ..5 z» 0. 550 494 56 100 • 100 l 0.494 y u ..56 (b) ¿Cuél es la probabilidad para obtener una calificación menor a 400 en el mismo examen GMA!? P(x < 400!µ..194 ESTADISTICA EN LOS ¡.. obtener la probabilidad para todos los valores menores q. Debido a que la mitad o . No obstante. 3264.94.94 100 .6 V • 100) • 7 Las curvas describen gráficamente el problema. El signo negetivo del valor z simplemente indica que el éree esté en el ledo izquierdo de 11 distribución. .2 proporcione une probebi· lidad de .E.500 para obtener 11 respueste. 11 solución se muestre en 1) p1r1 valores x·~ µ.94 100 100 Nótese que el valor z es negetivo._. ~ . el cual indice que el valor x esté 1b1jo de 11 med11 y el valor z esté sobre el ledo izquierdo de le distribución. l• -0. de modo que 11 probabilidad. determinar el érea entre x • 300y x • 600. El problema es encontrar el éree de 11 cole inferior de 11 distribución. este problema debe trabajarse como dos problemas separados y los resultados combinados. como 11 distribución normal es simétrica. En 11 tibia 6.z !!.9• (el PROBLEMA DE DEMOSTRACIÓN 1 •o lb) ¿Cu61 es 11 prob1bilid1d de obtener 11 azar une calificación entre 300y 600 en el examen GMATI /'1300< X< 600 µ.3264 pare un valor z de . las prob1bilid1des pera valores zen el ledo izquierdo de 11 distribución son les mismas que los valores sobre el lado derecho de 11 dis· tribución.5000 (probabilidad de valor menor que 11 medial (probabilidad de valor entre 400 y 11 medial 1736 (probabilidad de valor menor 1 4001 Gráficamente. Debido 1 que les áreas de la distribución z se obtienen con rala· ción 1 la media.• '9• tr • 100 x y en b) pare valores z. pero. Ninguno de los valores z de 11 t1bl1 6 2 es negativo. • 494 y 6. que abarca el valor medio. (T 400-494--94--0. es decir. Se determine une estadística z pare cede valor x.06 100 100 l y x-µ z---(T 300-494 100 -194 -----1. debe restarse de . • 600 494 -~-1. Le probabilidad es siempre positiva. la probabilidad para z ... . x•300 µ.8292 (probabilidad de un valor entre 300 y 6001 GrMicamente.94 es 0. La sustracción proporciona la solución. & X - 350 X • I 450 µ... 4251 (probabilidad de un valor entre 350 y la medial ::.44 es . bilidades de cada valor x deben determinarse y encontrar la probabilidad final al determinar diferencia entre las dos áreas.7 Solud6n La siguiente curva muestra que la solución del problema determina el área de la porción s.4251. ción de P(300< x < 6001 se obtiene al sumar las probabilidades.44 100 100 z 450 494 100 (T V La probabilidad asociada con z La probabilidad asociada con z • -44 -=-0. la solución se muestra en a) para valores x y en bl para valores z.94 (al PROBLEMA DE DEMOSTRACIÓN (bl ¿Cuáles la probabilidad de obtener una calificación entre 350 y 450 en el mismo examen G~.1700. -0.1001 • ? 6.2551 (probabilidad de un valor entre 350 y 4501 .3554. los dos valores x están sobre el mismo lado de la media. breada en la mitad inferior de la curva. La sot. ~ .-r P(350 <X< 4501µ .-1.06 es .4738.JlQQ (probabilidad de un valor entre 450 y la medial ." L05 :--EGOCIOS La probabilidad para z • 1. • 494 s•100 600 X • l 1. 494 tT • 100 En este problema. Las áreas o proti.:.44 es . z---x-µ 350 494 =~--1.44 100 -1.494 y U .3554 (probabilidad de un valor entre la media y 6001 (probabilidad de un valor entre la media y 3001 .196 ESrADlSTICA f. publican totales de gastos de viaje diarios. Argentina.11.21. x..04.04 El costo medio de gastos de viaje diarios para un viaje de negocios en Buenos aires es de $409.5449-µ $36 y µ • $449- ($361(1. del valor xde $449 y el valor ude S36 permite resolver algebraicamante la media.8 bl para valores t. .2 está asociada con el valor z de 1. son menores a $449 y si la desviación estándar de costos de gastos de viaje diarios es $36. se dan la desviación estándar y un valor x. Solud6n En este problema.U z•O lb) l•I PROBLEMA DE DEMOSTRACIÓN 6. El otro 50% de los costos de gastos de viaje d1a· ríos están en la mitad inferior de la distribución. Si 86. En este problema. Debido a que 86. la solución se muestra en al para valores z -1.3665 de los valores entre el valor x y la media. l • !:.65% de los valores son menores a x • $449. En particular. debe determinarse una de ellas. se dan sólo dos de las cuatro variables. Este valor t es positivo.11.111 • $449- $3996 • $409. ¿Qué valor z está asociado con esta área? Esta área o probabilidad de . Runzheimer lnternational publica costos de viajes de negocios para varias ciudades del mundo. u y t.3665 que se muestra en la tabla 6._t! (T 1. porque está en la mitad superior de la distribución. ¿cuál es el promedio de costo de gastos de viaje diarios en Buenos Aires? Suponga que los costos de gastos de viaje diarios están normalmente distribuidos. Debido a que es imposible resolver una ecuación con dos incógnitas.x y en Gréficamente. 36 65% de los costos de gas· tos de viaje diarios son entre $449 y la media. El U$O del valor zde 1.11. que representan los costos promedios para el viajero típico de negocios incluyendo tres comidas al día en restaurantes clase de nego· cios y alojamiento con terifa por persona en hoteles y moteles de clase de negocios. La conversión del porcentaje a una proporción proporciona . el objeto es determinar el valor de la media.U / z• --0. p. El examen de la fórmula de la estadística z revela cuatro variables. El valor de t puede determinarse con la tabla de distribución normal (véase la tabla 6.65% de los costos de gastos de viaje diarios en Buenos Aires. 58 ...6772 de los valores son mayores que x..2 muestra que la probabilidad de . A Sllilal8Nl'IU CDIJLHlVB DD!llllllHll llmml •undud ..S. Siempre que un valor Jr menor que la media.6 5000).. .04 libras..1772 estj asociada con un valor z de Como x es menor que la media..... su valor z asociado es negativo y debe reportarse esl: Al despejar la ecuación z resulta: z .000 ?C . ¿a quj cantidad serla mayor 67. el número promedio de desechos generad°' persona por dia fue 3.1111 e no e.6772 de los valores x sean mayores que ese valor. (-0..... l'nlt PROBLEMA DE DEMOSTRACIÓN 6. . 1 xValue 2 3 450 350 B PYOl>lb<Ltv < X Value 03300 0.Off ud • 100. el valor z en realidad es 0. El problema es peíar un valor x cuando .. J ••• 2$11 La U.. Durante un afio..0749 9 PYob 1350 < X < 4501 - 0.. con una desviación estjndar de 1. Suponga que la cantidad diaria de desechos generada por sona estj normalmente distribuida...46)(1.2551 . entonces .9 a uo.~ . e .. Environmental Protection Agency publica cifras respecto a la generación de d sólidos en Estados Unidos..u . (T -046-~ 1. 67..10 Por tanto.58 libras. De las ca des diarias de desechos generadas por persona..10 libras.46.... 3.04) 3. vt.72%7 Solvclón Se proporcionan la media y desviación ostjndar pero x y z son incógnitas.. !!.. .. .TABLA td Salida Excel y MINrTAB para distribución normal .04 y X . La tabla 6....:J!. Si .1772 estj entre x y la media (.72% da la cantidad promedio diaria de desechos sólidos por persona P8A de 3. • tucncm •M. mensuales de telefono celular estan normalmente distribuidas. Uso de la computadora para resolver probabilidades de distribución normal Tan10 Excel como ~llNITAB se pueden usar para resolver probabilidades de distribucién normal.u= 12.t> desde la izquierda. el promedio local de la cuenu mensual de un teléfono celular" S42.u""ll.fi·!+M•-------------------sis1ema de elm•CftU!miato TomplúN AS1ociata ttalizó una mcuau nacional desistemas de alnw:awnimto en E. ¡Cual e. probabilidades p.xi!:liO 6. mida 111'1de60 mil pies cuadrados (unos S 600 mZ) o tenga una altura libtt entre 20 y 25 pits.'C < 350). En cada caso.46 < z :S 2.8•. Los a1maanes vartan en tamaAo pm> d tamalto promedio es de llll06 50 mil pies cUldndos (4 600 m2 aproximadmimte). es posiblt usar t«nicas pmmtadas en esta sección para dcttrminar. este problema se resuelve de manera manual con la salida de computadora al encontrar la diferencia en Ptx < 450) y Pl. (Qué probabilidad existe de que la altura libre sea mayor de 13 pies? c. dato& interesantes.u=4.3 se ilustran '3lídas Excei y ~11!'/ITAB para la pregunta de proba· bilidad abordada en el problema de demostración 6.t> altul'3$ libres e. por tjmiplo. µ~48.2 PROBLEMAS 6. z i!: 1.tán normalmente d1Stnbuídas v que la desviación e.4.9.8 Tompkiru Assodates reporta que la altura libre media para un almacén Clase A en Estados Unidos es de 22 pi".Oll c. las dimmsioncs de ésw y sus alturas libra esún normalmente distribuidas.. ~Qui aspecto presenta d a1macál bodega •promedio•? u construcción de nua'OI almacala está restringida por COSIOS prohibitivos. 10.7 Determine la. la probabilidad de que la altura libre sea mayor de 1 i pies? b."C<20 C.8. 100 :S X< 150 d.1rr As<\Odation. z<0. Suponga que las tdadcs de bodegas. a. . -2. C1.73 c. la edad promedio de una bodega es 19 a6o6. -1. Para visualiur esta bodega •promedio': imaginanol qix es un cuadrado con 224 pies por lado o un l'KÚngWo de 500 pies por 100 pies..tándar e. 604.67 :S z :S l. µ=37.6 Determine: la probabilidad o área para las porcione de la distribución normal descrua . u altura libre prome- dio de una bodega en Eludos Unidos es de 22 pies. 250 <X< 255 e.ira los ~iguitntcs problemas de dístríbucién normal.CI = 33.96 b.•Hº·lfii!fijlH. el paquete de computadora usaµ. con una desviación estándar de SI 1. . . .7: P(350 < x < 4501µ • 494yua100). µ=156.2. µ .siados Unidos cuyo multado m~ló mucho. Con d uso de valora medios ya <Wfos y la desviaciones esúndar.05 < z :s -0. Quizá por esa razón. C1 = 56.'C s 635 b. El listam de almacmamiento es una industria de trabajo intauo que rtpmmta una gran oportunidad para mejorar la productividad. la probabilidad de que una bodega sd«cionada al aur tenga mmos de 15 allos de anngOedad.87 6.. Jl = 264.i8. Al azar se selecciona un almacén Clase A en Estad<» Crudos.35..84 d.x>35 f.35.¡¡111Mi[. Suponga que las cuenta• locale.9 Según la CcUular Tdecommunications Jndu. ¡Cuil es la probabilidad de que la altura libre sea entre ~5 y 31 pies? 6. C1 y ti valor de x para calcular una probabilidad acumulativa desde la izquierda. En la tabla 6. Como los dos paquetes proporcionan probabilidades junt. Suponga que l.. 4 pi". Jl = 111. i. de un allo promediaron SI en devoluciones para contribuyente. ¿Cu. son mb de mil. Suponga que la desviación estándar se desconoce.i entre SSO y 20 mil? d. Si i. Suponga que estos cestos están normalmente distribuidos. ¿Qut proporción de lo. ¿üúl o la probabilidad de que una cuenta seleccionada al azar de teléfono celular sea mur S30 y sso: c. Labor Depart estima que el coste promedio de esta afección a empleados y aseguradores es alrededor de S30 por trabaiador lesionado."' 10.14 6.35% de los valores son menores a 300.8 se desconoce pero la median t 22 pies .97% de lo.82% de lo.indar es toda\1a S9 ¿Cuinto serla el costo promedio si 79.il es el valor de la altura libre m 29% de lo> almacenes Clase A de Estado> Unidos tienen una altura libre menor a 20 pies? La información acumulada por la l'ational Climatic Data Cerner muestra que el promedie velocidad del viente en milla.4% de todo> lo> almacenes Cluc A de Estado.1 S 6.in normalmente distribuidas. Suponga q11C ta.i.ayores a ¿Ctúl es el valor de Jt? b. el rendimiento de impuesto.200 ESTADtsnC. ¿. b.indar? Suponga que la altura libre media de todos los almacenes Cla~ A de Estados Unidos se d.il o la desviación estándar de la velocidad del viento en St. ¿CuL el valor de a? Suponga que la desviacién estándar parad problema 6. Una enfermedad. con una desviación estándar de $725. x es mayor que 55% de lo> valore» Resuelve los siguientes problemas y suponga que los datos están normalmente distribuido$.16 a. a.45% del tiempo las mediciones de la velocidad del viento son más de 11. y ~lo 13.iñc:o Si 22. 6. costos e•tán entre S 15 y 45 miU b. ~tissouñ. La desvíacién estándar de la distnbucién es 12. Determine el valorde x a de la siguiente información. Una explicación para esta cantidad es que los contribuy« tes preferirían que ti gobierno lo retenga mucho dinero durante el olio que deberle dinero 1 de año.e. por hora para St.75? b. ¿Que proporción de rendimientos de impuestos muestra que el contribuyente adeudad' al goblemo! c. pero 90. a. y 71. e. El U. d. cienes de la velocidad del viento esran normalmente distribuidas para un lugar geogr. ¿Qut proporción de costos ot. iNIGOCIOS ¿Ctúl o la probabilidad de que una cuenta "Seleccionada al aur de teléfono celular sea nm de S67. Suponga que se desconoce el valor medio. de impuestos muestra una devolución entre S 100 y S L 6.12 Supongamos que el lector e. a. cono.13 6. cst. ¿Qué proporción de rendimiento. 22% de lo> valores son menores que x. Suponga que la cantidad promedio de impuesto para fmales del año es una dC''Olución SI 332. La media de la distribución es 352. Louís! .ijadoro que laboran con herramientM mio propensos a lesiones rdadonadas con oficio. tienen una altura libre a 185 pies.u o que deben en devoluciones de impuesto.U o la probabilidad de que una cuenta seleccionada al azar de teléfono celular no $C'3 ma de S25? d.U trabajando con un conjunto de datos que cstj normalmente tribuido. con una medía de 200 y una desviación estándar de 47. 9.¡co. Unido. x es menor que 17% de los valoro. ¿Ctúl o la probabilidad de que una cuenta seleccionada al azar de teléfono celular sean::: S45 y S55? 6.uá( es la desviación est. ¿Cu. Suponga que lu cantidades adeudad.6 mil~ por ¿cu.56. causada por rcalilar esfuerzo» con las manos y mul'l«a• se conoce síndrome de túnel carpiano y afC(ta hasta a 2J mil trabajadores al afio.S. ¿Qut proporción de los costos es mayor a SSO mm c. pero la desviación ot. valores son m. con desviación cstindar de S9 mil.11 ~ trab. ¿Cuál serla el valor de la desviación estándar] e.A E.10 Segtln el lnternal Revenue Service.95% de los costos fuera menos de S33 miU 6. ¿Qué proporción de rendimientos de impuestos muestra una devolución mayor a S2 mil' b.:=-• pero se sabe que la desviación estándar es de: 4 píes.2. c. 60% de IO$ valores son mayor~ que x. Louis. .2 llcga <6lo a n • 25. la gráfica e> relativamente simétrica alrededor de la media (µ "' n · p .20) presentada en la figura 6. 20) porque suficientes y posibles valores de resultado a la izquierda de x ._~-- o FIGURA 6.04 . . como en la distribución binomial (tt • 100 y p • .._. la gr~fica binomial es muy parecida a una curva normal..1 OL-. cualesquiera quC' sea d valor de p.l--L. Este fenómeno ocurre mis rápido (para valores más pequeños den) cuando p está cerca de .09 ._-'-'--'--12 13 14 IS 16 17 18 19 20 21 22 23 24 25 26 27 28 29 \'alorcsx ._...S aun cuando el tamal'lo muestral..__. La gráfica de la figura 6..20 . las distribuciones binomiales se aproximan a la distribución normal en forma.....9 o 2 3 4 5 6 7 8 9 10 VaJon:.SO. No obstante.10 ~ - . 20 permiten que la curva caiga al eje x..10. por fortuna. Cuando los tamaños muesuales son mur grandes.X .--L--1~'---'--'--'-__JL-. Para valores grandes de n.8 a la 6.__. mu) grande'... el valor esperado es <61o 2 y las probabilidades <e acumulan en x •O y 1.. Las figuras6.10 :>istribución t.08 . ~in embargo. La tabla del Aptndicc A. la distribución normal <e puede usar pau calcular aproximadamente las probabilidades.03 .3 Distribución binomial para n • 10 y p . nomial para 100y p • . 10 y p a ._.L--'--'-_.20) está sesgada a la derecha debido al bajo valor p y el pequeño tamaño. Es importante saber que debido al 1amaño de las factoriales in"olucrados <e dC'bcrí usar calculadora para resol"« los problemas binomiales cuando n e:.__. . 11..CAl'lnlW 6 DI~ TRIBl.01 O'-'l.02 .07 i:: .'"'--'-'--'L.9 (n . una Distribución binomial para n • 10y p 50 .equcen la figura 6. cuando tt es suficientemente grande. C'> ~lo 10.'CIO~E. lo cual multa diftcil o imposible..20 2 3 4 5 6 7 8 9 10 \'alorn x .3 USO DE LA CURVA NORMAL PARA CALCULAR APROXIMADAMENTE PROBLEMAS DE DISTRIBUCIÓN BINOMIAL Para cienos tipos de problemas de dis1ribución binomial.2 1 .. o ~URA 6. la distribucién binomial e.3 i .. Para esta distribución.. ~óte:.10 muestran tres distribuciones binomiales..1 ] c. dificil de analizar sin una computadora..2 . tenemos que la distnbucion normal e.' CO~'TISUA!> 201 6.. 110 uu la distribución n para resolver un problema binomial porque la aproximación no es suficientemente buena. ¿se encuentra entre O y n? Recordemos que la regla emptrica expresa que aproximadamente 99.65 µ ::!: 30' Este intervalc se encuentra entre O y 60 de modo que la aproximación es s para permitir el uso de la curva normal.50 -. de una distribución binomial. n y p.50 +..2 se puede usar para resolver el blema. nue el procedimiento.so µ • n · p • (60) (.50y-. res vamente. ..30 ~ 1:.ll ul l l~.:: 30'.os o. ·~· IS 3S \'alorax FIGURA 6....7%.50 +.35 s µ ::!: 3a s 28. x> rll!: r< rs :SrS <r< .202 ESTAI>bTICA v. La figura 6. Para trabajar un problema binomial con la curva normal se requiere un proceso traslación.10 problema binomial: n • 60y p • ..'..12 Gr6fica de solución aparente de problema binomial trabajado por la curva normal buena aproximación para problemas de distribución binomial para valores den.55) .e• +. Este proas utiliza fórmulas que se vieron en el capuulo 5: µ•n·pya•Vñ7M Ahora deberá realiza~ una prueba para determinar s1 la distribución normal es aprox. ro:ótese el gran parecido a la curva normal. 18 y a= 3.:. P(x ~ 25ln • 60 y p • .50 -. Otra rtgla práctica para determinar cuándo 11$1r la curva normal para ap mar un problema binomial es que la aproximacién es buena lo suficiente si n · p > 5 y n · q > 5. todos lo> valores de una curva normal otán dentro de tres desviaciones estándar ck media.55 El problema binomial se convierte en un problema de curva normal: P(x ~ 251µ .o o. La figura 6.madón suficientemente buena de la distribución binomial: µ• 18 a « 3.<lación de un problema binomial a un problema de curva normal se o TABLA 6..4 Reglas pr6cticas para la corrección de continuidad v.55) •? Ahora se deberá determinar <i la curva normal se ajusta lo suficiente a esta dís cien binomial para justificar el uso de la cun-a normal.50 -. úm demostración de que la curva normal es una buena aproximación para un problema binomial. Si µ :!: 30' no est.30) • 18 y a= Vñ"7H • 3. = 18 ::!: 3(3. uu. .501 +.llllaa .65 7..:. dos parametros de la distribución normal.30) • ? :-:ótoe que este problema binomial contiene un tarnaflo muestra! relativamente y que ninguna de las tablas binomiales del Apéndice A.:...i. a lo. LOS SEGOOOS hM'M'Mi • Gr6fica del 0. Para que una aproximación de curva normal de un problema de distribución sea acep todo> los posibles valores de x deben estar entre O y n.11 es una gráfica MINITAB de bU tribución binomial.50 -.á entre O y n.. es decir. que son lo> límites inferior y superior..55 x2:25 El intervalo de µ . La primera parte de este proceso es convertir I<» dos parámetros de una di bución binomial. De la ua.50r +...12 es la aparente de la versión de curva normal a este problema. µ y a. El proceso se puede ilustrar en la solución del problema de distribución binomial. 18 :!: 10.1111'-'-'-'11 '" '.oo~. Este problema o un buen ejemplo para 11$1r la di>tribución normal. cornac 6 : Fi(füp 6.13 Grifica de una porción del problema binomial: n • 60 y p • .30 .a .12 .ti .10 .09 .08 ~ .06 j OlmtBUOOS'E.SCO~'TL'IUAS 203 .B .07 .os .04 .03 .02 .01 o . 1 1 1 13 14 IS 16 17 18 19 20 21 22 23 24 25 26 Valorux Corrección para continuidad La traslación de una dístribución discreta a una distribución continua no es del todo íkil. Se requiere una corrección de +.50 o - .50 o :!:.50, dependiendo del problema. Esta corrección asegura que la mayor parte de la información del problema binomial está correctamente transferida al an.Uis~ de curva normal y se conoce como correcclón pan continuidad que ~ haa durant« la amvrni6n dt una disrribuci6n discma a una disrribua6n continua. La figura 6.13 es una parte de la grifica de la distribución binomial, n • 60 y p • .30. Nót~ que con una distribución binomial todas las probabilidades están concentradas en numeres enteros. Por tanto, las respuestas para x ~ 25 se encuentran al sumar las probabilidades , FIGURA 6.14 para x • 25, 26, 27, ••. , 60. No hay valores entre 24 y 25, 25 y 26, ••.• 59 y 60, pero la dls· tribución normal es continua, y hay valores presentes a lo largo del eje x, Debe hacerse Gráfica de la solución al una corrección para esta discrepancia para que la aproximación sea tan precisa como <ca :~blema binomial resuelto posible. . r la curva normal Como analogfa, visualice el proceso de fundir varillas de hierro en un horno. w vsriUas de hierro son como los valores de probabilidad en cada número entero de una distribución binomial. Nóte-.e que la gráfica binomial de la figura 6.13 parece una serie de \'lnllas de hierro en una linea. Cuando las varillas se colocan en un horno se funden y dispersan. Cada varilla se funde y se mueve para llenar el área entre ella y las varillas adyaccn· res, El resultado es una 14mina continua de hierro <ólido (hierro continuo) que se partee a la curva normal. La fusión de las varillas es análoga a dispe~r la distribución binomial para aproximar la distribución normal. ¿Qu~ distancia se dispersa cada varilla hacia las otru? Una buena estimación es que cada varilla avanza mis o menos a media distancia hacia las varillas adyacentes. En otras TABLA 6.5 palabras, la varilla que estaba concentrada en x • 25 se dispersa para cubrir el área de ~4.5 a 25.5; x • 26 se conviene en continua de 25.5 a 26.5 y asl sucesivamente. Para el probleValores de probabilidad para ma P(x ~ 25ln • 60 y p • .30), la conversión a un problema de curva normal continua el problema binomial: n • 60, da P(x ~ 24.51µ • 18 y <T • 3.55). La corrección para la continuidad es de -.50 porque p • .30 y X Z: 25 el problema cxígla la inclusión del valor de 25 junto con todos lo valores más grandes; d v.ilrS F1 J' ero e valor binomial de x .. 25 se traslada al valor de curva normal de 24.5 a 25.5. 1 el proble.0167 2S ma binomial hubiera sido analizar P(x > 25), la corrección hubiera sido ~.SO. que ruclu 26 .11116 en un problema de curva normal de P(x 2 25.5). El último ca~ empeurla en más ck 25 r1 porque el valor de 25 no estarla incluido. La decisión en cuanto a cómo corregir para continuidad depende del 51px> de igua)28 dad y la dirección de los resultados deseados de la distribución binomW. La tabla 6..4 es cm 29 .Gll2 lísta de algunas reglas pricticas que pueden ayudar en la aplicación de b corrección para JIDD5 continuidad. )1 JIOIZ Para el problema binomial P(x 2 25ln • 60 y p • .30), b run'I oormaJ 5C convime 32 en P(x 2 24.51µ • 18 y a= 3.55), como <e ve en la figura ~.H y ... .- '° 3) .. z: 25 ...-· .AB61 z= x-µ <1 = 24.5-18 3.55 =l.83 204 f~TAI>ISTICA L" Lo:. :-;EGQCJOS La probabilidad (véase la tabla 6.2) de este valor z es .4664. la respuesta a este problema está en cola de la distribución de modo que la respuesta final se obtiene al restar: ~ .5000 .0336 Si este problema se hubiera trabajado con la fórmula binomial, la solueién hubiera sido como ve en la tabla 6.5. la diferencia entre la aproximación de la distribución normal y los valores binoim. les reales es de sólo .0025 (.0361 - .0336). PROBLEMA DE DEMOSTRACIÓN 6.10 Resuelve el siguiente problema de distribución binomial con el uso de le distribución normal. Plx 12ln • 25 y p • ·'º' • 1 Solud6n Encuentre p. y u. p.• n • p • (25)(.40) u• .Jn·p q = 10.0 Jl25)(.40)(.60) 2.45 Pruebe µ :t Ju• 10.0 :t 3(2.45) • 2.65 en 17.35 Este rengo se ubica entre O y 25, de modo que le aproximación es suficientemente cerca,.&. A continuación corrija para continuidad. Como el problema es determinar le probabilidad de qur x sea exactamente 12, la corrección supone .50 y • .50. Esto es, una probabilidad binomial e x• 12 se traslada a un 6rea de curve normal continua que est6 entre 11.5 y 12.5. Veamos la gr .. fice del problema: ¡; - 10 v• 2.45 12.5 " n.s Entonces z---x-µ (T y Z IS !!::J!.. = ~ (T 2.45 0.61 z • 1.02 produce une probabilidad de .3,61. z • 0.61 produce una probabílídad de .2291. De la diferencia entre las 6reas se obtiene le siguiente respuesta: .3,61 - .2291 - .1170 Si este problema hubiera sido resuelto con el uso de los cuadros binomiales. la respuem seria .11'. La diferencia entre la aproximación de la curva normal y el valor obtenido con el usar los cuadros es sólo .003. PROBLEMA DE DEMOSTRACIÓN 6.11 Resuelve el siguiente problema de distribución binomial con el uso de la distribución normal. P{x < 27ln 100 y p 371 1 CAPtnno 6 DISTIUBU00'-1:' CO'-'TISI;\S 205 Solud6n Como n1 el tamaflo muestra! ni el valor p están contenidos en la tabla del Apéndice A2. entonces resolver este problema con las t6cnicas de distribución binomial no es práctico. Es un buen candidato para la curva normal. Del ~lculo de µ. y u se obtiene: µ. • n · p • (100)(.37) • 37.0 u• Jn·p ·q • .J(lOOl(.37)(.631 •4.83 La prueba para determinar la cercanía a la aproximación es: µ.:: 3tr - 37:: 3(4.831 - 37:: 14 49 El rango 22.51 a 51.49 es" entre O y 100. Este problema satisface las condiciones de la prueba. Ahora, corrija para continuidad: x < 27 como un problema binomial se traslada a x s 26.5 como un problema de distribución normal. Veamos la gráfica del problema: x:.28.5 µ • 37 u• •83 Entonces, Z= X-µ= (T 26.5-37 =-2,1? 4.83 La tabla 6.2 muestra una probabilidad de .4850 y al resolver la cola de distribución se obtiene: .500 - .4850 - .0150 que es la respuesta. Si este problema se hubiera resuelto con el uso de la fórmula binomial, las probabilidades serian las siguientes: Velor " 26 25 2• 23 22 21 20 x< 27 l'fobebillded .0059 .0035 .0019 .0010 .0005 0002 ..2!!!U .0131 La respuesta obtenida con el uso de la aproximación de curva normal 1.01501 se compara favorablemente a esta respuesta binomial exacta. La diferencia es sólo .0019. 6.3 PROBLEMAS 6.17 Convierta los siguientes problemas de distribución binomial en problmw de dutribua6n normal. Use la correccien para continuidad, a. P(x s 16ln • 30 y p • .70) b. P(IO<xS20ln•25yp•.SO) c. P(x • 22jn .. 40 y p • .60) d. P(x>14lrr•l6yp•.~5) 206 ESTADISTICA E.>,; 10> :O.'EGOCJOS 6.18 Use la pruebaµ :!: Ja para determinar si las siguientes distribuciones binomiales se pueden aproximar con el uso de la distribución normal. a. n = 8 r p = .os b. n = 18 y p = .80 c. n 12 y p • .30 d. n • 30 y p • .75 e. n = 14 y p • .50 6.19 Donde sea apropiado, trabaje los siguiente; problemas de distribución binomial con el U$O de b curva normal. También, use la ubla del Apéndice A.2 para encontrar las respuestas con el 11)() de la distribución binomial y compare las respuestas obtenidas por los dos métodos. a. Plx - 8lt1 - 25 y p - .40) - ? b. Pix :?! 13ln = 20 y p • .60) • ? c. P(x • 7ln • 15 y p • .50) • ? d. P!x < 3ft1 = 10 y p • .70) • ? 6.20 La Zimmerman Agency realizó una encuesta para Residence Ion by Marrion de agente:> viajeros que realizan ,·iaje> de cinco noches o más. Según esta encuesta, 37% de esto; viajeros di>fru~ ser turistas más que ninguna otra actividad que realizan en casa, Suponga que son entrt\·istadol 120 "iajero> seleccionados al azar que realizan viajes de cinco noches o mas. ¿Cu.ti e. la proNbtlidad de que meno; de 40 disfruten ser turistas más que ninguna otra actividad que no hacen et: as.t? 6.21 Un estudio respecto a satisfaccién de gerente.. con herramientas de administración revela que 5 usan equipo> de trabajo autodirigidos como herramienta de administración. Suponga que entrevistados 70 gerentes seleccionados al azar en Estado. Unidos. ¿Cuál e. la probabilidad de q¡r meno; de 35 utilicen equipo; de trabajo autodirigidos como herramienta de administradón? 6.22 Segun The Yanktt Group. 53% de las casas que tienen televisión por cable y clasifican a e:>t<l> co~ pall1a> como buenas o excelentes respecto a la calidad de transmisión. Se~nla por ciento de casa> que tienen tele\'Í>ión por cable clasifican a e>ta~ compallfas como buenas o excelentes tener personal profe ional. Suponga que al azar son entrevistadas 300 familias de tienen telt\1~ión por cable. a. ¿Cual es la probabilidad de que más de 175 familias que tienen televisión por cable clasifiq= a esta> compamas como buenas o excelente. respecto a la calidad de transmisión! b. ¿Cuál e> la probabilidad de que entre 165 y 170 incluyendo a las familias que tienen telt\is:::: por cable clasifiquen a estas compañías como buenas o excelente> respecto a la calid:td transmisión! c. ¿Cu.1.1 es la probabilidad de que entre 155 y 170 incluyendo a las familias que tienen televi • por cable clavifiquen a estas compalllas como buena. o excelentes respecto a la calidad transmisión! d. ¿Cu~ e> la probabilidad de que menos de 200 familia. incluyendo a l<l> familias que titnc:: televisién por cable clasifiquen a olas compañías como buenas o excelente. como buenas excelentes al tener personel profesional! 6.23 La lntcrnational Data Corporation reporta que Compaq e número uno en participación en mercado de computadoras personales (PC) en Estados Unido), con 16% del mercado. Su que un investigador selecciona al azar 130 compradores recientes de: PC. a. ;Cu.ti e> la probabilidad de que más de 25 compradores de PC compren una Compaq? b. ;Cuál es la probabilidad de que entre 15 y 23 incluyendo a compradores de PC compren Compaq? c. ¿Cuál e> la probabilidad de que meno> de 12 compradores de PC compren una Compaql d. ¿Cuál o la probabilidad de que exactamente 22 compradores de PC compren una Compacf 6.24 Una encuesta acerca de estrategias para competir en el mercado mundial expresa que 52% entrevistado; concuerdan en que la; compalllas nece$ita.n hacer inversiones directas en otros paiseL También expresa que alrededor de 70% de entrevistados e.t.ín de acuerdo con que es atractivo ~ una inversión conjunta para aumentar competitividad mundial Suponga que lo> directores de compalliai. manufactureras se seleccionan al azar acerca de estrategias mundiale, = a. ¿Cuál es la probabilidad de que entre 4-1 y 52 incluyendo a directores estén de acuerdo que las compaAJas deben hacer inversiones directas en otros países! b. c. d. ¿Cuál es la probabilidad de que mú de 56 directores esttn de acuerdo con esa aseveración! ¿Cuál es la probabilidad de que menos de 60 directores estén de acuerdo con que es atractivo tener una inversión conjunta para aumentar competitividad mundial! ¿Cuál es la probabilidad de que entre 55 y 62 di.rectom esttn de acuerdo con e1>a ~-eración' 6.4 DISTRIBUCIÓN EXPONENCIAL Otra distribución continua útil es la distnbución exponencial. Est~ estrechamente relacionada con la distribución de Poisson. Mientras que la distribución de Poisson es discreta y describe sucesos aleatorios en algún intervalo, la distribución exponencial es conrinua y d=riM una disrrib11d6n de probabi· /idad dt los ritmpos entre suce10s akaronos. Las siguientes son características de la distribución exponencial. • Es una distribución continua. • Es una familia de distribuciones. • Está sesgada a la derecha. • Los valores x van de cero a infinito. • Su vértice está siempre en ;e • O. • u curva aumenta continuamente cuando x se hace mas grande. u distribución de probabilidad exponencial está dettrminada por lo siguiente: Fl!NCI NDE OE.'ISIDAD donde; DE PROBABILIDAD }C~ o EXPONE.'ICIAJ. .l>O f(JC) - .A.t-M yt - 2.71828 ... Una distribución exponencial se puede caracterizar por el parámetro A. Cada valor único de .l determina una distribución exponencial diferente, resultando en una familia de distribuciones exponenciales. u figura 6.15 muestra gráficas de distribuciones exponenciales para cuatro valores de .l. Los puntos en la gráfica se determinan al U)ar .l )' díverw. valores de JC en la fórmula de densidad de pro· babilidad. u media de una distribución exponencial esµ • lfA.• y la desviación estándar de una distribucién exponencial es o « 11.A.. Probabilidades de la distribución exponencial U~ probabilidades se calculan para la distribucrén exponencial al determinar el 'rea bajo la curva entre do. puntos. u aplicación de cálculo a la función de densidad de probabilidad exponencial produce una fórmula que se puede usar para calcular las probabilidades de una distribución exponencial. PROBABIUDADES DELA COLA OEJlECHADE LA DISTRJBUCION UPONE.NCW. P(x~.a;.) • ,...., donde; JCo e:: o Para usar esa fórmula se requiere encontrar valores de e-•. Esto• valoresse pueden akular en casi todas las calculadoras o de la tabla del Aptndice A.4, que contiene los valores de e-• para ,-aJores seleccionados de x. JCo es la fracción del intervalo o el numero de intervalos entre llegadas en b pregunu de probabilidad y >. es el pcrcenuje promedio de llegadas. Por ejemplo, las Uegadas de Poisson a un banco están distribuidas con una ;. de l.~ dientes cada minuto. ¿Cuál e. el tiempo promedio entre Uegadas y cuál es la probabilidad de que al meno> ~ nunutos transcurran entre una y otra llegada? Puesto que el intervalo para lambda e. 1 minuto y deseamos 2 11 Jxl 1.2 y solución para x ~ 2 1.XQ es 2.7500 0. La probabilidad de un interv 2 minutos o más entre llegadas se puede calcular con: = P(x.i:=::::=---" L o 2 WW.2 . Expoaeatial vitb .bml A 1 xValue 2 3 0.16.0 Distribución exponencial para ).. transcurrirán entre llegadas al banco.0907.15 J{x) Gráficas de algunas distribuciones exponenciales 2. minutos.. lo> tiempo> entre llegadas y llegadas aleatorias están exponencialmente distribuidos.6 . • 0. La m esta distribución exponencial es µ 1/Á 1/1. como se ve en la figura 6.6448 " conocer la probabilidad de que al menos 2 minutos transcurran entre llegadas (doble el interv lambda).1 llBLA 6. .07% del tiempo cuando en el ritmo de llegadas aleatorias es 1.0 9 8 .?: = 21>..75 8 Probebdaty < x Value 06448 Salida MINrJ'All Cl.4 . o sea 50 segundos. 1.2) = rum '"' . Alrededor de 9.2 por min minutos o más transcurrirán entre llegadas. En promedio.flGURA 6.3 .72'600 P( X<• ) 0.s .2 a .= 1.6 Salida Excel y MINITAB para distribución exponencial .mllatift DlstrillaUcn hnoticn .833 minuto> (50 segundos). P!OSLEMA DE BEMOSTRACIÓN 6. . se puede determinar la probabilidad de que haya 15 minutos o más entre defectos.38 defectos por cada 20 minutos durante lotes de producción. Existe la probabilidad de . }. Por tanto. 1 .49 minutos entre defectos. 0. De los registros de estas pruebas se establece que una pieza defectuosa se presenta en un patrón que está distribuido de Poisson en promedio de 1.3 c. Para determinar la probabilidad de que haya menos de 15 minutos entre defectos. o sea (.7246 1.1 PROBLEMAS 6.. Utilice esta información para determinar la probabilidad de que menos de 15 minutos transcurran entre dos defectos. i...12. De l.6'48 para que menos de 15 minutos transcurran entre dos defectos cuando se tiene un promedio de 1. tribución de Poísson para resolver problemas.8 d.i tabla 6. i. calcule 1 .tigación de operaciones r ciencias administrath-as estas do.7246)(20 minutos) • U. En la ínw.6 se obtienen las salidas Exccl y Ml!'llTAB para la pregunta formulada sobre la probabilidad en el problemade demostración 6.. 1. al azar se seleccionan y prueban piezas.i.6448. Uso de la computadora para determinar probabilidades de distribución exponencial faccl y ~11NITABse puede usar para resolverprobabilidades de distribucién exponencial. En este problema.38 En promedio.1 0. El valor de Xo representa el numero deseado de intervalos entre llegadas o sucesos para la pregunta de probabilidad. En este caso.i sección). La fórmula de probabilidad siempre da la cola derecha de la distribución -en este caso.on se puede usar para analizar la'\ llegadas a b cola. Excel utiliza el valor de A y x. El valor de p.CAPITVLO 6 DISTRIBUOO~U CO~Tl''UAS 209 Este problema recalca el potencial de usar la dístríbución exponencial en coordinación con la <fu. la pregunta de probabilidad comprende 15 minutos y el intervalo es 20 minutos.En cada caso. La distribución de Poi•.3552 • . entre defec· tos. Soludón El valor de A es 1 38 defectos por intervalo de 20 minutos. Con el uso del valor de Xo y el valor de A.49 minutos. es .!. La pregunta aqul es determinar la probabilidad de que haya menos de 15 minutos entre defectos.25 Utilice la fórmula de densidad de probabilidad para trazar las gráficas de Lu sipiícntcs distribuciones exponenciales: . = i..38 defectos por intervalo de 20 minutos o un promedio de 14.7246 del intervalo. Xo es 15120 . = 0.75 de un intervalo.P(x). La probabilidad de . se puede determinar con µ = . la probabilidad de que haya 15 minutos o más entre llegadas. distribuciones se utiliun juntas para resotver problemasde colas (teoría de linfa' de espera).12 Una empresa manufacturera ha panicipado en un control estadistico de calidad durante varios aflos . pero ~111\ITABpideµ (igual a 1/A) y Xo. Como pane del proceso de producción.3.=.0 b. la computadora da la proba· bilidad acumulativa desde la i1quierda (d complemento de lo que da la fórmula de probabíi:dad mostrada en est.3552 es la probabilidad de que al menos 15 minutos transcurrirán entre defectos. = . y la distribución exponencial se puede usar para analizar el tiempo entre llegadas.X = 1. 35) P(x < 3!.26 Determine la media y desviación estándar de las siguientes distribuciones exponenciales: •.. entre otros factores. d. y durante las noches viernes. ¿Cuál es la probabilidad de que dos aviones lleguen con menos de 10 minutos de diferen 6. ¿Cuál es el tiempo promedio entre llegadas de aviones? b.28 El tiempo promedio entre llegadas a una caseta de pago en una autopista es de 23 segundl1 Suponga que el tiempo entre llegadas a la'caseta está distribuido exponencialmente. ¿cuál es la probabilidad de que no apara. Si la llegada de días lluviosos es una distribución de Poisson en esu ciudad durante el mes de agosto.29 Un concurrido restaurante determinó que entre las 6:30 p. determine el númctt promedio de pasajeros entre sucesos. El Air Travel Consumer Repon publicado por el U.25 b. ¿por cuántos años debe garantizar su trabai Suponga que los casos de reparaciones mayores son distribuciones de Poisson..68) P(x > 41. en promedio.i.27 Determine las siguientes probabilidades exponenciales: a.12 aviones por hora.110 ESUDISTICA e-· tos SEGOCIOS 6.m.m.0 6. 0. con el uso de distribución exponencial para analizar este problema. condiciones de humedad. P(x C!: sjA . ). 6.1 d. Suponga acaban de manejar mal un equipaje. ¿Cuál es la probabilidad de que un minuto o más transcurra entre llegadas? b. a. Con base en sus registros. b. 1.i. La compañía sabe que debido a los diversos tipos de suelos. c... Department Transportation reportó que. d.. .. a. la cimentación de una casa nueva no necesitará reparaciones mayores durante anos. Suponga que las quejas por el mal manejo de equipaje son distribuciones de Poisson.7) P(x < 6!. mensurables? ¿Cuál es la desviación estándar? ¿Cuál es la probabilidad durante este mes que~ un periodo de menos de 2 días entre lluvia? .31 La distribución exponencial se puede usar para resolver problemas de Poisson en el que los in~ valos no sean tiempo. b.32 La Foundation Corporation se especializa en construir cimentaciones de concreto para casas nuevas en el sur. las llegadas de clientes según la distribución de Poisson tienen un ritmo promedio de gada de 2.7 c. Si la compailía desea garantizar el trabajo contra reparaciones mayores y satisfacer r«bmaciones a no más de 10% de sus garantías. América West era el primer lugar nacional par tener menos quejas por el mal manejo de equipaje y un ritmo medio de 3.i..S.80) = = 6.= 6.. J..30 Durante el verano en un pequeño aeropuerto privado en el oeste de Nebraska..i. ¿Cuál ¿Cuál ¿Cuál ¿Cuál es la probabilidad de que al es la probabilidad de que al es la probabilidad de que al es el tiempo esperado entre menos 10 minutos transcurran entre llegadas? menos 5 minutos transcurran entre llegadas? menos 1 minuto transcurra entre llegadas? llegadas? 6. Si un auto acaba de pasar por la caseta de pago. c. ¿Cuál es la probabilidad de que al menos 2 horas transcurran entre llegadas de aviones? c. la llegada no ~ gramada de aviones según la distribución de Poisson tienen un ritmo promedio de llegadas 1.=1. la directora de la compañía piensa quc.39 por cada mil ~ jeros. Aho:a bien. = 3. construcción variable.1. en un año reciente. 0. ). y 9:00 p.::a un alto por lo menos en tres minutos? 6.44 por minuto. ¿Cuál es la probabilidad de que el equipaje de al menos 500 pasajeros se maneje correctamente antes se presente la siguiente queja por el mal manejo de equipaje? ¿Cuál es la probabilidad de que número sea menos de 200 pasajeros? 6..33 Durante el mes seco de agosto. = 0. eventualmente la mayor parte de cimentaciones necesitarán reparación mayor. a. una ciudad en Estados Unidos tiene lluvia mensurable en promedio sólo dos dlas por mes. ¿cuál es el numero promedio de días que pasarán entre llu. es posible determinar que la probabilidad de que una persona de Texas seleccionada al azar pague entre $500 y $650 anualmente para seguro de propietario de vivienda es . cada hora son destruidas 1.el tiempo promedio entre casas que son destruidas por incendio es . Suponga que expertos de seguros de vida dicen que en Estados Unidos.5 dando un valor z de 1.2. La media.4535..0465. La probabilidad de que una persona seleccionada al azar pague menos de $400 se puede calcular con las técnicas de la sección 6. si los datos están uniformemente drstribuidos y se conocen los valores mínimo y máximo (a y b).x1 para encontrar el 50% de en medio. b • $740. Los datos pasan la prueba para indicar que la distribución normal serla una aproximación lo suficientemente buena de este problema para usar como herramienta.rifas. Por ejemplo.555 de hora. las preguntas de probabilidad respecto a intervalos particulares se pueden contestar.x1 tendría que ser 417. en promedio.::. x2 • $400 y x1 • $100 como . ¿Entre cuales dos valores esta· ria 50% de en medio de los datos? La diferencia entre a y b es 834. 1. = = = . p .. 20 y x • 21.68con una probabilidad asociada de la tabla de distribución normal estándar como .50 = $482.50 y $899.. Suponga que los costos anuales de seguro de propietario de vivienda están normalmente distribuidos. o sea cada 33. Suponga que la desviación estándar es $78.8 casas por incendio. x2 . Con el uso de las técnicas presentadas en la sección 6. Las técnicas para probar el ajuste de varias distribudones a los datos se presentan en un capitulo más adelante. Suponga que 80 estadounidenses se seleccionan al azar. ¿cuál es la probabilidad de que 21 o más píensen asP. Veinte por ciento de estadounidenses prefieren comprar seguro de vida por teléfono o por correo. E:lpertos de seguros de vida pueden usar estos tipos de probabilidades para asistirlos a fin de esubleca ta. El costo medio en Texas es $592. Con el uso de las técnicas presentadas en la sección 6.3962). b = 1 108). El capitulo 6 presentó técnicas para trabajar problemas binomiales con la distribución normal. Xo "' 1.6514. o sea unos .CAPfruLO 6 DIST'IUBCCIOSES CO~'TlSvAS 211 Los cambiantes rostros de la industria de seguros La encuesta reporta el promedio de gastos para adquirir seguros para automóvil.()6.50.58.. pero. En este problema de distribución binomial. Para que la probabilidad de distribución uniforme sea igual a . es posible determinar que el valor z para x $874 es 1. suponga que las tarifas de seguro anual de automóvil en Estados Unido) van de $274 a SI 108 (a= 274. de propietario de vivienda y todo tipo de seguros.4535.50.1 con a • $100. entonces ). ¿Cuál es la probabilidad de que transcurriría al menos una hora y media entre incendios que des· truyan casas? Con el uso de la distribución exponencial.1038 (.8 casas por hora. Las preguntas de probabilidad se pueden contestar respecto a estos datos si se sabe la manera en que están distribuidos los datos poblacionales. El 50% de en medio está entre $691:!:1/2($417)= $691 :!: $208.5000 . Los datos se convierten en parámetros de distribución normal y resultan enµ • 16 y <T = 3. Si se puede suponer que un incendio es una distríbudón de Poisson. está a la mitad entre a y by también está a la mitad entre x2 . $691. n 80. Otros valore) medios se obtienen para algunos de lo) estados más extremos.5000 .2. El valor de x se corrige a 20. Con el uso de la información presentada en la secoen 6A.J mmutos.4688 Suponga que las tarifas anuales de seguro de automóvil están normalmente distribuidas con una media de $691 y una desviación estándar de $109. Suponga que el rango de pagos anuale) por seguro de propietario de vivienda en Estados Unidos es de $100 a $740 con una media de $420. La probabilidad de que una persona seleccionada al azar pague más de $874 anualmente por seguro de automóvil es .26 y una probabilidad de .5 y la probabilidad es . continua.a.:?12 ESTAl>lSTICA L" 105 >..m.un valor x está desde la media. d uso ele >. los datos que son analizados por la curva normal pero si la altura de la curva en cualquier punto dado. Una invalipdora ele meradocid IW'Oetlc no debe lllpCIDel' que. simétrica.. la aproximación es r blemente precisa. ¡a la misma de la cu. Dicho an4lü puede producir resultados falsos. la probabilidad es el estándar. La distribución normal se puede usar para trabajar la distribución uniforme. los raukldos pueden no aer rilidol para d an'1isis que 1e rnlice. Hacerlo una función de densidad de probabilidad que contiene valores requiere convertir los valores n y p de la distribución bin iguales a lo largo de algún intervalo entre los puntos a y b. para el hecho de que un que <e considere.nmmo..dio. a veces conocida como distribución rectangular. IQ y calificaciones en exámenes. Cuando sea resuelta Bá'icamente.'Cldo caractensucas de cavi todas las piezas producidas a dad. Algunu ele lu técnicu se presentan en el capitulo 17. t:na estadística z es la distancia a la lesquier punto discreto es . en unidades de desviac · minan para un periodo y en cada caso. MI como era wnlaclero con la distribución de PoWon del a¡*ulo S. Con la estadística z de un valor x.µ.metro es. Porejcmplo. es una familia de curvas. • Distribución exponencial. la solución de una distrib entre estos dos puntos. Se pueden ablelwr multados no rilidol o Wsos si 1e man perúnetros de una población para lnaliDr otra. Al 11111' pari· mdnll escablccidoltala a>iDO p. Si los valores de µ calcular la porción del rectángulo entre los dos puntos a y b están dentro de un rango de O a n. la probabilidad o área total bajo la curva es 1. en re · • Distribución normal.UC área bajo la curva para el intervalo en consideración. En smenL las técnicu del capitulo 6 pueden utilirane 11111 li se aplica el tipo erróneo de diluibucióD a los claloto á la dillribuci6o empicada pin amlilis es la cometa y los puúnetros (µ. la probabilidad en cua • calcular estadísticas z.0000. la iiUSIDI población en -.d DWnao ele liepdla por periodo de S IDiDUtllll UDralaUrlideen Wr neapor la noche a probable que no wa el llllllllO que el n6mm> ele .. Por c densidad de probabilidad no proporciona la probabilidad didad. numerosas características humanas como son eslat peso.) no se ajmtan a los dalm ele la poblKión que 1e esté analizando.3 libru de peecado por ma. Ja altura de la curva es la misma en todas panes uso de la distribución normal. el valor de la función de ción normal son la media y la desviación estándar. en UD periodo de 5 minutoa en el millilo ratauraate Clllle laa 2 y la 4 p... La corrección para continuidad implicar sumar o mw En este capuulo estudiamos tres distribuciones continuas diferentes: = . para un iatmllo m un periodo e litua ción clildol puede no aer la milllla que una >.. pua el mumo iDllenllo ta an periodo o litulción dlfaata.distribución conunua requiere una corrección para con -. Las probabilidades se determinan al binomial es sólo una aproximación. Por ejemplo. UD iiMltipdordebe estar qulO que la pobladón de la que se detaminó el pm. la prob3bilí.._ Q1111ti1n• La poNld6n que se estudia. Ea pnJblble que la población CD el IUlot* teDp WbÍlm muy dik· reata para mnmmir peecado que en Num ln¡laterra y a pniblble que la lplic:aci6n ck peñmdrol ele la poblad6n de Nueva IJlllalerra al swocste raulre cuationlbles. a µ y u de la distribución normal. en wrclad. denillc:ión-... Los parámetros necesarios para describir una di•t Con distribuciones continuas. La distribución uniforme est. En cada que ese valor <e presente al azar desde una distribución mal dada se puede determinar con el uso de un cuadro distribución.. y ). Hacer ajuste.i determinada por tos tipos de problemas de distribución binomial.. La curva normal • Distribución uniforme. Probablemente la más sencilla de estas distribuciones es estadísticas z y sus probabilidades asociadas.. CD la dis uibuci6n aponmc:ial debe aer IClftUdo porque una >._ antidada aplican 1 IU población. RESUMEN máquina.: A)r Si no es ISi. inclu. durante los clluWbila.EGOCJO~ CONSIDERACIONES ÉTICAS Vlriol punllDI deben Wlllidenne 11 tnlbejlr cm cllm. Las probabilidades se deter. La más empleada de todas es la distribución normal. Cierta técnicas para probar una disuibución ele daiOI pueden determinar si atm diatribuidol ele cierto modo. blema de distribución discreta se trabaja con el uso de Mxhos fenómeno' están normalmente distribuidos. unimodal y asintótica al eje. me&.>. con distribuciones continuas.i 1e cletaminaron p. UDI cnalllla ele mamdo fD Nueva Inglaterra puede moduir que la cmtidad ele pacado QJllllllDÍcll por mea por edabot elt6 nonDllmente dilttibuida C1DG el pmmedio ele 2.. muchas mediciones de entornos biológicos y rales.. De estandarizarse al usar la medía )' desviación estándar hecho. A veces se utiliza una distn"bución normal para analizar dalm cuando át101 no son nomu· les. La dis· aibución exponencial se usa para calcular las probabilidades de tiempos entre suceso aleatorios.SO) c. P(x< 211¡1•2Sya•4) b.íles son la media y desviación otfodar de ota distribución? éCual es la probabilidad de seleccionar al azar un valor mayor que 11? ¿Cuál es la probabilidad de seleccionar al azar un valor entre 7 y 12? • Suponga una distribucién normal y encuentre las . P(x 01! 8 n • 15 y p • .jguien10 probabilidades.= . Ptx > 5ln 15 y p • .CAPITI:LO 6 DISTRIBUCIOSU U>:"<ilNUAS 213 al valor x que se analice. está normalmente distribuido.36 Trabaje los siguientes problemas de di>tribución binomial con el uso de la distribución normal.4 Suponga que el numero de horas trabajadas por semana. Determine el valor de /{x).38 La U. Verifique sus respuestas con el uso de la tabla del Apéndice A. 1. P\x < 2IA = 2. Ptx • 12¡11 = 25 )' p • . La cfu1ribución exponencial es una familia de distribuciones descritas por un parámetro. ¿Cu.indar de una dimibución uniforme a+b 2 b-il a=~ "12 r a:J11·p·q Función de densidad de probabilidad exponencial J•=-- f{x) = ). x-1• z=-- " Conversión de un problema binomial a la curva normal 11=11·p Media r desviación oi. P(x > 21'.rU Probabilidades de la cola derecha de la distribucién exponen· cial F-Dción de densidad de probabilidad de la dbtribución normal: /(x)= 1 "Ji: r-lll2l(b-µ)/ol~ PROBLEMAS COMPLEMENTARIOS iculo de est1dlstlcas Los datos es1án dismbuidos uniformemente entre lo• valore de 6 y 14. = = 1.40) 6. d número promedio de horas uabajadas por semana es 43.65) d. por quienes suden traba1ar uempo completo.s alto en x • O.S.2 para resolver las probabilidades. Pf. P(x :a: 771µ-= SO v o • 9) c.86) <i.37 Encuentre las probabilidades para los siguientes problemas de distribución exponencial.. La distribución oU sesgada a la derecha y siempre tiene su valor m.3) b. Otra distribución continua o la dístribucion exponen· cial.405 1 = Pruebe sus conocimientos 6.i. P\13 <x< 29'µ • 23yu =4) e.P(x:a:31'-= 1. 1. Suponga que 1::!% de .60) b. Complemente la distnbucién discreta de PoÍSM>n. pr 1 :S X :S 3IA 1. TÉRMINOS CLAVE Cistribución exponencial distribución normal estandarizada distribución rectangular Cistribución normal distribución uniforme mrr«ción para conunuidad distribucién z estadística z FÓRMULAS fCDaón de densidad de probabilidad de una distribución =forme 1 f(x)= b-a 1O paraa:Sx:Sb para otres valore• Fórmula r. Bureau of Labor Stafbtl(S reporta que las personas que por lo general trabaiau tiempo compkto. P(x C!: 1051µ • 90 )'<1"" 2.x > 471µ = SO y u • 6) d.• SO) d. u. Esta corrección suele mejorar la aproximación de la curva normal.01 c. P(x :S 3ln 10 y p . 24% de lo. ¿cWl a la desviación estándar del ndmno de horas trabajadas por semana para estos mipleados? Una encuesta de la U. se díspene de \-arw instalaciones para registrar miembros a la convención. con un tiempo promedio entre gadas de 9 minutos. Suponga que 10> precio> de ese paquete ese aJ\o ataban normalmente distribuido>. en Minneapolis cstán normalmente tribuidas. diud.il es la probabilidad de que ti salario anual trabajador sea mas de S35 mil? d. ¿Cuí! es la probabilidad de que el wrio anual trabajador sea menos de S40 mil? c. Al azr selecciona un trabajador de la zona de Boston.43 6.m.S.40 6.idad que 17 o m.41 6. la probabilidad de que el salario anua! trabajador ~ mis de SSO mil? b.i normalmente distribuida. ¿cuí! es la probabilidad de que mú de SO de lo> muestreado> trabaje voluntariamente¡ t:n empresario abrió una pequeña ferretería en una zona comercial. Experiencias pasadas muestran que las personas que lle· gan se registran y siguen una distribucién de Poi550n a un ritmo promedio de 1. Por fortu na. Suponga que la llegada aleatoria de clienta a una dútribución de Poisson. Meno> de S700? Según The \\'irthlin Rtport. de la. Si esta cifra se cumple para toda la población y 'i se toma al azar una muestra de 1 SO perwnas de 16 afio> o mayores..39 6. con una desviación estándar de 83 millones de huevos.h de 2655 millones de huevos. la probabilidad de que el precio fuera arriba de S95? ¿Cuál Q la probabilidad de que el precio estuviera entre $33 y S8P Según el U. ¿Cu. con una desviación estándar de 58. Inc: tiene registrado el promedio de mensual por departamento en alguna. ¿Cual es la probabilidad de que el salario anual trabajador sea entre S39 mil y $47 mil? Suponga que los intervalos de una sala de emergmcu un hospital durante un dia hábil están di~1n"b exponencialmente. Si un departamento en Minneapolis se ciona al azar.lm .-are de actualización Microsoft Windows era S90.8 cada 15 segunde •. ¿cual 5Cria el número promedio de llegadas hora? ¡Cual es la probabilidad de que menos de 5 tos transcurran entre cualesquiera do> llq¡adas? Suponga que la. 9 a. ¿Cual es la probabilidad de que transcurran de 5 segundos entre llegadu? d. el negocio tenía poco> clientes y <ólo atendían a uno cada 20 minuto> en la mallana . velocidades promedio de trenes pasajeros que viajan de Sewark. ¿cual e> la probabilidad de que tenga entre 25 y 50 allos de edad? ¿Cuál es el valor medio para esta distribución? ¿Cuál e> la altura de la distribución! Una convención de negocios mantiene su registro el viernes por la matlana entre la. Bureau of Labor Statistio reporta que el promedio anual en la zona metropolitana de Bostcm $45 121.ts entre llegadas al registro? c. e situación seria un problema? ¿Cuál e> la probab de que transcurra al menos 1 minuto entre 11 6.47 6. r las 12 p.49 a.il c.is digan que su trabajo es muy estr ¿Cual es la probabilidad de que mis de 22 digan qut trabajo es muy est~nte? ¿Cual es la probabilidad que entre 8 y 12 (inclusive) digan que su trabajo es estresante! La U.45 A-1/PF R&11rdt. ¿cual e> la probabi. Suponga que la producción por aJlo en Alabama est. con una desviación estándar de S4 246.42 6. Philadelphia.ipolis es y que las renta.tn casi uniformemente distribuidos por edad. Suponga que la desviadén dar para rentar un departamento en Minne. Pcnnsylvania. Sew Jersq.S. los producto· res de huevo de Alabama producen millones de huevos al ano. llegadas son dbtribudono Poisson. Suponga que las computadora. semanas. este 6. entre S825 )' S925? d. L ¿Cu. base en resultados pasados? b. lo> trabajadores de tiempo completo y a sueldo de cada categoría de edad es1. L ¿Cu!! es la probabilidad de que al meno> 1 hora transcurra entre clienta? b.53. Durante las primera. ¿Cual es la probabilidad de que transcurran segundos o m. Suponga que los salarios anuales de la metropolitana de Boston están normalmente díst dos.. Si un vendedor al público de paquetes de computadoras" seleccionó al azar ese allo.• más costosas en Estados Unidos.S. Si la. Bureau of Labor Statistio mosuó que uno de cada cinco personas de 16 aJ\o> de edad o ~yortS es voluntario en parte de su tiempo. Con base en porcentaje. Bureau of Labor Statinio publicó cifras sobre el numero de trabajadora de tiempo completo >' trabajadores a sueldo con hcrarios flexibles. están normalmente . de registro se componen durante un periodo de 1 minuto.il C. ¡Cu. ¿cu.44 ¿Cuál es el número promedio de segundos entre gadas al lugar de registro pan esta conferencia. Si durante <ólo 3% de los años se producen m.estos empkados trabaian mis de 48 horas.46 6. SI 000 o mas? b.ti es la probabilidad de que de 10 a 30 minutos transcurran entre cliente>? c. Depanment of Agriculturc.m.S. con edades que van de 18 a 65 ~ Si un trabajador con horario Oexible se selecciona al azar de una fuerza de trabajo de Estados Unidos.28 según PC Data. ¿cuál es la probabilidad de que el L <>ea: 6. Si al azr seleccionan 60 trabajadore». entre S900 y SI 100? c. trabai dicen que su trabajo es muy estresante. Según su reporte costo promedio para rentar un departamento Mmneapol~ es S951. ¿Cuí! es la probabilidad de que meno> de 5 minuto> transcurran entre diente)? En un ano reciente. ¿cuí! es la producción media por parte de granjeros de Alabama? La U. el precio promedio de un paquete de sofu.48 6. Además. a.CAPIT\iLO 6 OISTIUBl/OOSE$ CO!'. en dW ~biln. Suponga que la llegada de huracanes durante esta estación es una distribución de Poisson. 5 p. a. ¿Cuál es la probabilidad de que un tren promedie menos de 70 millas por hora? b. ¿Cuál es el número esperado de estas compallias que estarían de acuerdo en que la razón es obtener una fuerza de trabajo Oexible? ¿Cuál es la probabilidad de que entre 150 y 155 (sin incluir la 150 o la 155) den esa razón? ¿¿Cuál es la probabilidad de que mas de 158 den esa razón? ¿Cuál es la probabilidad de que menos de 144 den esa razón? Según la U. IJna reciente encuesta de Gallup encontró que 80%. consideró la disponibilidad de capacitación pagada por la empresa como un factor para valorar al tomar un trabajo. ¿Cu'1 es el número esperado de familia. ¿Cuál es la probabilidad de que un tren promedie más de 80 millas por hora? c. a.SS 6. con un promedio de . d costo promedio de operación de un avíén ~ID-SO es S20S7 por hora. porque: mucho> rrabaiadores se detienen en 5U canuno 1 Cl$a para comprar. alrededor de 75% de usuarios de transporte suburbanos en Estado» Unidos van solos en su auto al trabajo. la producción de trigo en Estados Unidos en los últimos 20 al\os ha sido distribuida uniformemente. ¿Cuál es la probabilidad de que: 67 o má.S.las dijeron que la razón era obtener una fuerza de trabajo Oexible. Suponga que al azar K muestrean 150 viaieros. de quienes son de la generación X. ¿Cuál es la probabilidad de que un tren promedie entre 90 y 100 millas por hora? La Conference Board publicó información de por qué las compalltas esperan aumentar el numero de trabajos de tiempo parcial y reducir lo) puestos de trabajo de tiempo completo. Ochenta y uno por ciento de las compal'l. Los negocios se ponen especialmente inestables cuando entran huracanes al Golfo de México.50 6. una encuesta de familiu que usan Internet para comprar o rentar autos reporté que 81 % estaban buscando información de precio •. con un promedio de velocidad media de 88 millas por hora y una desviación otándar de 6. ¿Cuál es la desviación esúndar de ingresos de la familia antes de impuestos cuando el jefe de la familia tiene grado universitario? Según The Polk Company. Suponga que 1 esa hora las llepdas a una caja rápida de pago del supennerado son una dístribución de Potsson.ti es la probabilidad de que otro huracán entre al golfo de México en dos semanas o menos? ¿Cu'1 es el tiempo promedio entre huracanes que entran al Golfo de México? Con el creciente interés por la tecnología r el entorno cambiante de los negocios.m. ¿Cuál es la probabilidad de que más de 95 ~iajeros vayan solo) en auto a su trabajo? Segun lu cantidade) publicadas por el National Agricultura! Statini~ Service del U. """" estaban buscando información sobre productos ofrecidos. ¿cuáles son los valores de a y b para esta distribución? El Federal Reserve S)"$tem publica datos sobre ingl"C$0S familiares con base en su encuesta de linanus del consumidor.5? li. ¿cu. Suponga que se identifica y entrevista a 200 companias que esperan aumentar el número de trabajo• de tiempo parcial y reducir los puestos de trabajo de tiempo completo.MD-80 están normalmente distribuidoscon ana desviación estándar de $175 por hora.S7 6. ¿Cuál es la probabilidad de que menos de 105 viajeros vayan solos en auto a su trabajo? b.862 mil millones de bushtls. ¿Cuál es la probabilidad de que entre 110 y 120 (inclusive) viajeros varan solos en auto a su trabajo? c. Suponga que la producción media en este periodo es de 2 165 millones de bushtls.s/minuto. ¿A qui COSU> de operación serian menos 20% de los costos de openóón? ¿A qué costo de operación Krian mis 65% de los cos:os de operación? ¿Qué costo de operación seria má$ de 85% de los costos de operación? Por lo general los >upermercados suden estar llW concurtidos a N> de la.. Suponga que 60% de los ingresos de la familia antes de impuesU» están entre $75 600 y $94 800 y que estos ingresos esun normalmente distribuidos. muchos trabajadores están descubriendo que la capacitación en forma de reeducación. ¿cuál es la probabilidad de: que transcurra al menos un mes antes que: al golfo entre el siguiente huradn? ¿Cu.ti es la probabilidad de que menos de 35 consideren la disponibilidad de: capa· citación pagada por la empresa como factor para valorer al tomar un trabajo? ¿Cuál o el numero esperado? ¿Cuál es la probabilidad de que entre 42 y 47 {induslve) con· slderen la disponibilidad de capacitación pagada por la empresa como un factor para valorar al tomar un trabajo? Segun la Air Transport Aisociation of America. Cuando el jefe de familia tiene grado uníversitario.51 · .S8 clonadas al azar y que usan Internet para comprar orentar autos.8 penon.SJ LS4 buldas. Department of Agricuhure. el ingreso medio de la familia antes de impuestos es S85 200."lTh"UAS 215 6.56 6. busquen información acerca de productos ofrecidos? Los negocios situado~ en la costa a lo largo del Golfo de Mtxico desde Texas hasta Florida se preocupan por la amenaza de huracanes durante la estación de junio a octubre.S. Si la altura de esta distribución es de .4 millas por hora. . Suponga que los costo> de ~raOOn de: an l'ión . desarrollo de habilidades r crecimiento personal son de gran ayuda en d mercado de trabajo. familias busquen información de precios? d. que buscan información acerca de productos ofrecidos? c. Suponga que se entrevistan 75 familias selec- 6 •. ¿Cuál es el número esperado de famílw que buscan información de precios? b. Si al azar se seleccionan 50 personas de la generación X. Si un huracán acaba de entrar al Golfo de México. Bureau of ihe Census.a. ¿Cuál es la probabilidad de que menos de 23 familia. con un promedio de tres huracanes que entran al Golfo de México durante la estación de cinco meses. 05 :>:EG0005 Si la ajera acaba de hacer el cobro a la última persona de la fila.6000 2.4000 P(X <• 0. Interprete los valores de probabili· dad en térmmos del proceso de manufactura.:tv" s 3 0.5000 l.A 1inuaci6n se muestran salidas Excrl y MINTTAB este restaurante. 35000 and standard deviation • O . ¿En qu~ porcentaje de días rebasarla una circulación de 1 850 000? Suponga que el periódico no puede soportar los gastos fijos de una preparación de circulación cornpleta si la circulación cae por abajo de 1 620 000.216 ESTADISTICA E.mfican la> expresiones de probabilidad? CUHULATIVE DISTRIBUTION FUNCTION Continuoua uniform on 11.'l l. 0000 X 28.ú entre lbnudu entrantes? ¿Dos minutos! Interpretación de i.t del periódico está normalmente distribuida. aalide 6.3630 0. Si Ja probabilidad de que ocurra este evento es baja.0000 to 32.5 minutos para hacerlo. ¿cuál es el tiempo esperado (promedio) entre llamadas? ¿Cuál es la probabilidad Je que transcurra un minuto o m. CUMULATIVE DISTRIBUTION FUNCTIOS Normal with mean • 2.63 Suponga que Ja ulida MISITAB que se muestra representa el anilisis de la duración de llamadas de fono celular p. Describa la distribución que incluya Ja media y b des'iadón estándar. en cualquier dla hábil.5942 0. con base en inform..d promedio de cireuladón diaria de Th« \\'ali Strttt lournal con base en cifraa dd alto 2000 e 1 762 751.2000 0.5942 0.4762 6.9890 1.U e> 1. Analice el tipo de distribudón Jo y el .110000 X <• P(X 2.0000 34. el geren · te de producción podría tratar de mantener b plantilla completa de perscnal en >U Jugar y no alterar operariones.:a compatlia fabricante produce una varilla de metal. fo1rfiook.2 llamadas cada 30 segundos.60 Las llamadas telefónica.8951 o~ 1 oooc: 2• 7 o~ CUMULATIVE DISTRIBUTION FUNCT: Exponential with mean• 0.221 X 0.8951 0. ¿cu. emrames por lo general 5C con· sidttan de distribución de Poisson. ¿Cuál es b probabilidad de que la empleada regrese antes que llegue el siguiente cliente? 6.62 Un. . ¡Con qué ftt. en términos de mil"i=i Describa la d~1ribución de duracione> de llamada teléfono celular e interprete el signífkaJo de las siones de probabilidad. 6.61 A continuación se ilustra una valida Ml~ITAB.4500 2.:adón histórica? 6.ira uso en casa.1000 0..0000 P(X <• X) 0.2381 0.0000 21.:a Eltcd que !!C muestra aquí para describir el peso de la \-arilla.0000 16.jgnificado de probabilidades.a probabilidad de que tran~urra al menos un minuto antes que llegue el siguiente cliente? Suponga que la cajera desea ir a la oficina del gerente y hacer una prq¡unta rápida y necoita 2.64 Un restaurante promedia 4 .W.1 02 0. Utilice la salid.0000 X) .8095 1.0007 6. w A T 1 11 Distrlbution: A • ' 51 2 )( Values Probabi'.8183 0.59 Stgún Edrror and Pub/1.9885 0. ¿Cuál si¡.. Si una operadora promedia 2. Suponga que Ja desvíación C61indar es 50 940. Suponga que los datos representan el numero de compañeros de ventas que trabajan en una tienda de departamento. Suponga que la circulación díari.0000 X) 0.0000 0. Interprete la forma de b distn'bución )'la media en vista de lo> date» esiudíadcs.51 clientes por 1 O durante el verano en las últimas boras de la tarde.3000 2.0000 2.3247 0.:uencia ocurrirá este evento.5 1o 4 1 • 0. K . ' CASO: MERCEDES VA TRAS COMPRADORES JÓVENES mis de 1res décadas.1 30 r. está uniforme· mcnlc dis1ribuido sobre un rangn de 24 milla$ por g.s estadísticas indicarla que la forma de la distribución podría ser exponencial. el precio pro· ckl 330ci era de S34 990 en comparación con S-13 215 an Cí.) por galón en arreura.il es la probabilidad de que el peso sea má> de 100 mil? ¿Cual es la probabili6d de que el peso ~a entre 135 mil y 170 mil? 2.CAPfTULO 6 DISTRIBUCIO:SES CO!'lll. Ha. En térmiDOS de pe-o mensual. ¿que! nos di'cn <:>10$ dato'? 2. describa cada una de t<>ta. fabricante autos Mercedes-Benz. según un experto motores. incluyendo d h«ho de que algunos con· due1or~ son menos eficiente que olros.. 3.ua esa variable . De manera aproximada.:= por galón? ¿Cómo ~ compara este rcndmumto con b cifra para el CU\? ¿Qu~ significa csu compuao6t!> Suponga qu~ es1as can1idadcs fueron '-crdadtras v M~de\ desea apelar a compradOttS coruamtes cid ambiente con base en cconomia de combustible. Mm:tdes y B~f\\' han competido con cabeza por 'U participación en el mercado de aUIO) En 1959. Encuentre al menos una grá(ka que parezca tomar la fonm de una dimibución exponencial. Construya gráfica) de histograma de las variables de la base de datos de manufactura.¡lón a 34 millas por galón en carretera.s legumbres aboU.~ v brócoli 1• Si al azar se selecciona un mes de la discñbudón0de cebollas. el CU.~ milla' por galón a 35 milla. :-. . ¿Cuil es la altura de esta distribución! ¿Cuál es la probabilidad de seleccionar al az. Baycrische Mo1oren Werke (B~IW) casi se :a b quiebra y casi fue \cndida a Daimler-Benz. En panicular.ndores jóvene interesados en autos deportivos y de docmpeño. Calcule estadísticas descriptivas p.l uniformcmen1c dis1ribuido sobre un rango de ::. ~23que ~tcrctcbe•1á preocupada porque los precios de distribuidores del CLK 3:!0 no 50n consistentes r que cuando el precio e> S-13 21 S. .b de S42 mil y por tan10 fuera del mercado del B~IW . Utilice la base de dato de manufactura.\krctdn fijad precio del CLK 320 a menos de este precio? En rérmínos del Cl. e-1. influida por Merccdc-. Suponga también que Mcrcc:de) cree que a S42 mil. ¿Qu~ proporción dc autos cae en d rango de 26 a 30 millas por galón? Suponga que el rcndimknto en millas por galón pJra \-arios autos 3 JOa C)l.\ler(tdc> desea con m B~IW y viceversa. ¿cuAI es la probabilidad de que cl peso tca más de SO mm ¿Cuál u la probabilidad de que el peso ~ entre 25 mil y 35 mil? Si al azar se selecciona un me de la distribución de brócoli. Los datos de esta base de datos representan el peso ~ual (en miles de libras) de cada legumbre. al que en 1992 rebasó a Mercedes en ventas en todo el Entre las razone> del éxito de la BM\\' fue su capacipra vender modelo> que eran m. cada cm de esus variables está distribuida normalmente.r un grupo Industrial de 7 a 13 (inclus» ve) de e. Suponga que el rendimicn10 en m'. De un experto automotriz dice que . BMW.K 320 es m. trata de cambiar al lanzar varios producto> en un esfuerzo por atraer :::::=. el interés está todavía en el luio y comodidad Mcctdes en tanto que 8/11\\' se concentra en el deserny manejo dinámico de sus autos.b lujoso) que los modez:::a10rc> pero se concentré en proporcionarle calidad al ==llOOr y responsabilidad ambiental. no lo) números reales de la base de datos. dos -~~·wcs cupt relativamente comparables son el B~IW Yd Mercede. ¿Qué porcentaje de distribuidores de . El rendimiento de combustible para el 330ci 30 miJW por galón en carretera y 21 milla> por galón en • en comparación con 29 millas por galón en carretera cilhs por galón en la ciudad para el CLK 320. u B~IW pudo recuperarse.10 obstame. Cakuk b proporción de cada uno de los dos moddos de autos que obutncn .'tJA!> 217 ANÁLISIS DE LA BASE DE DATOS L Seleccione la base de datos de sene de nempo de una emp:n:a agrícola industrial y realice una gráfica de lú)tograma para cebo!W o para brócoli. v compare lo' resuhados.ta población si la dí)tribución es uniforme? Utilice la teoría de distribución uniforme para 1rabajar este problema. los precios están en reali- dad normalmente distribuidos con una desviacién están· dar de .330d? El precio promedio de un BMW 330ci e) Sl4990.'1.!las por galón para \'arios autos cu::. xtercede. con valores de a • 1 a b • 20. ¿cu.: 320 tiene un precio que está fuera del mercado del B~I\\' 330ci.b1udie las estadisricas y analice qw! informadón transmitida por la.S2981. ¿Qué porcentaje de distribuidore de B~I\\' fijaron el precio del 330ci a mis del precio promedio de un Cl. CU:: 320. Aun cuando cada una cs:zs compañ[as produce muchos modelo) diferentes.K 320. Cakule la media y la desviación estándar para cada distriboción.330ci cae en el rango de 26 .sta el afio 2002. (Qué proporción de au10' .' 059. La variable del grupo industrial e<tá casi uniformemente distribwda en esta base de dato».320 que compile con d 330ci por precio.~O millas o mis por pión según estas cantidades. ¿Que! porcentaje de los precios de distribuidore» para el Mcrct-dcs Cl.i presiopara que s~ autos sean más refinados )' cómodos. 8/11\\' como objetivo su campo de ventas hacia el merado de mientras que Mercedes retenía una base de cliente) En mpucsta al éxito de BM\\'. Suponga que estos precios también están normalmente distribuidos con una desviación estándar de S2367.a.K 320? ¿Qué porcentaje de distribuidorcs de Mercedes es1an fijando el precio del Cl K 320 a menos que el precio promedio de un 330ci? Suponga que un distribuidor de B~IW vende un 330ci en S3. aparea menú descendente.a) siguientes probabilidades produci~ por Excel indican la presentación de diferentes l. ¿por qué? dt tiempo de 3 horas Prob8billdadts txponenci&lts ICIUDuiativas dtsdt la liqula'da 0.667 1 0.. Por ejemplo. Upper en escriba el valor de b.9836 0.991!9 Partt de un marco 2 3 4 5 USO DE LA COMPUTADORA EXCEL Excel ~ putek usar para calcular probabilidades acumulativas para . Distribución exponencial ~ po ible obtener probabilidades de una durnbucién exponencial al seleccionar la función EXPONDIST de la lista del lado derecho de la función StatisticaL Aparece una caja de di. si escribe FALSE. Cuando el usuario seleccione esta opción.3663 0. seleccione Uniform menú descendente Probability Distributions.5990 0. La cuarta linea requiere una re. obtcndri d valor de la fórmula de densidad de probabilidad.\ en la segunda linea La tercera linea requiere una respuesta lógica ya~ TRUE o FALSE.2045 0.)33 0. Distribución normal w probabilidades de curva normal se pueden obtener al seleccionar la función NORMDlST del lado derecho de la función StatisticaL Aparece una caia de diálogo. ¿cuil es la probabilidad de que transcurra n>m()) de una hora entre \"Cntas? ¿Ctdl es la probabilidad de que traJJSCUm nW de un db ( 12 horas por dla) amo de la siguiente venta una \U que se baya vendido un auto? ¿Qué pueden hacer los gerentes de la distribuidora con esta información? ¿Cómo puede esto ayudar en la contratación de personal? ¿Cómo puede usarse esta información como medio de seguimiento para el impacto de publicidad? ¿Hay opción de que estas probabilidades cambien durante el ano? Si es uf. la media en la segunda línea. obtendrá las probabilidades acumula- tivas desde cero al valor de xo.7459 0.z en constan le de entrada y escriba x. que multa en un menú eendeme. y ponga ci: lista la ubicación de columna de los valore.218 J. distribuciones normales o di5tribuciones uniformes. probabilidades al seleccionar Probability IXnsity. MINITAB MINITAB ofrece la función de producir probabilidades pan distribuciones exponenciale-. obtendr4 las probabilidades acumulativa. estarnos intelbado• en resolver y usar probabilidades y.''LOS NEGOCIOS Suponga que en una distribuidora se vende un promedio de 1.-aJores~ de x ya sea de una distribución exponencial o de una dístribucién normal. de expo>ición) y que esas ventas son distribuciono de Poisson. obtendré el valor de la función de densidad de probabilidad para esa combinación de x. ESTADISTICA E.midie la glida e imerpré1da para los vendedores. y la desvíacién est.9354 0. Esta resuhara en una caja de di!logo. Si sólo calcular la probabilidad para un valor particular de x. µ )' u. si escribe FALSE. tndpoint. Aqul estarnos interesado$ p mente en probabilidad acumulativa. para todos los valores hasta x. Si el usuario d~ tener probab~• calculadas para varios valores de x. Produciri la función Paste Function.ilogo EXPONDIST. A continuación K!Kcione la función.indar en la tercera linea. Aparece una nueva lista de opciones en d lado derecho. comience por seleccionar la tecla de función. Distribución uniforme Para usar MINITAB Window) para calcular probab desde una distribución uniforme. x.puesta lógica )"ll sea TRUE (VERDADERO) o FALSE (FALSO). b y x. En la otra línea.37 CLK cada 3 horas (durante un db de 12 hora. En cualquier de los dos casos. E. Cumulatrvt Pn produce las probabilidades acumulati~-as para valores o iguales a x: Con lnverse Probability da la inversa de !al babilidades acumulativas. del lado izquierdo de la YCl!Wla ~te Function. En la linca.ilogo contiene tres lineas a las que el wuario debe responder. Escriba el valor de x en la primera linea. Ponga el valor de Xo en la primera linea y el valor de . estarnos interesados en las prebabilidades acumulativas y pondremos TRUE como mpuea en esta caja. Para problemas trabajados en este texto. Si el usuario escribe TRUE. !. Esta caia de di. Iatlve Probability o Inverse Probability. Esco1a cómo se calcu1z:. escriba el valor de a.lempoi entre venias con base en esta información. Si el usuario escribe TRUE.9958 0. Probabilíty proporciona el valor de la densidad de probabilidad para combinación panicular de a. /10 de la barra de bnramknw. seleccione Probability J2is tions. casi siempre usaremos la respuesta lógica TRUE. ba.167 0. En este menú. póngalas en una seleccione la opción de columna de entrada. por lo 1an10. Comience el proceso al seleccionar opción ~c en la barra de menú. En este capitulo. . Statistical. La caja de diálogo tiene cuatro lintU a w que se debe responder. Probabiluy Density dad valor de la deos:xiad de probabilidad para una combinación particular de x. En la linea.CAJ>llVLO 6 DISTIUBUC101''ESC01'"111''VAS 219 Distribución normal Distribución exponencial Pan usar MlNITAB para calcular probabilidades desde una d. En la línea . seleccione la opción de columna de entrada. r ponp en una lista la ubicación de columna de IO$ valores JCo. Probability Density proporciona d valor de la densidad de probabilidad para una combinación particular de JCo yµ. J\"ota:MINITAB usa la medía. Cumulative Probability produce las probabilidades acuculativas para valores menores o iguales a x. Para usar MINITAB para calcular probabilidades desde una distribución exponencial. Esta selección ruultari en una caja de díilogo. seleccione la opción de umna de entrada. J en la linea Standard desvíarien.üin1>ución normal. haga clic en constante de entrada y escriba JCo. Ounulative Probability o ID\·tne Probability. Cumulative Probabilíty produce las probabilidades acumulativas para valores menores o ígualb a JCo. lnverse Probability da la inversa de las probabilidades acumulativas..Mean escriba el valor deµ. Si sólo desea calcular la probabilidad ¡¡:wa un valor panicular de x.Mean. no el valor de >. Esta selección resultará en una caja de diálogo.µ • 11>. Aquf estamos interesados principalmente en problbilidad acumulativa. póngalas en una columna. hap clic en constante de entra· a y escriba JC.. "°' . . '. Sí sólo desea calcular la probabilidad para un valor particular de JCo. seleccione EJponMrial del menú descendente Probability Disrriburions. Escoja cómo se calculan probabilidades al seleccionar Probability IXnsity. o lnvtrU Probability. Cumu/ari•-t Probabiliry. escriba el valor de o Si el auario desea tener probabilidades calculadas para \'UIO~ «res de x. o. Aquf estarnos interesados principalmente en la probabilidad acumulativa. Elija cómo se calculan probabilidades al seleccionar Probability Density. seleccione qponeotial del menú deseendente Probabiliry Distributioos. y ponga en una lista la ubicación de cot:::zona de lo) valores x. escriba el valor de µ Si el usuario desea tener probabilidades calcufadas para vario) valores de póngalas en una columna. lnverse Probabi/11y proporciona la inversa de las probabilidades acuculativas. Distinguir entre muestreo aleatorio r muestreo no aleatorio. Usar las distribuciones muesrrales de la media i y la proporción 220 p. 2. 6.CAPÍTULO 7 Muestreo y distribuciones muestrales OBJETIVOS DE APRENDIZAJE Los dos objetivos principales del capítulo 7 van a proporcionar al lector una aprecia ción para la correcta aplicación de técnicas muestrales y la comprensión de las distribuciones muestrales de dos estadísticas. Comprender el impacto del teorema central de limite en un análisis estadístico. E tar alerta de los diferente' tipos de errores que pueden presentarse en una encuesta. con lo cual podrá: l. . S. 4. Determinar cuándo y cómo usar diversas técnicas de muestreo. Determinar cuándo usar muestreo en lugar de un censo. 3. 14. Ziiitr. acUU<d s~ 8.tics son sus actitudes hacia sus trabajo. ¿Deben k» investigadores tomar un censo de todos los trabajadores de una maquiladora o ~. . ¿En qué formato pueden los investigadores 11~-ar con más eficiencia los re ultados del estudio a la administración? 6. Casi 85% de la manufactura de maquiladoras e>l. pp. Para el atlo 2000 estaban empleados más de 1. Tijuana. El programa ha sido exitoso.i en lo> e>tado> del norte de Mhico que hacen frontera con Estados Unido>. ¿qué tipo de técnica de muestreo ganarla la información m.l ISpring 19921. hnyJ/www~mihtm.. 221 . con más de 3 500 compatlw registradas en él. ¿Cómo puede la administracién hacer uso completo de los resultado'> de una encuesta para tener un entorno de trabajo más productivo! adopl.\Wp:iM.•Moi<an M~1bdon \~ Altitud<Towvd Y. libres de impuestos.i> valiosa? ¿Cómo pueden lo> investigadores estar seguros que la muestra de trabajadores es representativa de la población? ). Corea. Canadá y muchos pal~ europeo>. para ensamblar y fabricar producto). MaJ/lblit ..1 millones de trabajadores.do L Noll. y asl crear trabaio$ para mexicanos. Nuevo Laredo y .Ma1amOTO$.aa.lo una muestra? ¿Cuáles son las razone' de cada una de ellas? 2. Si ~utiliza una muestra. ¿qué técnicas estadísticas son mas apropiadas? S."aVlibblc at bnp:/1-w.¿Cuál es la actitud de los trabajadores de maquiladoras? A principio> de la década de 1960 el gobierno de México estableció un programa de maquiladoras. ¿Pueden 13$ preguntas ser analizadas cuanmauvamente! Si es asr. y lo que de ella esperan. ¿Qué perfil tienen lo) trabajadores mexicanos de maquiladora.n: ~ S- 2000. Se ntima que l3$ maquiladoras gastaron 50 mil millcnes de dólarn con proveedores en 1999.'brking. ¿Qué tipos de pregunw deben formularse y cómo deben expresarse? 4. ·~~iladora 2001 UnckrmnJllliland Prq>orq. donde pudieran imponar suministros y materiales de Estados Unidos." ª"" E'.Mexicali. La idea era convencer empresas estadounidenses pua construir en México por la mano de obra barata que hay en este país. l. El programa de maquiladoru abarca ahora compatlias de todo el mundo.? ¿Cu. y sus compaflias? ¿Hay brechas culturales entre compatlia y trabajador que deben cerrarse para utilizar con más eficiencia lo> recursos humano>? ¿Qué actitudes y expectativas basadas en la cultura llevan los trabajadores de maquiladoras a su trabajo? ¿Cómo se ocupa un investigador de negocios en encuestar trabaiadores! Preguntas gerenciales y estadísticas Suponga que unos mvesugadores deciden encuestar a trabajadores de maquiladoras para averiguar lu actitudes de los trabajadores hacia el entorno del trabajo y la compañía. Este programa permitió a corporaciones estadounidenses construir plantas de manufactura dentro del territorio mexicano. no. China. vol IX. con exportaciones de la industria maquiladora unos 65 mil millones de dólares. Estas empresas están concentradas en Ciudad luarez. incluyendo Japón.nw¡gwdccomlmal ~ Fwntt: do Ch<tyl An Scvt!n.Gmo. y luego exportar los artículos terminado> de regreso a Estados Unidos. muestrearlos seria mh rí¡: Con la velatilidad de alguno) mercados y el constante bombardeo de la nueva competencia )' n ideas. A veces. ). Como el proceso de investigación a veces es destructivo. Asi como hacmr resúmenes y observaciones acerca de la perspecnva y cultura en el programa de maquiladoras. u información recuperada sir\'ió para obtener lo> porcentajes de quienes contestaron :>:o a las 20 preguntas.¿Cómo obtenemos los datos empleados en análisis estadístico? ¿Por qué a veces los investigadores toman una muestra en lugar de realizar un censo? ¿Cu~les son las diferencias entre muestreo aleatorio y no aleatorio? Este capítulo aborda 6tas y otras preguntas acerca del muestreo. 2. la companta podría haber tomado una tra aleatoria de la población. muestrear tiene gran ventaja sobre un censo en términos del tiempo del ciclo de inve. Un cuestionario cuidadosamente formu que sea culturalmente sensible para ~ mexicanos podría aplicaN a trabajadores seieccionados p¡:t determinar actitudes de trabajo. es posible reunir información tallada si se toma una muestra que si se realiu un censo. La muestra puede ahorrar dinero.1 MUESTREO El muestreo se utiliza ampliamente en negocios como medio para reunir información útil acerca una población. 4. Si los recursos asignados a un proyecto de investigación son fijos. El conocimiento ruso de la medía muestra] y proporción muestral es importante en el estu de estadlstica res bisico para gran pule del análisis estadístico. Por la mí. si obtener los resultado.1 a~ rilitración y quienes toman decisiones podrlan entonces tratar de usar lo. 1. el estudio puede ampliarse en alcance para tomar en cuenta más p~ especializadas. • 1.1 proporción muestral. una muestra proporciona medios ra» nables p. tra de 100 dientes en lugar de con una población de 100 mil clientes obviamente es menos c Ademh de ahorros en costo. podría 'ICr · canzable y no asequible.222 ESTADISTICA ES ios SEGOCIOS Este capuulo explora el proceso de muestreo r las distribuciones muestrales de algunas enadísti~.. En el Dilema de deciliión sobre trabajadores de maquilador& podría tomarse una muestra aleatoria de trabajadores de una amplia selección de compafllas en '-UUS industrias de las ciudades fronterizas más importantes.. la muestra puede ahorrar produ~ S. del estudio mejorar el rendimiento y motivación de trabajadores. La muestra puede ahorrar tiempo. Razones para muestreo Tomar una muestra en lugar de llevar a cabo un censo ofrece varias ventajas. de otra manera. duos o articules. Se reúnen datos de muestras y se sacan conclusiones acerca de la población como panr del proceso de estadísticas inferenciales. La tarjeta contenta 20 preguntas que el interesado podría contestar Sí o :>:o al un agujero. la muestra es la única opción.$ma cantidad de dinero.tígaci&:.ira reunir esta útil información para toma de decisiones que. Si el acceso a la población es imposible. es materia de urgencia. Puede ser más barato obtener una muestra que un censo para cierta cantidad de preguntas. el número considerablemente menor de entmistas por lo general menos tiempo total. ejemplo. Los investigadores enviaron po: rreo miles de ejemplares de una tarjeta computarizada que parecía voto de un juego de estrellas de bol de lip ma)'or. la muestra puede ampliar el alcance del estudio. Una organización asignó un presupuesto de S 100 mil para un estudio'! optó por un censo en lugar de una muestra al U$3r una encuesta por correo. 7. expectativas )' diferencias culturales entre trabajadores y comp¡l! Los im-núgadore• podrían compilar y analizar 10> datos recogidcs de las respuestas. multado.. También se presentan las distribuciones de dos estadísticas: • La media muestral. Así. Para recursos dados. l. sí se rcafüa una entrevista telefónica de 8 minutos. tener sesiones personales con entrevistadores capacitado y reunir · .a. Con recursos concentrados en menos íné:. llevar a cabo las entrevistascon una n:. Se ha determinado que estas estadi>tícas están casi normalmente distribuidas bajo ciertas cond: cienes. El muestreo alcatorio implica que la probabilidad entra en el proceso de selección.ES 223 mación de1allada <obre el procese en estudio.·o? Algunas fa. Algunos procesos de invcs1igación destruyen IO$ productos o articules en estudio. Estas dos razones para realizar un censo es1án basadas en la suposición de que se dispone de suficiente tiempo y dinero para llevar a cabo un censo. . milías no uenen 1el~fono. marcos tienen rtgutro> tn exceso en las unidades de población objetivo. Por 1an10.\l\JESTREO Y DISTIUBUCIONE. mapa. mas algunas otras uní· dades. Una razón para lomar un censo es eliminar la posibilidad de que.CAPtn:LO 7 . Una segunda razón para realizar un censo es que el cliente (persona que auloriza y/o suscribe el estudio) no tiene una apreciación para muestreo aleatorio y se siente más cómodo al conducir un censo. una muestra alca1oria de propietarios podrían ser principalmente rancheros. En estas dos shuaciones.. ¿Cómo es que el marco podria ser diferente de la población obje1i. En el ideal. algunas personas se niegan a contestar preguntas sensibles y algunos números telefónicos no aparecen en las gulas. si la población de interés son los propietarios de camiones del estado de Colorado. el muestreo es la única opción. La mueslra se inicia con una lista. Por ejemplo. Marco Todo estudio de investigacién tiene una población objetive que es1. una muestra seleccionada en forma alca1oria pudiera no ser representativa de la población. Cuando la población es inaccesible por k1as u otras razones.i formada de individuos. si se prueban bombillas eléetrieas para determinar cuanto tiempo encienden o si se prueba el sabor de barras de dulce para determinar si el gusto es aceptable. El muestreo se realiza desde el marco y no desde la población objeuvo. Por ejemplo. S1 se realiza un censo para este tipo de investigación.S Ml!EST1W. los miembros de la población pensaban que las selecciones se hacían al azar. una muestra que no es representativa para la población puede seleccionarse por casualidad. Algunos arttculos de inler6 (como un Chevrolet 1957) están tan dispersos que localizarlos seria sumamente diAcil. el cual pueden ser lisias escolares. los inve tigadores podrtan pasar mucho más tiempo con cada persona entrevistada y por tanto aumentra el potencial para reunir información útil. Incluso podrla haber 01ras familias que desde que se imprimió el directorio se mudaron y/o cambiaron los números telefénicos. lomar una muestra es la única opción realista para probar estos productos. A veces es pracncamente imposible tener seceso a una población para su investigación. En el muestreo aleatorio cada unidad dt la poblaci611 tiene la misma probabilidad dt ser $tlt«io11nda en la muestra. casi rodas las persooas elegibles para el redutamientc confiaban que al azar se seleccionaba una fecha de nacimiento como la primera fecha usada para reclutar personas. la mela de un investigador es minimizar las diferencias entre el marco y la población cbjetivo. direaorio u otra futntt tmplt. insutuciones o entidades que son el objeto de investigacién. Los marcos a los que le falta11 registros contienen menos unidades que la población objetivo. existe una correspondencia exacta entre las unidades del marco y las de la población. 01m familias 1ienen números que no aparecen en las gulas. Muestreo aleatorio contra no aleatorio Los dos npos pnncipales de muestreo son el aleatono y el no aleatorio. el producto se destruye. a casi iodos los t~ladounidenses lo gus1a creer que lo> ganadores de la apuesta nacional son seleccionados al sacar mimtro> al azar. En realidad.is sentido que usar una muestra. Incluso cuando se pongan en práctica todas las técnicas apropiadas de muestreo. la población objetivo y el marco son los mismos. no quedaría ningún producto para venderse.1dn para reprtstntar la poblaci6n que recibe el nombre de marco. En teorfa. cuando de hecho muchos de los propietarics de camiones de Colorado son citadinos. Al usar el dinero para una muestra. Por ejemplo. Por ejemplo. cuando se usaba ti sorteo mililar. Un marco factible serian las páginas residenciales de las guías de teléfonos de Detrou. por lo que el marco y la población objetivo suelen ser diferentes. Lo. de asociaciones de comercio o incluso lisias vendidas por corredores de lisias. Por ejem· plo. A finales de la dttada dt 1960. por casualidad. otras has1a tienen lisias múhiplcs bajo diferemes nombres. Razones para tomar un censo A veces tornar un censo llene m. suponga que la población objetivo son las familias que viven en Detroit. Si el mismo número se presenta más de una va.ta población contiene sólo 30 compaflias número. . Como ejemplo. En seguida.. ma)"OfQ a 30 (31·99) deben excluir-e._ lt'Cfli~ b. de modo que es posiNt obtener el mismo dígito dos veces o mas en una lila. Técnicas de muestreo aleatorio t. en la >Upc:wción de que los dat<» provienen de muestras aleatorias. ii una población tiene 2 mil miembro>. La tabla A. espacios de la tabla A.1 y continuamos en sentido horizonral en la primera fila ha.AJgu~ técnicas son más fáciles de usar. como se ve en la tabla 7.. por ejemplo. LOS Nf. Muestreo aleatorio simple La tknica m. en esta sección se describen varias técnicas de muestreo no aleatorias..3. Debido a que no e:.2 un muestreo aleatorio simple para seleccionar una muestra de seis compañías. • Seleccionamos tanto• dígito• para cada unidad mue treada como exlstan en el número grande de la población.. I sólo sirven para facilitar la lectura de valora. Un generador de número aleatorio suele ser un programa de cómputo que pe mhe que la salida calculada por la computadora dé número.~ para reunir datos para ~r analizados por la mayor pan« iú los mttodos cstadímas pr~ntados en est« texto. principalmente para alertar al estudiante de sus características y limitaciones. el cual se puede . 27951 11145 ano 57f91 l67m l9I05 7059 2'167 2m2 "900 97336 07119 ""' 30134 8611 ll27e f9J2J 1402 *29 71CMI 04024 02JM ""' )M76 l'10J2 45021 J~ "'7S5 08171 51038 :mu 45799 25f99 rn. .. comenzamos con el primer par de dígitos la tabla 7. Los miembros de muestras no aleatorio• no son seleccionados al a..1 Breve tabla de números aleatorios - 91567 mt5 1-..h elemental de muestreo aleatorio e> el muestreo aleatorio simple. algunas con menor costo. . . lizar como la base para I~ otras técnicas de muestreo aleatorio. Como e. de modo que de la tabla con cuadro números aleatorios ben seleccionarse <ei' diferentes de dos dlgnos. del Apéndice A contiene una lista completa de números ale> torios en toda• direcciones.'..1do o porqut conocen a las personas que conducen la investigación.ta que sean seleccionados n TABLA 7.ur.venta¡u. • Primero. seleccionamos números de cuatro dígi Como la población de la tabla 7. cualquiera de los 10 dlgitO• (0-9) es igualmente probable. Lo. los método> estadístico> presentados y estudiados en este texto esún basado. aleatorio" u tabla 7. Para facilitar la comprensión. Por cada número. igualmente probable que sea seleccionada cada unidad de población.~-~. Los mttodos muestrale» no aktlrorios no son rknicas apropiada. numeramos cada miembro de la población.n 2'llO Z0655 17'8 12544 22716 1"31 13916 997]0 'Stl127 aJ6 41CIS5 19792 35006 4756t . podrían seleccionarse porque cst~n en el lugar apropiado en el momento apropi. La población está numerada de O 1 a 30. Por ejemplo.1 contiene una bmc lista de número.. necesario seleccionar dos digítos cada número.. el p se continúa hasta obtener un valor entre 1 y 30. asignar una probabilidad de que ocurra un suceso en muestreo no aleatorio a imposible. A vece el muestreo aleatorio se denomina muestreo de probabilidad y el muestreo no aleatorio K llama muestre« dt no probabilidad.. No obstante. aleare sistemérico y aleatorio de grupo (o área). sólo e. y otras con mayor potencial pan reducir error de muestreo. Cada una de estas tknica> ofrece ventaja) y de.isícas de muestreo aleatorio pueden ser simples aleatorio> estratificado..sm..GOCIOS En el muestreo no aleatorio no toda 1midad dt población tiene la misma probabílidad dt S6 sd«· cionada en la muestra... se selecciona el número 67.~ realiu cuadro con números aleatorios o un generador de número aleatorio se utiliza para seleccionar artkulos en la muestra.. del marco de población de compañías que aparecen en la füta de la tabla 7. Por ejemplo. aleatorio •.I. El objeto es muestrear seis compañías.. tinuamo• con otro número. Con muestreo aleatorio simple. Si. . unidad del marco se numera del 1 a N (donde N es el tamallo de la población).2 contiene 30 miembros.224 ESTADISTICA[. ..... Lis siguientes compaAlas constituyen la muestra final. s.J ~ión =eradade JO compañías .. DlllaA/6U...11 :za R. 27 PIOCllr. De la tabla 7.. Alaska Airlines Alcoa Bank of America Occidental Petroleum Procter & Gamble Sears El muestreo alea1orio simple es más fácil de ejecutar en pobl... La razén principal para usar mUC$• treo aleatorio C)tratificado es que sirve para reducir el error muestrsl. DllllA/6Llllll s. Cimllllt 11 Dafll.-.12 . seguído por 27.. en sentido horizontal a la segunda fila y a~i sucesivamente.. El procese para numerar a lo.clric lac8ll Mad ~ JCf'eMq .-ñ a. Dlme7 UBLA 7. el primer número es 91 y está fuera de rango. que es el valor para Alaska Airlín~ despuéssiguen el 24. Ocicirlm. . por lo que esta comparua se seleeeiona.ar de la tabla y continuará en una dirección predetermlnada para seleccicnar números... en el que la población se divide en subpoblaciones que no K tl"l$lapan y se denominan estratos.n .3 vemos que 25 es el número asociado con Occídmtal Petroleum. respectivamente.. Continuando con el proceso.. CISlllSOllll IJ~o. la muestra esl.w. 04 y 02..olAamica WSoadi Dar. de modo que se desecha. AlllbAldinm Akm MbllDd a.ka 06a. lo) siguientes dígitos son 56... 11 DimlJ '' HAurtoll 17 llM 11 leloil 19 lmut 2IO 1-'t °'~ CM .i.. 1.m ClliFlllP -~ zs . por lo que Occidental Petroleum es la primera compa.iciones pequeña» que en grandes.. ambo. que es el primer número utilizable. Cllfllalip llM ....! w.. El siguiente número no utilizable es 95...ML'ESTRFOY 1>15TIUBUCIO:-ifSMllES'TltALES 225 lABlA 7.ao.. •O. continu.-a ... 74 y 25.1. En la primera 6Ja de dígito. el siguiente número utilizable es 29... El error muestral se presenta . A veces un investigador comenuri en algún lugar seleccionado al az. a...... utilizables...._.. OI Allllm~ OI Akm a..lr. Muestreo aleatorio estratificado Un segundo upo de muestreo aleatorio es el muestreo aleatorio estntificado..rner diferentes valores entre O 1 y 30.. El investigador extrae en ton· ces una muestra aleatoria simple de cada una de las subpoblaciones.CAPtrulO 7 ... Si se continúa a lo largo de la primera fila...- a..2 Marco poblacional de 30 compa"1as ~. ~los número' están asociados con Bank of Arnerica y Alcoa.. de la ubla 7.a lllmaMaWI - o-. ol... A Procter & Gamble le corresponde el número 27..a . :HMlclola6 25 Ocdllealli...JUa seleccionada en la muestra... que si es utilizable... miembros de la población y seleccionar artículos se difkulta mucha para poblaciones grandes... que está asociado con Scars. e.. 21S22 .. pasarnos los número) 95 y 83. El siguiente número utilizable es 01.á completa..uno..icr 29 San 30 Time w. Si se requieren más números.. Como esta selección C) la sext..-lm 14 Gmall l!leclrk IS<iamll ... .. sl consideramos a El Paso. por ejemplo sexo. el potmaa: para comparar la muestra cerca de la población es mayor de lo que es con muestreo aleatorio simple por que se toman partes del muestreo total de lo) diferentes subgru~ poblacionales. y judía. ¿qué importantes variables deben ser estra · El sexo de la persona que conteste podria ser la diferencia porque en las pasadas elecciones observó diferencia en la preferencia de los votantes ~ su género: es decir. deben contrastar entre si.1. entre otras.ar estra proporcional. LOS :"EGOCIOS cuando. una aleatoria estratificada proporcional deberla contener 77% de personas de origen hispano. Cualesquier otro número de católico) $erla una estratificación desproporci proporción muestral de otras religiones también tendría que seguir porcentajes poblacionales. una clccci6n en \a que \a estra\iñcación es por grupo ttnico. La estratifi se hace a veces usando variables demográficas. de cada subgrupo (estrato). Par una muestra estratificada proporcional étnicamente de 160 residentes de los 600 mil rC$iden:o FIGUIA 7. la homogt11tidado semeja~ tsú preseme: entre cada par des existe una diferencia. El aleatorio estratificado proporcional se presenta n1ando ti porwrrajtdt la muestratomada tk trato ts proporcionalal porcentajeq11t cada estratoestá dtnrrodt toda la poblaci6n. base en la suposición de que la edad hace la diferencia entre la preferencia de programación.\. La figura 7. Texas. E. u región geográfica también proporciona una im variable en elecciones nacionales porque los votantes son influenciados por valores culturales que difieren de una región a otra.226 ESTADISTICA E.1 contiene una estratificación por edad con tres estrato&. El muestree aleatorio estratificado puede ser proporcionado o desproporcionado. se inclinaron mi) hacia candidatos democráticos. Los beneficies de la e)tratificación aumentan entre más difieran. bíen. protestame. si una elección para presidente de Estados Unidos timt realiz. Con muestreo aleatorio C$tratificado.arla una firma de investigación de mercado. o htttrogtntidad. la edad de los oyentes C$ determinante pua el tipo de progr empicada por una estación. En mercados de radio F.si exclusivamente por los tas en el pasado. No obstante. Por ejemplo. La selección de estratos suele basarse en la información dispenibíe que pudo recogerse en en o censos previo). el rmntreo aleatorio estratificado es por lo general más CO$tOSO que d aleatorio simple porque a cada u • de la población se le debe asignar un estrato antC$ que se inicie d proceso de selección alcatoña.-. la muestra requerirla la inclusión de 900 católico) para alca. religión y grupo étnico. estrato debe ser relativamente homogeneo y externamente. clase soeioeconómica. lntemamentt. la muestra no representa la población. Los votantes en el sur votaron ca.. pero en fechas reciente) lo hicieron por candidatos republicano) en elecciones nales. al azar. región fica.. Los votantes de los estados de las Montallas Rocosas apoyaron a candidatos presid republicanos: en el noreste industrial. Si la población de Boston es 90% católica y si se muestra de mil ~'Otantes. donde la población es aproximadamente 77% de origee no y un in~tigador rnliu. los hombres y mujeres \'Otarc: modo diferente en las elecciones nacionales. Por ejemplo. ga que se realiza una encuesta de votantes en Boston y la muestra es estratificada por religióa católica.nz.su tificación implica que lo~ radioescuchas entre 20 y 30 al'los prefieren el mismo tipo de progr que es diferente de la que prefieren los radioescuchas entre 30 y 40 y entre 40 y SO allos de edad.1 Muestreo aleatorio estratificado de radioescuchas deFM Esuatifiaclo por edad Hctcrogbleo (difemne) entre Hnerogmeo [diferente} entre . o microco mos. El muestro sistemático tiene otras ventajas ya que está distribuido de manera uniforme en el marco. Por ejemplo. el muestreo sistemático se emplea por su comodidad y relativa facilidad de administración. cada grupo conuene una amplia variedad de elementos.do de intervalo para selección Como ejemplo de muestreo sistemático. Si k no es un valor entero. El Direaoriode Fabricantts de Texastenla en sus llitas aproximadamente 17 mil fabricanto en tot¡J en Texas (N) en orden alfabttico.. puede presentarse un problema con muestreo sistemático si los datos están sujetos a cual· quier periodicidad y el intervalo está en sincopa (que se pueden suprimir dos o mh elementos) con el muestreo.i basada en la suposición de que la fuente de elementos de población C$ aleatoria. por ejemplo C>tados o Áreas Estadísticas Metropolitanas Estándar. luego seleccionó la número 22: es decir. En el ejemplo. en con· traste con el muestreo aleatorio estratificado donde los estratos son homogéneo>. o alguna otra intermedia? Al seleccionar cada valor k~imo. Suponga que seleccionó el número 5. El valor de k. y asi sucesivamente. aleatorios simples para seleccionar un valor entre 1 y k incluso como punto inicial. Aun cuando el muestreo de área suele referirse a grupos que son áreas de población. por e¡emplo regiones geográficas y ciudades. a veces llamado ciclo muestra! se puede determinar con la siguiente fórmula. la lista original esú $Ujeta a una organiz. A veces los gru· pos de la población se presentan naturalmente y ya e>tán identificado. el muestreo sistemático no se realiz.STlW. El valor de k era 17( 17 000/1 000) y el investigador seleccionó una de cada 17 compai\las del directorio para su muestra. un Investigador de sistemas de información de administración deseaba muestrear fabricantes en Texas y tenla suficiente apoyo financiero para muestrear mil · compañías (n). colegios. ¿Empezó el investigador con la primera compai\fa de la lista. el muestreo seria no aleatorio. con 30 estudiantes cada uno y •i cada una de las listas de los cinco grupos se ordenó con los nombres de los mejores estudiantes primero y los de menor nivel al final.po mues· treo de drta se usan Indistíntamente en este texto. cada k-énmo elementose selt«ionapara producir11na muestra dt tamaño n de una poblaci6n dt tamaño N. entonces el muestreo sistemático de cada 30 estudiantes podría provocar la selección de los mejora estudiantes. El muestreo de grupo (o &mal comprende la división de la población en áreas o grupos que no se traslapan. . Ejemplos de grupos son ciudades. de modo que el investigador recurriria a una tabla de números aleatorios para determinar un punto inicial entre 1 y 17. Más bien. l'o obstante.ación cíclica o periódica. de la población. los estudiantes de menor nivel o los estudiantes mediocres. compai\ias. debe usarse el valor de número entero. el muestreo de grupo identifica grupos que tienden a ser internamente heterogéneos. La metodología del muestreo sisttmátko C$t. y el grupo es una miniatura.a para reducir el error muestral. En e-e caso. o con la número 17. áreas de una ciudad y regiones geográficas. El segundo elemento para la muestra es el punto inicial más k. A diferencia del muestreo aleatorio o· tratificado.debe usarse una tabla con número.. si una lista de ISO estudiantes universitarios o en realidad una lista fusionada de cinco grupos. los término> mumrro dt gn.CAPfTULO 7 MUESTREO Y DISTRIBUCIOSB MllE.E) 227 Paso debería contener 123 personas de origen hispano.se presenta un muestreo alta· torio estratificado desproporcionado. entonces tendría que empezar con la compaflla número 5. lama. So obstante. (5 + 17) y luego la número 39. Muestreo sistemático El muestreo sistemático es una tercer técnica muestra! aleatoria. En teoría. esto es. DETERMJNAOON DEL VALOR DE le donde: n • tamailo muestra! N • tamailo poblacional k . una persona informada puede fácilmente determinar si en un estudio se sigue un plan de muestreo. Con el muestreo sistem'tico. Muestreo de grupo (o área) El muestreo de grupo (o área) o un cuarto tipo de muestreo aleatorio. Sitmprtqut las proporciona 1it los estnuos de la muestra sean diferentesa las proporcionesdt los estratos dt la poblaci6n. k • 17. . el muestreo de grupo puede 5C'r estadísticamente meno. En un caso extremo.u desvemajas. cuando I~ elementos de un grupo son los mismos..u a consumidores indiv · les demro de: las ciudades de: prucb. Un ejemplo de investigacíón de n(S<KÍO• que hace uso de agrupación la prueba de mercado de: nuevos productos.tQ.y se torna un segundo conjunl:O de grupos ck cada original. Ella podría ernonces dividir las ciudades en grupo& manzanas y al aur seleccionar casa. porque no se dispone de los rn. La figura 7. el investigador 5Clccdona al azar elementos individuales cn muestra desde los grupos. El costo por sude: ser mmor en muestreo de grupo o árc:a que en muestreo e.t de mercado.tpa e• seleccionar las manzanas. d muestreo dndr grupo puede no ser mejor que muestrear una rola unidad del grupo. htado. Además. grupos. y se hacen encuot.:as de muestreo empicadas para seleccionar elementos de la pobladón por cualquier m mo que no comprende un proceso de selección aleatorUi se denominan tttniau de muestreo no torio Como no se u~ la probabilidad para seleccionar elementos de las muestras.228 ESTADISTICA EN tos l"EGOCIOS Dnpub de seleccionar lo. Unidos a dividen en grupos de ciudades de prueba de mercado. El artículo en publicación btadlstia• en los negocios de hoy sobre ciudades de prueba de mercado analiu al de las ciudades estadounidenses investigadas con m~ frecuencia. Si los elementos de un grupo loClll mílares.irlo. üta técnica se denomina muestreo de dos et1pas Por ejemplo. El muestreo de grupo o arca también tiene vari. A \TCCS los grupos son dmlasiado grandes. Se puede 'implifiar 11 administración de la encuesta muestral..u a cimientos muestreados.tratificado por l. Dos de las primera. Por lo general los grupos se obtienen con comodidad y el costo de muestrear dcsdc da la población se reduce porque el alcance del estudio K reduce a los grupo>.tf(OS trales de los elementos individuales de la población y por tanto no se pueden usar otras t&nicas muestreo aleatcrio. El tiempo y el costo de contactar elementos de la dón se: pueden reducir. individuales de lo• grupos de manun. Con frecuencia en ventas de prueba. en especial si se trata de viajar. A ces d muestreo de grupo o área es el único método factible. los costos y prob de análisis estadístico son mayores con muestreo de grupo o área que con muestreo aleatorio Wti. La primera etapa es donar las ciudades de prueba y la segunda tl. El muestreo de gruposo área\ ofrece vari~ ventaja. a fin de reunir datos a ser analiudos por métodos de c~tadisti•"I inferencia) presentada en este tato. Adrmas.' \·mtaj.1> th"llicas thTiicas de no probabilidad y no son dC>Cable• para u. C'St. eficiente' que d muestreo ale simple.li son la dad y el costo. El error de muestreo no puede ser HM'l.it Muestreo no aleatorio Las tttni.. Algunas ciudades de ventas de prueba .u. porque la agrupación reduce la dhtan.2 muestra algullll5 ciudades cstadou~ ~ de prueba de mercado que se usan como grupo• para probar productos. una investigadora dividir Estados Unidos en grupos de ciudades.u llita> de de mis bajas o IO$ costos Je: ubicación mas bajo>. En contraste.á locali1. de moc1o que d mm:ac1o dt Baltimott CI dificil de aislar y estudiar Sin tomar en cuenta a Wasbing· ton. donde I~ personas oteo en casa. Colorado. Maine.t•--------------------audacia c1e prueba c1e mm:ac1o Por varias l'UOOC$ lt acosen como prueba de merado dda'minadas ciudades. A veces éticos.a. CI afectada por "entradas" de Washington. 112.. que resultará en ahorro de tiempo y dinero . sín importar qué incómodo o poco amable $C3 la ubicación.Mll Bouldn Longmont. donde los midentes recibfti mú 11amadu por penona que lo& dt cualquiera otra parte. y Bouldtr-Longrnont. Ockssa-Mídland es~ por Port1and. Muestreo de juicio Un muestreo de juicio se presenta cuando los tkmtntos stltcdonndos para la muesrm son mogidos por ti 11licio del invt$tigador. AllEASMETROPOLITANASMÁS ENCUESfAIMS Lupr Ana a. y cas.e. muestreo de cuota y muestreo de bola de nieve. cercanos o dispuestos a participar. Citttos productos tsUn dtstimdos a segmentos demegráficos o psicogríficos de la población en penicular. muestreo de juicio. los tltmttllospam In mu""ª st stl«cionan para comodidaddtl inwsrigador. Muestreo de conveniencia En el muestreo de conveniencla. La tabb muestra las 10 4sns metropolitanas mú mcucmdas segun d Survq Sampling of Fairfidd. Una de las razones fund. ~s donde no haya perros.lida• cuando una prueba de mercado a influenciada por medios de comum cadón de otro1 lupres. un muestreo de conveniencia en hogares para entrevistas de puerta en puerta podría incluir casa. f'arnilWidad. Por ejemplo. Si una firma de investigacién c. Los invcstigadorn de macado tienen difrttntcs crite ríos para seltcaonar ciudades para pruebas de mercado. Por ejemplo. de muestreo no aleatorio: muestreo de conwnicncia.t. La selección de una ciudad de prueba de mercado podría estar basada en quf ciudad tiene la proporción o número mú alto de ptnonu en estos scgmenl06 objdivo. Existe "u. Pimfield. incluymdo demogrificas.co!Mllimcia y otras. Dmwr.atados Unidos.u con personas amables. Ambo6 son problema que 5C. ND MN Phonux-Mn. aun cuando Baltimott CI b ciudad número uno psicogrificammte. una muestra de com·enicncia podría ser seleccionada al entrevistar sólo compradores que pasan por la tienda y se ven amables. Las ciudades mis encuestadas no ton necesariammtt las mú rqnamtauvas en Estados Unidos. Le ligue Charlaton. Aquí se presentan cuatro tkruca. Existe •entradl• cuando dos o mis meraidos mm tan cercanos entre si que las pmonas de otros lugares "tntnn• a comprar.tropolltana 1 2 ' 4 s 6 7 8 9 JO Odeua Mu:lland. psicogr6· ñcu. edad. West Virginia. Tu1sa no es una de las ciudades mú encuestadas pero 1t cree que ts la cíudad que mú se acera al pafil dmlognfico nacional en thminos dt población.' toman en considmición al ldec:aonar una ciudad pera prueba de mercado. los inves- . Una prueba de mercado se cscogt a vece porque la compailla ya la utiliz6 en una prueba y el producto fue un éxito. Por ata razón y otras. ldaho.A veces los im·estigadorei. TX Porthnd.112.CAPITVLO 7 ~ll. CO Gr-~nd Forb. fl árn metrópolitana mú mcuatada en Eatados Unidos es Odma-Midland.'Ilte. Incluso otros factores pueden entrar en la sdttción de una dudad para prueba de mm:ado. Morlrning 1'kws clasificó a Boue. una muestra aleatoria requerirla que d invatigador reuniera datos sólo de casas >· departamento) que hayan sido seleccionado) al azar. MA nado objetivamente para otas técnicas de muestreo.ada en una zona comercial peatonal. Es un mic:roc:ounos de la nación pero tsú repleto con publicidad aislada quc pttmitt el control dd diltllo de invatipciona. ND-MN Bo~.CO Fargo-Moorhad. departamento) en primer piso. Por lo general el inve tigador selecciona elemento de lo~ que se dispone con facili~d.''ESTilEO Y OISTRJBV<lO~'ES MU~l'lWLS 229 •'ii'·'Hº!'Ul!·Jiiifü·*·Jl·'':i. casas cerca de la calle.ID T~. Tau. Coruwcticut.tigador seleccionará mh elementos de la parte media de la población. La muestra tiende a -er menos variable que la población porque en mucho. grupos Micos y valores de v1V1mda.umntalcs es la propiedad.. Otros mercadoa son con-Uentts o cómodos parad 1nvntigador. resp«tivammtt. o. como uno dt los mtjom lugares pera vmder productos de consumo en E. entornos los elementos extremos de la población no se encuentran fácilim. piensan que pueden obtener una muestra represen- tativa al usar un juicio razonable. El invc.
Copyright © 2024 DOKUMEN.SITE Inc.