134503902-Medidas-de-tendencia-central-y-Dispersion.pdf

May 24, 2018 | Author: DialexRobles | Category: Statistical Dispersion, Statistics, Arithmetic, Multiplication, Inflation


Comments



Description

3MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN EN DISTRIBUCIONES DE FRECUENCIAS capítulo Objetivos • • • Utilizar la estadística sumaria para describir una colección de datos Utilizar la media, la mediana y la moda para describir cómo se “aglutinan” los datos Utilizar el rango, la varianza y la desviación estándar para • describir cómo se “dispersan” los datos Examinar los análisis de datos exploratorios, basados en el uso de la computadora, para conocer otras formas útiles de resumir los datos Contenido del capítulo 3.1 Estadística sumaria 58 3.2 Una medida de tendencia central: la media aritmética 60 3.3 Una segunda medida de tendencia central: la media ponderada 69 3.4 Una tercera medida de tendencia central: la media geométrica 74 3.5 Una cuarta medida de tendencia central: la mediana 77 3.6 Una medida final de tendencia central: la moda 84 3.7 Dispersión: por qué es importante 89 3.8 Rangos: medidas de dispersión útiles 91 3.9 Dispersión: medidas de desviación promedio 96 3.10 Dispersión relativa: el coeficiente de variación 107 3.11 Análisis exploratorio de datos (AED) 112 • Estadística en el trabajo 116 • Ejercicio de base de datos computacional 117 • Términos introducidos en el capítulo 3 118 • Ecuaciones introducidas en el capítulo 3 119 • Ejercicios de repaso 121 57 E l vicepresidente de mercadotecnia de una cadena de restaurantes de comida rápida está estudiando el desarrollo de las ventas de las 100 sucursales que se encuentran en el distrito oriental y ha elaborado la siguiente distribución de frecuencias para las ventas anuales: Ventas (miles) 1,700- 1799 1,800- 1899 1,900- 1999 1,000-1,099 1,100-1,199 1,200-1,299 Frecuencia 04 07 08 10 12 17 Ventas (miles) 1,300-1,399 1,400-1,499 1,500-1,599 1,600-1,699 1,700-1,799 1,800-1,899 Frecuencia 13 10 09 07 02 01 El vicepresidente desea comparar las ventas del distrito oriental con las ventas de otros tres distritos del país. Para llevar a cabo esto, hará un resumen de la distribución, poniendo especial cuidado en el acopio de información sobre la tendencia central de los datos. En este capítulo analizaremos también cómo se puede medir la variabilidad de una distribución y, por tanto, cómo obtener una percepción mucho mejor de los datos. ■ 3.1 Estadística sumaria Estadística sumaria, tendencia central y dispersión En el capítulo 2 construimos tablas y gráficas a partir de una colección de datos sin procesar. Los “retratos” resultantes de las distribuciones de frecuencias ilustraron tendencias y patrones de los datos. En casi todos los casos, sin embargo, teníamos necesidad de medidas más exactas. En estos casos, podemos usar los números que constituyen la estadística sumaria para describir las características del conjunto de datos. Dos de estas características son de particular importancia para los responsables de tomar decisiones: la tendencia central y la dispersión. La tendencia central se refiere al punto medio de una distribución. Las medidas de tendencia central se conocen también como medidas de posición. En la figura 3-1, la posición central de la curva B está a la derecha de las posiciones centrales de las curvas A y C. Observe que la posición central de la curva A es la misma que la de la curva C. Punto medio de un conjunto de datos Tendencia central Separación de un conjunto de datos Dispersión La dispersión se refiere a la separación de los datos en una distribución, es decir, al grado en que las observaciones se separan. Note que la curva A de la figura 3-2 tiene una mayor separación o dispersión que la curva B. Existen otras dos características de los conjuntos de datos que proporcionan información útil: el sesgo y la curtosis. Aunque la derivación de la estadística específica para medir dichas característiCurva A Curva C Curva B FIGURA 3-1 Comparación de la posición central de tres curvas 58 Capítulo 3 Medidas de tendencia central y dispersión en distribuciones de frecuencias Curva A Curva B FIGURA 3-2 FIGURA 3-3 Comparación de la dispersión de dos curvas Curva simétrica cas está más allá de los objetivos de este texto, nos será útil tener un conocimiento general de su significado. Simetría de un conjunto de datos Sesgo de un conjunto de datos Agudeza de un conjunto de datos Las curvas que representan los datos puntuales de un conjunto de datos pueden ser simétricas o sesgadas. Las curvas simétricas, como la de la figura 3-3, tienen una forma tal que una línea vertical que pase por el punto más alto de la curva dividirá su área en dos partes iguales. Cada parte es una imagen de espejo de la otra. Las curvas A y B de la figura 3-4 son curvas sesgadas. Están sesgadas porque los valores de su distribución de frecuencias se concentran en el extremo inferior o en el superior de la escala de medición del eje horizontal. Estos valores no están igualmente distribuidos. La curva A está sesgada a la derecha (o positivamente sesgada), debido a que va disminuyendo poco a poco hacia el extremo derecho de la escala. La curva B es exactamente opuesta. Está sesgada a la izquierda (negativamente sesgada), ya que disminuye poco a poco si la recorremos hacia el extremo inferior de la escala. La curva A podría representar la distribución de frecuencias del número de días que un producto se encuentra en existencia en un negocio de venta de fruta al mayoreo. La curva estaría sesgada a la derecha, con muchos valores en el extremo izquierdo y pocos en el extremo derecho, debido a que el inventario debe agotarse rápidamente. De manera análoga, la curva B podría representar la frecuencia del número de días que requiere un agente de bienes raíces para vender una casa. Estaría sesgada hacia la izquierda, con muchos valores en el extremo derecho de la escala y pocos en el izquierdo, debido a que el inventario de casas se coloca muy lentamente. Sesgo Cuando medimos la curtosis de una distribución, estamos midiendo qué tan puntiaguda es. En la figura 3-5, por ejemplo, las curvas A y B difieren entre sí sólo en que una tiene un pico más pronunciado que la otra. Tienen la misma posición central y la misma dispersión, y ambas son simétricas. Los estadísticos dicen que tienen un grado diferente de curtosis. Curtosis Curva A: sesgada a la derecha Curva B: sesgada a la izquierda Curva A Curva B FIGURA 3-4 FIGURA 3-5 Comparación de dos curvas sesgadas Dos curvas con la misma posición central pero diferente curtosis 3.1 Estadística sumaria 59 Ejercicios 3.1 Conceptos básicos ■ ■ 3-1 Trace tres curvas, todas simétricas, pero con diferente dispersión. 3-2 Trace tres curvas, todas simétricas y con la misma dispersión, pero con las siguientes posiciones centrales: a) 0.0 b) 1.0 c) 21.0 ■ 3-3 Trace una curva que pudiera ser una buena representación de las calificaciones en un examen de estadís- ■ 3-4 Para las distribuciones siguientes, indique cuál de ellas tica de un grupo mal preparado, y también la de un grupo bien preparado. a) b) c) d) tiene el valor promedio más grande. es más probable que produzca un valor pequeño que uno grande. es la mejor representación de la distribución de edades de los asistentes a un concierto de rock. es la mejor representación de la distribución de los tiempos de espera de pacientes en el consultorio de un médico. A B Para las siguientes dos distribuciones, indique cuál de ellas, si alguna, e) tiene valores distribuidos más uniformemente a través del intervalo de valores posibles. f) es más probable que produzca un valor cercano a cero. g) tiene una probabilidad más alta de producir valores positivos que negativos. A B 0 ■ 3-5 Si las dos curvas siguientes representan la distribución de los resultados de un grupo de estudiantes en dos exámenes, ¿cuál examen parece haber sido más difícil para los estudiantes? A B 3.2 Una medida de tendencia central: la media aritmética La media aritmética 60 Casi siempre, cuando nos referimos al “promedio” de algo, estamos hablando de la media aritmética. Esto es cierto en casos como la temperatura invernal promedio en la ciudad de Nueva York, la vida promedio de la batería del flash de una cámara o la producción promedio de maíz en una hectárea de tierra. La tabla 3-1 presenta datos que describen el número de días que los generadores de una planta de energía de Lake Ico se encuentran fuera de servicio debido a mantenimiento normal o por alguna falla. Para encontrar la media aritmética, sumamos los valores y dividimos el resultado entre el número de observaciones: 7 1 23 1 4 1 8 1 2 1 12 1 6 1 13 1 9 1 4 Media aritmética 5 }}}}} 10 88 5} 10 5 8.8 días Capítulo 3 Medidas de tendencia central y dispersión en distribuciones de frecuencias Tabla 3-1 Tiempo sin funcionar de los generadores de la estación de Lake Ico Generador 1 2 3 4 5 6 7 8 9 10 Días fuera de servicio 7 23 4 8 2 12 6 13 9 4 En el periodo de un año, los generadores estuvieron fuera de servicio un promedio de 8.8 días. Con esta cifra, el administrador de la planta de energía tiene una medida sencilla y razonable del comportamiento de todos sus generadores. Símbolos convencionales Las características de una muestra se conocen como estadísticos Las características de una población se llaman parámetros Para escribir ecuaciones de este tipo de medidas de las distribuciones de frecuencias, necesitamos aprender la notación matemática que utilizan los especialistas en estadística. Una muestra de una población consiste en n observaciones (con n minúscula) con una media de xw (x barra). Recuerde que las medidas calculadas para una muestra se conocen como estadísticos. La notación es diferente cuando calculamos medidas para la población entera, es decir, para el grupo que contiene a todos los elementos que estamos describiendo. La media de una población se simboliza con m, que es la letra griega mu. El número de elementos de una población se denota con la letra mayúscula cursiva N. Por lo general, en estadística se usan letras del alfabeto latino para simbolizar la información de las muestras y letras griegas para referirnos a la información de las poblaciones. Cálculo de la media a partir de datos no agrupados Encontrar las medias de la población y de la muestra En el ejemplo, el promedio de 8.8 días sería m (la media de la población) si la población de generadores fuera exactamente 10. Sería wx (la media de la muestra), si los 10 generadores fueran una muestra tomada de una población mayor de ellos. Para escribir las fórmulas correspondientes a estas dos medias, combinamos los símbolos matemáticos y los pasos que utilizamos para determinar la media aritmética. Si se suman los valores de las observaciones y esta suma se divide entre el número de observaciones, obtendremos: Media aritmética de la población Suma de los valores de todas las observaciones Sx m5} [3-1] N Número de elementos de la población y Media aritmética de la muestra Suma de los valores de todas las observaciones Sx xw 5 } n [3-2] Número de elementos de la muestra Debido a que m es la media aritmética de la población, usamos N para indicar que se divide entre el número de observaciones o elementos de la población. Del mismo modo, xw es la media aritmética de 3.2 Una medida de tendencia central: la media aritmética 61 99 200.00-299. Es una estimación porque no utilizamos los 600 datos puntuales de la muestra.99 50. podemos calcular fácilmente una estimación del valor de la media de estos datos agrupados.00. Tabla 3-3 Saldo promedio mensual de 600 cuentas de cheques 62 Capítulo 3 Clase (dólares) 0.Tabla 3-2 Resultados del examen de aptitud académica Estudiante 1 2 3 4 5 6 7 Aumento 9 7 7 6 4 4 2 la muestra. La letra griega sigma.99 150.49. A partir de la información de la tabla. Calculamos la media de esta muestra de siete estudiantes de la manera siguiente: Sx xw 5 } n [3-2] 9171716141412 5 }}} 7 39 7 5 5. En aras de la sencillez.99 250. Cada valor de una observación cae dentro de alguna de las clases. sumamos todas las observaciones. Los especialistas en estadística se refieren a este tipo de datos como datos no agrupados.00-199.00-249. De haber usado los datos originales sin agrupar.00-399.99 350. Otro ejemplo: en la tabla 3-2 se presenta la lista del aumento en puntos porcentuales en los resultados de siete estudiantes que tomaron un curso de preparación para el examen oral de aptitud escolar. podríamos haber calculado el valor real de la media.99 400.99 Frecuencia 78 123 187 82 51 47 13 9 6 004 600 Medidas de tendencia central y dispersión en distribuciones de frecuencias .00-449. A diferencia del ejemplo del examen de aptitud. se requiere una manera distinta de calcular la media aritmética. Suponga que tenemos una distribución de frecuencias (ilustrada en la tabla 3-3) del saldo promedio mensual de la cuenta de cheques de 600 clientes de una sucursal bancaria.6 puntos por estudiante ← Media de la muestra Observe que para calcular esta media. indica que todos los valores de x se suman.00-349. Los cálculos no fueron difíciles. debemos sacrificar la precisión.000 cabezas de ganado y prefiere no sumar por separado cada uno de los datos. S. pues nuestro tamaño de muestra era pequeño. o suponga que tiene acceso sólo a la distribución de frecuencias de los datos y no a cada observación individual.99 100. Pero suponga que debe trabajar con el peso de 5.00-499. pero sólo después de obtener el promedio de los 600 valores individuales.99 450. no conocemos el valor individual de cada observación.99 300.99. y n es el número de observaciones de la muestra. 5} Manejo de datos no agrupados Cálculo de la media a partir de datos agrupados Manejo de datos agrupados Estimación de la media Una distribución de frecuencias consta de datos agrupados en clases. En estos casos.00-149. 99 300.900 85.99 450.550 01. 24.00 325. • xw 5 media de la muestra • S 5 símbolo que significa “la suma de” • f 5 frecuencia (número de observaciones) de cada clase • x 5 punto medio de cada clase en la muestra • n 5 número de observaciones en la muestra Hacemos una suposición En la tabla 3-4 se ilustra cómo calcular la media aritmética de una colección de datos agrupados. primero calculamos el punto medio de cada clase.99 25.00 350.99 200.00 475. sumamos todos los resultados y dividimos esta suma entre el número total de observaciones de la muestra.225 23. por ejemplo. suponemos que todos los valores de una clase son iguales a su punto medio.00 225.00 375. podemos eliminar el problema de te- Tabla 3-4 Cálculo de la media aritmética de la muestra con los datos agrupados de la tabla 3-3 Clase (dólares) (1) Punto medio (x) (2) 0.350←S(f 3 x) [3-3] 85. se convierte en 25.99 50.00 275. Para lograr que los puntos medios queden en cifras cerradas.2 Una medida de tendencia central: la media aritmética 63 .00 Frecuencia (f ) (3) 3 3 3 3 3 3 3 3 3 3 S(f 3 x) xw 5 } n 78 123 187 82 51 47 13 9 6 4 Sf 5 n 5 600 f3x (3) 3 (2) 5 5 5 5 5 5 5 5 5 5 1.00-199. Observe que.375 2.99 150. el saldo mensual promedio de las cuentas de cheques es $142.995. En nuestra muestra de 600 clientes. Nuestros resultados.99 250.00-149. podemos simplificar aún más nuestro cálculo de la media de datos agrupados.950 9.00 425. son sólo una aproximación del promedio del saldo mensual real. redondeamos las cantidades. utilizando la ecuación 3-3. Después multiplicamos cada punto medio por la frecuencia de las observaciones de dicha clase. Así. el punto medio de la primera clase.00. Codificación Asignación de códigos o los puntos medios En aquellas situaciones en que no se tenga disponible una computadora y sea necesario realizar las operaciones aritméticas a mano. como no conocemos cada uno de los datos puntuales de la muestra.00-449.00 175.375 14. Mediante una técnica conocida como codificación.Cálculo de la media Para encontrar la media aritmética de datos agrupados.99 400.925 4.00-249. entonces.00-499.99 100.225 3.00-349. La fórmula es la siguiente: Media aritmética de una muestra con datos agrupados S( f 3 x) xw 5 } n [3-3] donde.00.350 5} 600 5 142.49. Ésta es la aproximación hecha a partir de la distribución de frecuencias.475 12.25 ← Media de la muestra (dólares) 3.00-299.99.00-399.350 11.00 75.00 125.25. de la manera siguiente: Clase 1-5 6-10 11-15 16-20 21-25 26-30 31-35 36-40 41-45 Código (u) 24 23 22 21 0 1 2 3 4 ↑ x0 Cálculo de la media de datos agrupados utilizando códigos Los estadísticos usan x0 para representar el punto medio al que se asigna el código 0. La tabla 3-5 ilustra cómo codiTabla 3-5 Caída anual de nieve en Harlan.ner puntos medios muy grandes o inconvenientes. podemos asignar enteros consecutivos de valor pequeño.5 1 2 5 21. Kentucky Clase (1) Punto medio (x) (2) Código (u) (3) 0.7 8-15 16-23 24-31 32-39 40-47 3.5 22 21 0 1 2 3 Frecuencia (f ) (4) 2 2 2 6 2 3 2 5 2 2 02 2 Sf 5 n 5 20 S(u 3 f ) xw 5 x0 1 w } n u2f (3) 2 (4) 5 5 5 5 5 5 [3-4] 1 2 5 519. En lugar de utilizar los puntos medios reales en los cálculos.5 1 8 } 20 5 19.5 11. y 2) sumamos todos estos productos.5 19. El entero cero puede asignarse a cualquier punto medio. • xw 5 media de la muestra • x0 5 valor del punto medio al que se asignó el código 0 • w 5 ancho numérico del intervalo de clase • u 5 código asignado a cada punto medio de clase • f 5 frecuencia o número de observaciones de cada clase • n 5 número total de observaciones de la muestra Tenga en mente que S(u 3 f ) simplemente significa que 1) multiplicamos u por f para cada clase en la distribución de frecuencias. a cada uno de los puntos medios. pero para que los enteros sean pequeños.5←x0 27. La siguiente fórmula se utiliza para determinar la media de la muestra mediante códigos: Media aritmética de la muestra para datos agrupados usando códigos S(u 3 f ) xw 5 x0 1 w } n [3-4] donde. asignaremos el cero al punto medio de la mitad de la distribución (o el más cercano a la mitad). y u para el punto medio codificado.5 43.5 64 Capítulo 3 Caída de nieve anual promedio Medidas de tendencia central y dispersión en distribuciones de frecuencias 24 26 0 5 4 6 5←S(u 2 f ) .5 35. Entonces podemos asignar enteros negativos a los valores menores que ese punto medio y enteros positivos a los valores más grandes. llamados códigos. la respuesta aproximada es 4. Observe que si los siete miembros de un equipo de atletismo tienen las marcas de tiempo que se muestran en la tabla 3-6 para cierta carrera. Tabla 3-6 Tiempos de los integrantes de un equipo de atletismo en una carrera de 1 milla Integrante Tiempo en minutos 1 4. Sería más representativo calcular la media sin incluir el valor extremo. que usemos el método corto que consiste en utilizar datos agrupados para determinar la media aproximada).3 1 4. No podemos calcular un valor para la media de estos datos debido a la clase de extremo abierto “5. La tercera desventaja es que somos incapaces de calcular la media para un conjunto de datos que tiene clases de extremo abierto en la parte inferior o superior de la escala. Segundo.3 minutos ← Media de la población Sin embargo. la media es útil para llevar a cabo procedimientos estadísticos como la comparación de medias de varios conjuntos de datos (procedimiento que se estudiará en el capítulo 9). como un solo número que representa a un conjunto de datos completo. desde luego.2 1 4. El valor extremo 9. Un segundo problema con la media es el mismo que encontramos con los 600 saldos de cuentas de cheques.ficar los puntos medios y encontrar la media de la muestra de la caída anual de nieve (en pulgadas) durante 20 años en Harlan.0 5 }}}}} 7 37.7 4 4.4. se trata de un concepto familiar para la mayoría de las personas y es intuitivamente claro.1 1 9.7 1 4.3 3 4.0 Tabla 3-7 Tiempos de los integrantes de un equipo de atletismo en una carrera de 1 milla 3. como cualquier medida estadística.2-4. si calculamos el tiempo medio para los primeros seis corredores y excluimos el valor de 9.5 2 2 4. Por último.0 6 5. No tenemos forma de saber si el valor de la observación de esta clase es 5.0 1 5. cada conjunto de datos tiene una media.4 o más 1 Una medida de tendencia central: la media aritmética 65 . Suponga que los datos de la tabla 3-6 se clasifican en la distribución de frecuencias de la tabla 3-7. Resulta tedioso calcular la media debido a que utilizamos cada uno de los datos en nuestro cálculo (a menos.8 1 5.1 7 5} 5 5.7 minutos.4.3 2 5.6-4.2 4. puede verse afectada por valores extremos que no son representativos del resto de los datos.2 Clase en minutos Frecuencia 4.9 2 5.4 o más”. el tiempo medio es: Sx m5} [3-1] N 4. aunque la media es confiable en cuanto a que toma en cuenta todos los valores del conjunto de datos.0 minutos. Sin embargo. cercano a 5.0-5. es una medida que puede calcularse y es única debido a que cada conjunto de datos posee una y sólo una media.0 distorsiona el valor que obtenemos para la media. tiene importantes ventajas. Primero.8 5 5. Kentucky. Primero.1 7 9. la media aritmética tiene desventajas que debemos conocer. Ventajas y desventajas de la media aritmética Ventajas de la media Tres desventajas de la media La media aritmética.4 o mucho mayor que 5. 0-11.0-18. Mar.400 Oct.700 $61.000. Por fortuna. $52. ¿Califica para esa tasa de interés menor? Aplicaciones ■ 3-6 El Child-Care Community Nursery es elegible para recibir recursos de un fondo especial de servicios sociales del estado.800 $49.800 $57.9 16.300 $112.300 Jul.100 La compañía puede obtener una tasa de interés menor si su saldo mensual promedio es mayor que $65.500 $15. estaríamos violando una suposición importante. Clase 10. c) Repita el inciso b) con 0 asignado a la sexta clase.500 $ 6.900 .0-14.300 a) ¿El centro en cuestión sigue calificando para recibir apoyo? 66 7 Capítulo 3 Medidas de tendencia central y dispersión en distribuciones de frecuencias $13.0-12. Una sugerencia útil al elegir qué medidas calcular es observar los datos.9 12. Jun. existen medidas que se pueden calcular que no tienen este defecto.La media (o promedio) puede ser una excelente medida de tendencia central (la manera en que se agrupan los datos alrededor del punto medio de una distribución).200 $8. $58.600 $8. May. $72. Si los datos que se presentan a continuación representan la edad de los niños que acuden normalmente al centro. Dic.9 17.9 19.9 11 8 7 6 2 a) Calcule la media de la muestra con la ecuación 3-3. Sep.300 $172. ¿calificará éste para el apoyo del fondo? 8 ■ 5 9 10 9 12 7 12 13 8 3-7 El Child-Care Community Nursery puede continuar recibiendo el apoyo económico de servicios sociales del estado siempre y cuando el promedio del ingreso anual de las familias cuyos niños asisten al centro sea menor que $12.0-15.0-17. la media no es representativa.900 $12.9 14.9 EA Frecuencia Clase Frecuencia 1 4 6 8 12 15.500 $10.0-19. Ago. $121. El préstamo mostró los siguiente saldos de fin de mes durante el año pasado Ene. Advertencia: si existen valores muy altos o muy bajos notoriamente distintos a la mayoría de los datos.100 $50. 3-2 La Davis Furniture Company tiene un acuerdo de crédito revolvente con el First National Bank. b) Calcule la media de la muestra usando el método de códigos (ecuación 3-4) con 0 asignado a la cuarta clase.200 $46. pero a menos que la media sea en verdad representativa de los datos con los que se calculó.9 13. Los ingresos familiares de los niños del centro son: $14.9 11. SUGERENCIAS Y SUPOSICIONES Ejercicios 3-2 Ejercicios de autoevaluación EA 3-1 La siguiente distribución de frecuencias representa los pesos en libras de una muestra de paquetes transportados el mes pasado por una pequeña compañía de carga aérea. Feb.800 Abr.800 $72. Nov.9 18.800 $14.500.0-10. siempre y cuando la edad promedio de sus niños esté por debajo de los nueve años.0-13.600 $ 5.0-16. d) Explique por qué sus repuestas a los incisos b) y c) son iguales.800 $ 7. 92 2.7 22.0 24. c) Calcule la media de la muestra a partir de los datos sin procesar.97 2.94 2.49 50.90 2. registra los tiempos siguientes (en segundos): 20. b) Calcule la media de la muestra a partir de la distribución de frecuencias.7 25. 274 Jul.93 2.95 2.7 23.99 100-109 110-119 120-129 ■ 6 16 21 29 25 22 11 7 4 0 2 a) Calcule la media de la muestra con la ecuación 3-3. Los datos para 1995 son los siguientes: Ene.2 24.89 2. 195 Abr. 216 Mar. 302 Ago.29 30. 450 ¿Qué decisión toma el dueño y por qué? ■ 3-11 Un fabricante de cosméticos adquirió una máquina para llenar botellas de perfume de 3 onzas. 234 Feb.4 22. hizo una corrida de prueba con 18 recipientes.02 3.0 Una medida de tendencia central: la media aritmética 67 . etcétera.2 24.94 2.9 3.6 28.04 onzas o menos. 50-59.96 2.2 23.99 2. d) Compare los incisos b) y c) y comente su respuesta.79 80.4 21.69 70.8 24.89 90.0 20. Los volúmenes resultantes (en onzas) de la prueba fueron los siguientes: 3.84 2. 400 May.90 2.1 24.95 2. b) Calcule la media de la muestra usando el método de códigos (ecuación 3-4) con 0 asignado a la clase 70-79. Tiempo (en segundos) Frecuencia 20.99 2.39 40. Utilizando un cronómetro y observando a los operadores.01 ■ 2.9 23. La construirá si el número promedio de animales vendidos durante los primeros 6 meses de 1995 es al menos 300 y si el promedio mensual global del año es al menos 285.2 25. Para probar la precisión del volumen depositado en cada botella. 3-9 La siguiente distribución de frecuencias representa el tiempo en segundos que los cajeros de BullsEye Discount Store necesitaron para servir a una muestra de clientes en diciembre de 1996. ¿cuánto puede aumentar el ingreso familiar promedio y todavía seguir calificando? 3-8 Los siguientes datos representan las edades de los pacientes admitidos en un pequeño hospital el día 28 de febrero de 1996: 85 88 89 87 ■ 75 80 83 83 66 56 65 52 43 56 53 44 40 67 75 48 a) Construya una distribución de frecuencias con clases 40-49. 275 Oct.2 21. 3-10 El dueño de Pets‘R Us está interesado en construir una nueva tienda.■ b) Si la respuesta del inciso a) es no. 315 Jun. 291 Sep.59 60. 300 Nov. ¿cuánto debe disminuir el ingreso familiar promedio para que el centro califique? c) Si la respuesta del inciso a) es sí.97 La compañía no suele recalibrar la máquina para este perfume si el volumen de llenado de las 3 onzas difiere en 0. 375 Dic.97 2.3 22.3 22. ¿Deberá recalibrarla? 3-12 El gerente de producción de la imprenta Hinton desea determinar el tiempo promedio necesario para fotografiar una placa de impresión.3 21. 000 50.000 1980 $15. b) Calcule por separado las ganancias trimestrales promedio en cada uno de los tres años. A continuación presentamos los datos relativos al mantenimiento de la biblioteca ambulante durante quince años.000 1982 $30. Recibe una comisión proporcional al volumen de las ventas que haga. Basándose en los resultados de los incisos a).970 $1. de manera que todavía calificara para las tasas de interés altas? 3-14 M.000 1989 $27.000 15. muestre que estas dos cantidades son iguales a la media de los 12 números que se presentan en la tabla.970 millones.000 1988 $26. (Ésta es la ganancia promedio trimestral que obtuvo la señorita Smith durante un periodo de tres años.000 Calcule el presupuesto promedio anual para los últimos 5 años (1988-1992).■ ■ ■ Un tiempo promedio por placa menor a los 23.000 1985 $21.000 $25. durante diez años.T. la presidenta del comité organizador de la biblioteca municipal. c) Muestre que la media de las cuatro cantidades obtenida en el inciso a) es igual a la media de las tres cantidades que obtuvo en el inciso b).000 $15. b) y c).969 $1.893 $1.970 millones calificaría a National para obtener tasas de interés más altas.000 10.000 1987 $24.000 1990 $25.895 ¿Cuál es la cantidad promedio (media) invertida durante a) la primera semana? b) la segunda semana? c) el periodo de 2 semanas? d) Un saldo promedio durante las 2 semanas mayor que $1.000 $ 5. ¿cuánto podría el tesorero de la compañía retirar el último día de los fondos de reserva. en dólares: Año a) b) c) d) 68 Semana 1 Capítulo 3 Presupuesto Año Presupuesto Año Presupuesto 1992 $30.000 1979 $10.970 millones.892 $1. trimestre 3er. Calcule el presupuesto promedio anual para los primeros 5 años de gestión (1983-1987). trimestre 4to. trimestre Año 1 $10.000 1981 $20.000 1991 $28. trimestre 2do. Sus ganancias trimestrales en dólares durante los últimos tres años son las siguientes: 1er.000 Año 3 30.000 10. Afirma que durante su cargo ha administrado el presupuesto para el mantenimiento de la biblioteca ambulante del municipio mejor que su antecesor.000 1983 $24. ¿Califica? e) Si la respuesta del inciso c) es menor que $1.000 1984 $22. Además.0 segundos indica una productividad satisfactoria.887 $1.976 Semana 2 $1.000 45. Calcule el presupuesto promedio anual para los 5 años anteriores a su elección (1978-1982).972 $1. ¿Debe estar preocupado el gerente de producción? 3-13 La National Tire Company tiene sus fondos de reserva en una inversión a corto plazo.000 1978 $ 9.) 3-15 Lillian Tyson ha sido.000 a) Calcule por separado las ganancias promedio de la representante en cada uno de los cuatro trimestres.000 1986 $19. Smith recorre el este de Estados Unidos como representante de ventas del editor de un libro de texto.973 $1. ¿podría concluir que ha habido una tendencia a aumentar o a disminuir en el presupuesto anual? ¿La presidenta actual ha ahorrado dinero al municipio? Medidas de tendencia central y dispersión en distribuciones de frecuencias .000 20.975 $1. ¿cuánto tendría que aumentar la cantidad invertida el último día para que la compañía obtuviera las tasas de interés más altas? f) Si la repuesta del inciso c) es mayor que $1.000 Año 2 20. El saldo diario (en millones de dólares) de la cuenta de inversión durante 2 semanas es el siguiente: $1. La compañía desea saber el promedio del costo de trabajo por hora para cada uno de los productos.0-16.2077 libras 65 n b) xw 5 x0 1 w S(u 3 f ) 1.Soluciones a los ejercicios de autoevaluación EA 3-1 (a) (b) Clase Frecuencia (f ) Punto medio (x) f2x 10. Considere.5 111 219 S ( f 3 x) 988.2077 libras } 5 13.0 3 24 1 8 17.5 132.0-17.2077 libras n 65 65 n d) Al mover la clase con el código 0 asignado k clases hacia arriba.3 Una segunda medida de tendencia central: la media ponderada 69 . EA 827.5 111.5 170.0 21 26 23 218 13.9 4 11.3 Una segunda medida de tendencia central: la media ponderada Una media ponderada La media ponderada nos permite calcular un promedio que toma en cuenta la importancia de cada valor con respecto al total. se sustituye x0 por x0 1 kw y se cambia cada código de u a u 2 k.0 22 28 24 216 12.5 } 5 } 5 15.9 11 15.5 75.5 10.0-14.0 0 0 22 216 14.5 108.0-12. la compañía califica para las tasas de interés reducidas. la compañía cuyos datos presentamos en la tabla 3-8. 3.5 1 } 5 15.0-13. semicalificado y calificado— para la producción de dos de sus productos finales.9 8 13.9 12 14.0 1 12 21 212 15.5 Código u 23 (c) u2f 23 Código u 25 u2f 25 11. 3.9 6 18.0-10. Pero como S(u 3 f ) S(u 3 f ) 5 (x0 1 kw) 2 kw 1 w } wxb 5 x0 1 w } n n S(u 2 k)f 5 (x0 1 kw) 1 w }} 5 wxc n se ve que no importa a qué clase se asigne el código 0.9 7 17. ésta utiliza tres niveles de trabajo —no calificado.5 0 39.5 2 22 0 0 16.0(219) S (u 3 f ) } 5 15.0 5 30 3 18 19.5 1 } c) wx 5 x0 1 w 1.0-15.0 6 0 12 4 00 8 65 a) wx 5 988.9 02 19.0(1} 11) 5 15.600 Sx 5 } 5 $68.5 122.9 1 10.0-18.000.5 4 28 2 14 18.9 6 12.0-11.967 3-2 xw 5 } 12 n Dado que esto excede $65. por ejemplo.9 8 16.0-19.5 46.5 174. 00/hora De manera análoga. Pero estos promedios son incorrectos. entonces una hora de trabajo en el producto 1 cuesta en promedio: 1}18} 3 $52 1 1}28} 3 $72 1 1}58} 3 $92 5 $8. el costo promedio de mano de obra por hora es $64/8 5 $8. una unidad del producto 2 requiere 10 horas de mano de obra. Para que nuestros cálculos sean correctos. 70 Capítulo 3 Medidas de tendencia central y dispersión en distribuciones de frecuencias . Para hacerlo. una hora de mano de obra en el producto 2 cuesta: 4 1}140} 3 $52 1 1}130} 3 $72 1 1}130} 3 $92 5 $6.80. requiere 8 horas de trabajo. el costo total del trabajo por unidad es ($5 3 1) 1 ($7 3 2) 1 ($9 3 5) 5 $64.80/hora Cálculo de la media ponderada Así.00. Para el producto 1. vemos que los promedios ponderados dan el valor correcto para los costos promedio por hora de mano de obra de los dos productos.00/hora En este caso la media aritmética es incorrecta La respuesta correcta es la media ponderada Usando esta tasa promedio podríamos calcular el costo del trabajo invertido en una unidad del producto 1 como $7(1 1 2 1 5) 5 $56. Una unidad del producto 1. 1/8 es de mano obra no calificada.00 5 3 Un simple promedio aritmético de los salarios pagados sería: Sx xw 5 } n [3-2] $5 1 $7 1 $9 5 }} 3 $21 3 5} 5 $7.00 1 4 Semicalificado 7. Otra forma de calcular el costo promedio por hora para los dos productos consiste en tomar un promedio ponderado del costo de los tres niveles de mano de obra. el costo total del trabajo por unidad es ($5 3 4) 1 ($7 3 3) 1 ($9 3 3) 5 $68. ponderamos el salario por hora de cada nivel mediante la proporción de la mano de obra total requerida para fabricar el producto. 3/10 de trabajo semicalificado y 3/10 de trabajo calificado. para un costo promedio de mano de obra por hora de $68/10 5 $6. Utilizando estas fracciones como ponderaciones o pesos. por ejemplo. y el de una unidad del producto 2 como $7(4 1 3 1 3) 5 $70. Podemos determinar los promedios correctos de la siguiente manera. las respuestas deben tomar en cuenta que se utilizan diferentes niveles de mano de obra. De este tiempo. 2/8 de mano de obra semicalificada y 5/8 de trabajo calificado. ya que consideran las diferentes cantidades de cada nivel de mano de obra que requieren los productos.Tabla 3-8 Mano de obra por proceso de manufactura Nivel de mano de obra Salario por hora en dólares (x) Horas de mano de obra por unidad producida Producto 1 Producto 2 No calificado $5. y como se invierten ocho horas de trabajo. de las cuales /10 son de trabajo no calificado. Para el producto 2. Si utilizamos estas fracciones como las ponderaciones (o los pesos).00 2 3 Calificado 9. En una fábrica. De manera análoga. utilizando los puntos medios como valores de x y las frecuencias de cada clase como pesos (o ponderaciones). el promedio ponderado de los componentes del conjunto de datos. Desde luego. es necesario usar la media ponderada de los valores. de acuerdo con la importancia relativa de los valores de x. y 4/10. la naturaleza de tales componentes determina qué es lo que la media está midiendo. Debe hacerse la distinción entre valores diferentes y observaciones individuales en un conjunto de datos. de acuerdo con la ecuación 3-1 o 3-2 es. la media aritmética de los valores (comparada con la media aritmética de las observaciones) tal vez no sea una medida SUGERENCIAS Y SUPOSICIONES de tendencia central exacta. Si se utiliza un valor promedio para tomar una decisión. 2/8 y 5/8 para el producto 1. semicalificado y calificado) o salarios de trabajadores hombres y mujeres o de trabajadores sindicalizados y no sindicalizados. insista en que la base correcta para la toma de decisiones es la media ponderada. que es igual a la división entre la suma de todos los pesos. Si los valores ocurren con frecuencias diferentes.Con símbolos. Si los valores de la muestra no aparecen con la misma frecuencia. 3. cualquier media calculada a partir de todos los valores de un conjunto de datos. Dividimos este producto entre la suma de todas las frecuencias. podemos determinar la media ponderada de todos los tipos de salarios (no calificado. en realidad. en realidad encontramos una media aritmética ponderada. la fórmula para calcular el promedio ponderado es: Media ponderada S(w 3 x) xww 5 }} Sw [3-5] donde. • • xww 5 símbolo para la media ponderada* w 5 peso asignado a cada observación (1/8. La letra w se conoce como subíndice y sirve para recordar que no se trata de una media ordinaria. Cuando calculamos la media aritmética de datos agrupados. 3/10 y 3/10 para el producto 2 del ejemplo) • S(w 3 x) 5 la suma de los productos de la ponderación de cada elemento por el elemento correspondiente Sw 5 suma de todas las ponderaciones • Si aplicamos la ecuación 3-5 al producto 1 de nuestro ejemplo de costo de mano de obra. pregunte cómo se calculó. En esos casos. sino de una media ponderada. *El símbolo xww se lee x barra sub w. ya que varias observaciones pueden tener el mismo valor. encontramos que S(w 3 x) x 5 }} [3-5] ww Sw 1 2 5 }} 3 $52 1 1}} 3 $72 1 1}} 3 $92 1 8 8 8 5 }}}} 1 2 5 }} 1 }} 1 }} Media aritmética de datos agrupados: la media ponderada 8 8 8 $ 8 5 }} 1 5 $8. por ejemplo.00/hora Observe que la ecuación 3-5 establece de una manera más formal algo que ya habíamos hecho.3 Una segunda medida de tendencia central: la media ponderada 71 . Standard. Suponga que los costos por caja son: High-Grade.59 y $11. con ventas actuales de $57. $2. A partir de los datos siguientes. logre un crecimiento en las ventas del 7.20%. el artículo de fin de semestre.50 $10.49 $5. calcule el promedio final para los cinco estudiantes del seminario. 35%. de- sea pronosticar las ventas regionales para el año próximo. Cada caja contiene 24 cintas. y que la sucursal de la costa del Pacífico. una subsidiaria de un importante fabricante de electrodomésticos. $3. nuestro promedio es menor porque nuestras ventas de estos artículos han sido: 7 EA 9 12 8 6 3 ¿Está Dave’s buscando un problema o resolviéndolo al hablar de promedios ponderados? 3-4 La Bennett Distribution Company.89. $4.00 $7. Los artículos costaron (en dólares) $1. Se espera que la sucursal de la costa del Atlántico. Dave’s le explicó al cliente: “Mi aviso se refiere a un promedio ponderado de estos artículos. High Standard.3 Ejercicios de autoevaluación EA 3-3 La tienda Dave’s Giveaway tiene un aviso: “Si nuestros precios promedio no son iguales o menores que los de otros. con ventas actuales de $79.Ejercicios 3. y Low.” Uno de los clientes de Dave’s fue a la tienda un día y puso sobre el mostrador las notas de venta de seis artículos que compró a un competidor por un precio promedio menor que el de Dave’s. Performance High-Grade.29 $2. con ventas actuales de $193. Jim ordenó 6 cajas de High-Grade. tenga un incremento del 8. $16. el examen final. ¿sería esto un buen negocio para Jim’s? d) ¿Cómo cambiaría su respuesta a los incisos a) a c) si hubiera 48 cintas por caja? 3-18 La mueblería Keyes publicó seis anuncios en los periódicos locales durante el mes de diciembre.5 millones. aumente sus ventas 7. 8 cajas de Standard. semestral Ex. final 87 91 86 84 82 90 92 89 93 88 3-17 Jim’s Videotaping Service hizo un pedido de cintas VHS.50.95 Los precios de Dave’s de los mismos seis artículos son $2.98. 10%. $7.15%.25%. 10%. El promedio de tareas tendrá un valor del 20% de la calificación del estudiante. a) ¿Cuál es el costo promedio por caja? b) ¿Cuál es el costo promedio por cinta? c) Suponga que Jim’s piensa vender cualquier cinta por $1. $6. usted se lo lleva gratis.8 millones.325 300 814 400 307 500 253 600 198 ¿Cuál es el número promedio de veces que un lector vio un anuncio de la mueblería Keyes durante diciembre? 72 Capítulo 3 Medidas de tendencia central y dispersión en distribuciones de frecuencias .19.082 200 1. $36. y los exámenes parciales. $18. el examen semestral. Como resultado se obtuvo la siguiente distribución de frecuencias: NÚMERO DE VECES QUE UN LECTOR VIO EL ANUNCIO DURANTE DICIEMBRE FRECUENCIA 000 897 100 1.35. Estudiante Tareas Parciales Artículo 1 2 3 4 5 85 78 94 82 95 89 84 88 79 90 94 88 93 88 92 Ex. 4 cajas de Performance High-Grade. $28. se espera que la sucursal del Medio Oeste.97 $3. 25%.25. ¿Cuál es la tasa promedio de crecimiento pronosticado en las ventas para el próximo año? Aplicaciones ■ ■ ■ 3-16 Un profesor decide utilizar un promedio ponderado para obtener las calificaciones finales de los estu- diantes que acuden a su seminario. 3 cajas de High Standard y 1 caja de Low Grade.3 millones. 17 0. Pittsburgh y Seattle. 30 dólares/hora y 15 dólares/hora.100 77.000. con producción anual de 62 millones. se obtiene S(w 3 x) xwc 5 }} Sw 7(1. La división de Pittsbrugh. pronostica un incremento del 11.5%. Young y Asociados.00) 1 6(7. ¿qué sugeriría que hiciera y cuál cree que sería una tasa apropiada? Soluciones a los ejercicios de autoevaluación EA 3-3 Con los promedios no ponderados. Si Mathews. tiene cuatro tipos de profesionales entre su personal: asesores financieros.000 y 35. debe crecer 6.000. correo aéreo. segunda clase. primera clase.20 en la competencia 31.13 0.62 45 5 } 5 $4.300 750 800 $0.40 0. se obtiene Sx 31. con producciones respectivas de 89 y 94 millones cada año.08 0.35 0.05 0.98) 1 6(7.97) 1 12(3.4%. Dallas.50 wxD 5 }6} 5 5. cuya producción anual es 48 millones. un despacho de asesoría financiera y administrativa. Minneapolis. correo registrado y correo certificado. 40 dólares/hora.1 Título de sección de página correspondiente 73 . respectivamente. Young y Asociados intenta formular una tasa de cobro promedio para estimar cuánto debe cobrar a los clientes en el año siguiente.400 24.900 1. Se espera que las divisiones de Minneapolis y Dallas.95) 7 1 9 1 12 1 8 1 6 1 3 5 }}}}}}} 195.■ ■ ■ 3-19 La Nelson Window Company tiene plantas de manufactura en cinco ciudades de Estados Unidos: Orlan- do. Las tasas promedio que se cobran a los clientes por el desempeño de cada una de estas categorías profesionales son 75 dólares/hora. asociados principales.600 1.50) 1 3(10.29) 1 9(2. 24. entrega especial.2%.49 45 5 } 5 $4. El volumen de envíos durante 1977 se da en la siguiente tabla: Tipo de correo Onzas enviadas (en millones) Precio por cada onza Tercera clase Segunda clase Primera clase Aéreo Entrega especial Registrado Certificado 16.20 wxc 5 }n} 5 }6} 5 $5. también debe crecer 6. La división de Orlando.19) 1 8(4. ¿Cuál es la tasa promedio de cambio en producción para la Nelson Window Company durante el año próximo? 3-20 El Servicio Postal de Estados Unidos maneja siete tipos básicos de cartas y tarjetas postales: tercera clase. 14.25 en la tienda Dave Con los promedios ponderados.49) 1 8(5.344 en la competencia xwD 5 7(1.45 ¿Cuál es el ingreso promedio anual por cada onza de la prestación del servicio? 3-21 Matthews.4%. respectivamente.50) }}}}}}} 7 1 9 1 12 1 8 1 6 1 3 193.59) 1 3(11.35) 1 9(2.89) 1 12(3.000. con una producción anual de 72 millones de ventanas.7 y 18. personal de campo y personal de oficina. Los registros de la firma indican el siguiente número de horas cobradas el año anterior en cada categoría: 8. La división de Seattle. Se elaboró el pronóstico de producción para el próximo año. tengan disminuciones del 9.303 en la tienda Dave 1. respectivamente. G.3 1 57. El factor de crecimiento considerado como la media aritmética simple sería (l.11 5 $168.15) S(w 3 x) 3-4 xww 5 }} 5 }}}} 193.6 3. 5 Ïn pwro wwduww cto wwdewto wwdowswlo wswvww alo wwres wwx [3-6] Si aplicamos esta ecuación a nuestro problema de la cuenta de ahorros.25) 1 79. Suponga que inicialmente depositamos $100 y dejamos que acumule intereses a diferentes tasas durante cinco años. el crecimiento de una cuenta de ahorros. En tales casos. El resultado es el factor de crecimiento como media geométrica. pues proporciona resultados equivocados.08 1 1.11. como la tasa de crecimiento promedio en un periodo de varios años. Considere.10 1 1. llamada simplemente la M. Así. La fórmula para encontrar la media geométrica de una serie de números es: Media geométrica Número de valores x M.3(8. cuando trabajamos con cantidades que cambian en cierto periodo. que corresponde a una tasa de interés promedio del 11% anual. podemos determinar que 1.1 w0ww 3w1. por ejemplo. la palabra promedio en el uso popular es equivalente al promedio no ponderado del uso técnico y es seguro que el cliente típico se molestará con la afirmación de Dave (entienda o no el matiz técnico).0 w7ww 3w 1.20) 1 57.46% 330. Lo que debemos encontrar es la media geométrica.11.1093 es el factor de crecimiento promedio correcto.5 Sw 2466.8 1 79. si el banco diera intereses a una tasa constante del 11% anual. La entrada con el encabezado “factor de crecimiento” es igual a: tasa de} interés 11} 100 El factor de crecimiento es la cantidad por la que multiplicamos los ahorros al inicio del año para obtener el saldo al final del mismo. 5 Ïn Pwro 5 5 Ï1 w.12 1 1.EA Aunque en términos técnicos Dave está en lo correcto. un depósito de $100 crecería en cinco años a: $100 3 l.11 3 1. El crecimiento se resume en la tabla 3-9.11 3 1.1 w2ww 3w1. wwduww cto wwdewto wwdowswlo wswvww alo wwres wwx M.8(7.G.07 1 1.11 3 1.G.1 w8w 74 Capítulo 3 Medidas de tendencia central y dispersión en distribuciones de frecuencias [3-6] . Para encontrar el factor de crecimiento promedio correcto podemos multiplicar los factores de crecimiento de los cinco años y luego obtener la raíz quinta del producto (número que al multiplicarse cuatro veces por sí mismo da como resultado el producto inicial).18)/5 5 1.435 5 } 5 7.51 En la tabla 3-9 se muestra que la cifra real es sólo $168. el factor de crecimiento promedio correcto debe ser ligeramente menor a 1. la media aritmética simple resulta inapropiada. la tasa de crecimiento tomada como la media aritmética es incorrecta Cálculo de la media geométrica Algunas veces. 193.5(7.0 w8ww 3w1.00. necesitamos conocer una tasa promedio de cambio. que es el promedio adecuado que debemos utilizar. Sin embargo.4 Una tercera medida de tendencia central: la media geométrica Búsqueda de la tasa de crecimiento: la media geométrica En este caso.11 3 1. 3.5. el uso de la media apropiada conduce a una diferencia significativa.93% anual obtenida con la media geométrica está muy cerca de la tasa promedio incorrecta del 11% anual obtenida con la media aritmética.56 127.10 1. SUGERENCIAS Y SUPOSICIONES 3. por ejemplo.07 1. pero incluso diferencias pequeñas pueden generar malas decisiones. Cuando vea el valor del incremento promedio en la inflación. Sin embargo.08 1. Suponga que en un periodo de cinco años en un régimen económico con un muy alto índice de inflación.37 168. 3.5 3 3.88 en cinco años: $100 3 3. un error considerable. Esto se debe a que las tasas de interés son relativamente pequeñas.4 Una buena sugerencia de trabajo es usar la media geométrica siempre que se desee calcular el cambio porcentual promedio en el tiempo para algunas variables. los bancos pagan tasas de interés anual de 100. que es más complicada. Esto corresponde a una tasa de interés promedio anual del 250%. Se usa la media geométrica para mostrar los efectos multiplicativos en el tiempo de los cálculos del interés compuesto y la inflación.88 Este resultado excede al resultado real de $42. (Calculamos estos factores de crecimiento del mismo modo que en la tabla 3-9.347 ← Factor de crecimiento promedio [3-6] Este factor de crecimiento corresponde a una tasa de interés promedio del 235% anual. si el banco en realidad pagara intereses a una tasa constante de 250 anual.5 1 4 1 5)/5 5 3. un depósito inicial de $100 crecerá a $100 3 2 3 3 3 3. los bancos deben pagar altas tasas de interés para atraer a los ahorradores.00 Tabla 3-9 Crecimiento de un depósito de $100 en una cuenta de ahorros 5 5 Ï1 w.Año Tasa de interés (porcentaje) Factor de crecimiento Ahorros al final de año (dólares) 1 2 3 4 5 7% 8 10 12 18 1. pregunte si se trata de la media geométrica y tenga cuidado si no lo es. En este caso. entonces $100 crecerían a $52. En ciertas situaciones.12 142. tenga cuidado de no verse tentado a utilizar la media aritmética en lugar de la geométrica.000.00 115. 300 y 400%.1093 ← Factor de crecimiento promedio (media geométrica de los 5 factores de crecimiento) Advertencia: utilice la media apropiada Observe que la tasa de interés promedio correcta del 10.5 3 3. Utilicemos la fórmula para obtener la media geométrica de una serie de números para determinar el factor de crecimiento correcto: wwduww cto wwdewto wwdowswlo wswvww alo wwres wwx M. Una tercera medida de tendencia central: la media geométrica 75 .12 1.521.G.18 $107.) En cinco años. El siguiente ejemplo nos muestra por qué.5 3 3.5 5 $52. pues se está manejando un valor incorrecto.521.5. El factor de crecimiento como media aritmética es de (2 1 3 1 3. 250.5w 3w 4w 3w5 5 Ïw 5 5 Ïw 4w2w0 5 3. 5 Ïn pwro 5 2w 3w3w 3w3w . Sin embargo.6 w7w9w9w6w5w 5 1.5 3 3.5 3 4 3 5 5 $42.500. 200.000 en más de $10. las respuestas obtenidas con la media aritmética no difieren mucho de las correspondientes a la media geométrica. 4 y 5. que corresponde a un factor de crecimiento de 2. En las economías con un alto índice de inflación. a $1. Durante los últimos 4 meses Realistic recibió 4 embarques mensuales de esta grabadora con los siguientes costos unitarios: $275. Si esta tasa continúa.Ejercicios 3.36 $2. pero Bob perdió los registros del sexto año después de haber calculado la media. $240 y $225.06 3-24 La compañía Birch.5% ¿Cuál es el aumento porcentual promedio del valor neto en el periodo de 5 años? ■ ■ ■ ■ ■ 3-23 MacroSwift. el dueño de una tienda adquirió $120 de cubierta de acrílico para forrar sus nuevos mostradores.5% 9. 1.30 76 1992 Capítulo 3 Semana 2 $2.24. La primera compra fue a $1.0% 7.08 20.250 14.11 0.075 0.23. 1989 1990 1991 1992 1993 1994 1995 0.36 $2.095 0.09 0.15.42 Semana 3 Semana 4 Semana 5 Semana 6 Semana 7 Semana 8 $2. y utilice el resultado para estimar la producción en 1999. Calcule el incremento promedio porcentual del gasto por deudores morosos durante ese periodo.07 0. a $1.11 20. ¿Cuál es el cambio porcentual promedio del precio en la tienda de Lisa? Semana 1 $2. 1. hizo la adquisición en tres compras de $40 cada una.42 $2.35.30.04 0.24 $2. ¿A qué tasa promedio mensual ha disminuido el precio de venta de Realistic en estos 4 meses? Aplicaciones ■ 3-22 Hayes Textiles ha mostrado los siguientes aumentos porcentuales en su valor neto durante los últimos 5 años: 1992 1993 1994 1995 1996 5% 10.310 15.500 13. llega a un resultado de 1. 1988 1989 1990 1991 1992 1993 1994 1995 1996 0.19. fabricante de tableros de circuitos eléctricos. $250.10 y la tercera. ha producido el siguiente número de unidades en los últimos cinco años: 1993 1994 1995 1996 12. Los factores de crecimiento individuales de los últimos 5 años fueron 1. 3-25 Bob Headen desea calcular el factor de crecimiento promedio de su tienda de aparatos de sonido en los últimos 6 años.49 $2. la grabadora Dynamic 400-S VHS costaba $300. ha publicado un incremento en su valor neto du- rante 7 de los últimos 9 años.741 17. ¿Cuál era ese factor de crecimiento? 3-26 En un periodo de 3 semanas.630 Calcule el aumento porcentual promedio de unidades producidas en este periodo.03 0.4 Ejercicios de autoevaluación EA EA 3-5 El crecimiento en el gasto por deudores morosos de Johnston Office Supply Company durante los últimos años es el siguiente.0% 6.49 Medidas de tendencia central y dispersión en distribuciones de frecuencias . la segunda.14 0. Calcule el cambio porcentual promedio en el valor neto durante este periodo.120 3-6 Las tiendas Realistic Stereo etiquetan su mercancía 35% arriba del costo de su última adición al inventario. utilizando una media geométrica. el gigante de software en Estados Unidos. ¿Cuál fue la tasa de crecimiento promedio semanal en el precio por pie cuadrado que pagó por la cubierta? 3-27 Lisa’s Quick Stop atrae a sus clientes con la venta de leche a un precio 2% menor que la tienda de abarrotes más grande del pueblo. 1.00 el pie cuadrado. estime el incremento porcentual para 1977 respecto a 1995. Hasta hace 4 meses.09 0. Los siguientes son los precios de un galón de leche durante un periodo de 2 meses.108 0. Suponga condiciones similares en los 3 años siguientes y estime el cambio porcentual para 1998 respecto a 1996.11 0.08 0.19 y 1. 20. La mitad de los elementos están por arriba de este punto y la otra mitad está por debajo. b) Calcule el aumento porcentual promedio utilizando ahora los datos de los 6 años. Inc.29% más alto que en 1995.00 y $66.9 w0w8w7w6w9w9w9w2w 5 1. ¿Cuál fue el crecimiento porcentual promedio de la empresa durante este lapso? Si esta tasa promedio se mantiene estable durante 3 años más. Si aplicamos es3. si hay un número par de observaciones.00. la mediana es el promedio de los dos elementos de en medio.2029. ¿cuánto le costará a la empresa procesar un pedido al final de ese periodo? 3-29 Un sociólogo ha estado estudiando los cambios anuales en el número de convictos asignados al reclusorio más grande del estado. es decir. ¿Cuál parece ser el efecto del nuevo reglamento? Soluciones a los ejercicios de autoevaluación EA EA 7 3-5 M.9167.0 w9w5w)( w1w. 5 Ïw0w El precio ha disminuido a una tasa promedio del 6.9 w6w0w0w )(w0w .7 w5w0w0 5 0. primero se organizan en orden descendente o ascendente. Cálculo de la mediana a partir de datos no agrupados Localización de la mediana de datos no agrupados Para hallar la mediana de un conjunto de datos.G.9091.1 w2w)w 5 Ï1w.9375. En lenguaje formal.0 w7w5w)( w1w. Durante los últimos 5 años.1 w0w8w)( w1w. La estimación de gastos por deudores morosos en 1997 es (1.5 Una cuarta medida de tendencia central: la mediana 77 . Si el conjunto de datos contiene un número impar de elementos.9 w1w6w7w (0 w . Los datos más recientes recabados por el sociólogo son los siguientes: 1991 24% 1992 1993 1994 1995 1996 5% 10% 3% 6% 25% a) Calcule el aumento porcentual promedio utilizando sólo los datos de 1992 a 1995. tiene registros del costo de procesamiento de cada pedido.00.■ ■ 3-28 Industrial Suppliers.00.94% mensual. $58. este costo fue de $55.9 w3w7w5w) 5 Ïw0w .9 w0w9w1w )(w0w . el de en medio en el arreglo es la mediana. 240/250 5 0.1 w1w(1 w. $65.09675 El incremento promedio es 9. De acuerdo con la ecuación 3-7. $61.0 w8w)( w1w.0694 M.9600 y 225/240 5 0.5 Una cuarta medida de tendencia central: la mediana Definición de mediana La mediana es una medida de tendencia central diferente a cualquiera de las que hemos tratado hasta ahora. de manera que 4 4 .00.0 w9w)( w1w. 3-6 Los factores de crecimiento mensual son 275/300 5 0.09675)2 2 1 5 0. 3.675% anual. 250/275 5 0. La mediana es un solo valor del conjunto de datos que mide la observación central del conjunto.9306 5 1 2 0. 5 Ï7 1w. Sus datos están expresados en términos del aumento porcentual en el número de presos (un número negativo indica una disminución porcentual). Antes. c) En 1990 se aprobó un nuevo código penal. la mediana es el cuarto término del arreglo (7 1 1)/2 5 4. Esta sola observación es el elemento que está más al centro del conjunto de números. la mediana es: Mediana Número de elementos del arreglo n 1} 1 -ésimo término del arreglo de datos Mediana 5 1} 2 2 Un número impar de elementos [3-7] Suponga que deseamos encontrar la mediana de siete elementos de un arreglo de datos.G. la población del reclusorio crecía a una tasa de alrededor del 2% anual. 5 del arreglo. podemos calcular la mediana del saldo de las cuentas de cheques de estos 600 clientes determinando cuál de los 10 intervalos de clase contiene la mediana.99). que contiene datos acerca de los 600 clientes bancarios considerados antes. Como tenemos 600 cuentas. Si suponemos que estos 187 elementos empiezan en $100.00 a $149. necesitamos calcular el promedio de los elementos cuarto y quinto. En este caso.8 minutos. Este valor pudo haber sido 15.00 y se encuentran igualmente espaciados en todo el inter- Tabla 3-10 Tiempos para los integrantes de un equipo de atletismo Elemento del arreglo de datos Tiempo en minutos 1 4. Por ejemplo.0. Los datos están organizados en orden descendente.2 2 4.5-ésimo término Como la mediana es el elemento número 4. Considere los datos mostrados en la tabla 3-11 referentes al número de pacientes tratados diariamente en la sala de emergencias de un hospital. debemos sumar las frecuencias que aparecen en la columna de frecuencias de la tabla 3-12 hasta que lleguemos al elemento número (n 1 1)/2. y la mediana ¡seguiría siendo la misma! Calculemos ahora la mediana de un arreglo con un número par de elementos. descubriremos que el cuarto elemento del arreglo es 4. no conocemos todas las observaciones que llevaron a la tabla 3-12. El cuarto elemento de la tabla 3-11 es 43 y el quinto 35. Pero cuando tomamos en cuenta al tercer intervalo de clase y sumamos 187 elementos a los 201 acumulados.Lo mediana no se ve distorsionada por valores extremos Un número par de elementos to al ejemplo de los tiempos de los siete integrantes de un equipo de atletismo. En consecuencia. tendremos un total de 388. 39 es la mediana del número de pacientes por día tratados en la sala de emergencias durante el periodo de 8 días. El problema consiste en encontrar los intervalos de clase que contengan a los elementos número 300 y 301. No obstante. Observe que a diferencia de la media aritmética calculada.8 5 5. la mediana que calculamos en la tabla 3-l0 no se distorsiona por la presencia del último valor (9.0). El promedio de estos dos elementos es igual a (43 1 35)/2 5 39. el valor para (n 1 1)/2 es 300. tenemos acceso a los datos hasta después de agruparlos en una distribución de frecuencias.7 4 4. tenemos 10 intervalos de clase y un registro de las frecuencias con las que aparecen las observaciones en cada intervalo. La clase de la mediana de este conjunto de datos contiene 187 observaciones. Para ello.0 ↑ Mediana Tabla 3-11 Pacientes tratados en la sala de urgencias durante 8 días consecutivos 78 Capítulo 3 Elemento del arreglo de datos Número de pacientes 1 86 2 52 3 49 4 43 5 35 ↑ Mediana de 39 Medidas de tendencia central y dispersión en distribuciones de frecuencias 6 31 7 30 8 11 .1 7 9. Ésta es la mediana del tiempo del equipo de atletismo.0 o incluso 45.3 3 4.0 6 5. las observaciones número 300 y 301 deben estar en esta tercera clase (el intervalo de $100. La mediana de este conjunto de datos sería n 1} 1 -ésimo término del arreglo de datos [3-7] Mediana 5 1} 2 2 8} 11 5} 2 5 4. La frecuencia acumulada para las dos primeras clases es sólo 78 1 123 5 201. Por consiguiente. Cálculo de la mediana a partir de datos agrupados Búsqueda de la mediana de datos agrupados Localice la clase de la mediana A menudo.5 (el promedio de los números 300 y 301). entonces podemos interpolar y encontrar valores para los elementos 300 y 301.99 250.00-499. La mediana real de este conjunto de datos es el valor del elemento número 300. Sume las frecuencias de cada clase para encontrar la clase que contiene a ese elemento más al centro (la tercera clase.99 350.99 300. Utilice la ecuación 3-7 para determinar qué observación de la distribución está más al centro (en este caso.99 50.00.00 2 $149.00-249. En resumen.267 5 $126.00 }}} 5 $0.Tabla 3-12 Clase en dólares Saldos mensuales promedio de 600 clientes 0.99. respectivamente.5 Una cuarta medida de tendencia central: la mediana 79 .17 1 $126. podemos usar $126. es decir.99 450.267 de ancho Pasos para encontrar la mediana de datos agrupados 187 Si existen 187 pasos de $0.99 150. entonces éste es: ($0.00-199. Este promedio es: $126.49.44 }}} 5 $126.00-449.267 cada uno y necesitamos 98 pasos para llegar al elemento número 99. 2. Primero determinamos que el elemento número 300 es la observación número 99 de la clase de la mediana: 300 2 201 [elementos de las primeras dos clases] 5 99 y que el elemento número 301 es la observación número 100 de la clase mediana: 301 2 201 5 100 Entonces podemos calcular el ancho de los 187 pasos iguales desde $100.5.30) es la mediana de los saldos mensuales de las cuentas de cheques.99 Frecuencia 78 123 187 82 51 47 13 9 6 004 Clase de la mediana 600 valo de clase desde $100.00-349.17 y el elemento número 100 está un paso más adelante: $126.99 100.30 2 Esta cantidad ($126.99).99 de la siguiente manera: Primer elemento de la siguiente clase Primer elemento de la clase de la mediana $150.17 1 $0.99. o $100. estimada a partir de los datos agrupados de la tabla 3-12. podemos calcular la mediana de un conjunto de datos agrupados de la siguiente manera: 1.44 como los valores de los elementos 300 y 301.00 2 $100. 3.00 hasta $149.00.267 3 98) 1 $100 5 $126.00-299.149.17 y $126.44 Por tanto.00 hasta $149.99 200.99 400. el promedio de los elementos 300 y 301).00-399. el promedio de las observaciones 300 y 301. 267 5 $126. tome el promedio de los valores obtenidos para la mediana calculados en el paso número 6 ($126. fm 5 187.17.267). Determine el número de pasos que hay desde el límite inferior de la clase de la mediana hasta el elemento correspondiente a la mediana (98 pasos para el elemento número 99. entonces n 5 600. m˜ 5 mediana de la muestra n 5 número total de elementos de la distribución • F 5 suma de todas las frecuencias de clase hasta. Calcule el valor estimado de la mediana multiplicando el número de pasos necesarios para llegar a la observación mediana por el ancho de cada paso y al producto súmele el valor del límite inferior de la clase mediana ($100 1 98 3 $0. 5.75 2$50 1 $100 5 }} 5 (0. como en nuestro ejemplo.17 1 $0.3.30). Determine el ancho de cada paso para pasar de una observación a otra en la clase mediana. la ecuación sería: Mediana de la muestra para datos agrupados n 1 1)/2 2 (F1 1) w 1 L m˜ 5 (}} m fm 1 2 [3-8] donde. Para hacer más corto el procedimiento anterior.35 ← Mediana de la muestra estimada La pequeña diferencia entre este resultado y el que calculamos siguiendo el camino largo se debe al redondeo. 6. w 5 $50 y Lm 5 $100. $126. el 100). Si existe un número par de observaciones en la distribución. 99 para el 100). F 5 201. 80 Capítulo 3 Medidas de tendencia central y dispersión en distribuciones de frecuencias .44). Un método más sencillo dividiendo el intervalo de clase entre el número de elementos contenidos en la clase (ancho 5 $0. pero sin incluir. 7. Determine el número de elementos de la clase (187) y la localización de la clase que contiene a la mediana (la observación 300 fue el elemento número 99.267 5 $126. la clase de la mediana • fm 5 frecuencia de la clase de la mediana • • • w 5 ancho de intervalo de clase • Lm 5 límite inferior del intervalo de clase de la mediana Si utilizamos la ecuación 3-8 para calcular la mediana de nuestra muestra referente a los saldos de cuentas de cheques. n 1 1)/ 2 2 (F 1 1) w 1 L m˜ 5 (}}} m fm 1 2 601/2 2 202 5 }} 1 187 [3-8] 2$50 1 $100 1 9188. la observación 301.527)($50) 1 $100 5 $126. 4. Para una muestra. los especialistas en estadística utilizan una ecuación para determinar la mediana de un conjunto de datos agrupados. Clase Frecuencia Clase Frecuencia 100-149. En el capítulo 7 analizaremos el tema de la estimación con detalle. que tenemos tres tirajes de una prensa de imprenta. en dólares. c) El ancho de los pasos iguales en la clase de la mediana. nítida. 100. por ejemplo. Podemos ordenar los resultados desde mejor hasta peor: extremadamente nítida. corresponden a una libra de tocino. Ventajas de la mediana Desventajas de la mediana Hay buenas y malas noticias respecto al uso de la mediana. es decir la tercera (nítida). Suponga. 4.5 450-499. debido a que la mediana es una posición promedio. en lugar de números.08 1.5 12 14 27 58 300-349. 5. 40.5 250-299. La más importante.5 400-449. es que los valores extremos no afectan a la mediana de manera tan grave como a la media. También. que no tiene relación aparente con ninguno de los otros valores de la distribución.5 Una cuarta medida de tendencia central: la mediana 81 . La mediana de las cinco clasificaciones es la (5 1 1)/2.5 150-199. muy nítida. Esto implica consumo de tiempo para cualquier conjunto de datos que contenga un gran número de elementos. Podemos encontrar la mediana incluso cuando nuestros datos son descripciones cualitativas como color o nitidez. Si la distribución se ve poco usual. verificados la semana pasada.05 a) Calcule la mediana del precio por libra. casi todo lo que calcule con esos datos tendrá defectos o limitaciones. Los precios siguientes. la media es más fácil de usar que la mediana. Para los valores 2.98 1.5 72 63 36 18 3. Por consiguiente.14 1. Advertencia: antes de hacer cálculos revise los datos con su propio sentido común. mostrada en el ejemplo del equipo de atletismo de la tabla 3-10. La buena noticia es que calcularla es bastante rápido y evita el efecto de valores muy grandes o muy pequeños.33 1. ligeramente borrosa y muy borrosa.Ventajas y desventajas de la mediana La mediana tiene varias ventajas respecto a la media. $1. La mediana es fácil de entender y se puede calcular a partir de cualquier tipo de datos.5 200-249. b) El número de elemento que representa la mediana.24 1. Ciertos procedimientos estadísticos que utilizan la mediana son más complejos que aquellos que utilizan la media. 213 y 347.09 1. La mala noticia es que se sacrifica cierta exactitud al elegir un solo valor para representar una distribución. c) ¿Cuál es la mejor medida de tendencia central de estos datos? 3-8 Para la siguiente distribución de frecuencias. si deseamos utilizar un estadístico de la muestra para estimar un parámetro de la población. SUGERENCIAS Y SUPOSICIONES Ejercicios 3.5 350-399. incluso a partir de datos agrupados con clases de extremo abierto como la distribución de frecuencias de la tabla 3-7. debemos ordenar los datos antes de llevar a cabo cualquier cálculo.55 1. b) Calcule la media del precio por libra. La mediana tiene también algunas desventajas. d) El valor estimado de la mediana para estos datos.22 1. la mediana es 40. a menos que la mediana entre en una clase de extremo abierto.5 Ejercicios de autoevaluación EA 3-7 Swifty Markets compara los precios de artículos idénticos vendidos en sus tiendas de alimentos. Los resultados deben clasificarse de acuerdo con la nitidez de la imagen. determine: a) La clase de la mediana.08 EA 0. 5 8 15 23 37 46 Clase 60-69.5 70-79.9 5 13 16 8 6 a) Utilice la ecuación 3-8 para estimar la mediana del peso de los peces.5 80-89. se encuentra investigando cantidad de material utilizado en los trabajos de tapicería de la empresa.99.9 25. c) ¿Qué valor es la mejor medida de tendencia central para estos datos? 3-32 Para la siguiente distribución de frecuencias: a) ¿Qué número representa la mediana? b) ¿Qué clase contiene la mediana? c) ¿Cuál es el ancho de los pasos iguales en la clase de la mediana? d) ¿Cuál es el valor estimado de la mediana para estos datos? e) Utilice la ecuación 3-8 para estimar la mediana de los datos. 3-34 El Departamento de Transporte de Chicago cree que el exceso de velocidad de los autobuses aumenta el costo de mantenimiento. b) Calcule la media para el kilometraje de los 20 camiones.9 75.9 50. debido a los Capítulo 3 Medidas de tendencia central y dispersión en distribuciones de frecuencias .9 100-124. ¿qué explicación podrían darle los conductores de los autobuses? 17 29 33 52 44 ■ 657 559 a) Calcule la mediana del kilometraje que recorre un camión. c) Compare los incisos a) y b) y comente cuál es la mejor medida de tendencia central de los datos. A continuación presentamos registros del kilometraje semanal: 810 1.5 90-99. Piensa que la mediana de los tiempos razonable para el recorrido del aeropuerto O’Hare al Centro John Hancock debería ser alrededor de 30 minutos.5 20-29.5 100 o más Frecuencia 52 84 97 16 5 3-33 Los siguientes datos representan el peso de los peces atrapados por el bote deportivo “El Fugitivo”: Clase Frecuencia 0. b) Utilice la ecuación 3-3 para calcular la media de estos datos.5 50-59.24. La cantidad varía de un trabajo a otro.450 ■ ■ ■ 756 469 789 890 210 987 28 31 15 25 14 12 82 589 788 488 943 876 447 689 775 29 22 28 29 32 33 24 26 8 35 a) Calcule la mediana del número de canales proporcionados. De la siguiente muestra de datos (en minutos) ¿puede usted ayudar al departamento a determinar si conducen los autobuses con exceso de velocidad? Si de los datos concluye que la velocidad fue excesiva.49. ¿Son cercanas entre sí sus dos estimaciones? Clase Frecuencia 10-19.5 30-39.74.5 40-49. 3-31 El Consumer’s Bureau de Carolina del Norte realizó una encuesta acerca de los proveedores de televisión por cable en el estado. Los siguientes datos se refieren al número de canales que ofrecen en el servicio básico: 32 ■ 450 560 32 19 22 29 34 21 29 28 43 30 22 34 33 39 41 3-35 Mark Merritt. b) Calcule el número medio de canales proporcionados. gerente de la Quality Upholstery Company. c) Compare el resultado de los incisos a) y b) y explique cuál es la mejor medida de la tendencia central de los datos.Aplicaciones ■ 3-30 La empresa Meridian Trucking lleva un registro del kilometraje de todos sus vehículos. 5 350-399.99 1.14 5 $1.7344 3.14 1. ligeramente en contra.09 1.6944 300 1 38(0.5 Una cuarta medida de tendencia central: la mediana 83 .99 52 337 1.492 3-37 Un investigador obtuvo las respuestas siguientes a una de las preguntas incluidas en una encuesta de evaluación: totalmente en contra.5 150-199. la mediana puede ser un poco mejor que la media. Monto de reclamaciones ($) Frecuencia Monto de reclamaciones ($) Frecuencia menos que 250 250-499. utilice la mediana para predecir cuántos metros de material se van a necesitar.115.24 1.5 Promedio de los datos 150 y 151 Ancho de paso 5 50/72 5 0.5 12 14 27 58 72 63 36 18 12 26 53 111 183 246 282 300 Clase de la mediana 5 300-349.0816 (151) } 653.066 750-999. 3-36 Si la cantidad de reclamaciones por accidentes automovilísticos a una compañía de seguros muestra la siguiente distribución.98 EA 3-8 1.5 300-349. Verifique su resultado usando la ecuación 3-8. un poco de acuerdo. de acuerdo. 51/4 53/8 51/2 57/8 6 ■ ■ 61/4 6 57/8 53/4 57/8 77/8 8 81/4 81/2 9 6 61/4 61/2 7 71/2 91/4 91/2 93/8 91/8 91/4 91/2 97/8 101/4 101/2 97/8 101/2 101/4 101/8 101/8 10 Si se tienen programados 150 trabajos para las siguientes 3 semanas.55 1. pero en realidad no hay una diferencia notoria.99 500-749. De las seis respuestas. ¿cuál es la mediana? Soluciones a los ejercicios de autoevaluación EA 3-7 Primero se arreglan los precios en orden ascendente: 0.diferentes estilos y tamaños de los muebles.05 1.08 1.33 1.000 o más 1.22 1.6944) 5 326.09 1} 1.6944) 5 327.776 1. a) b) c) d) Clase Frecuencia Frecuencia acumulada 100-149. el promedio de los datos 5 y 6 a) Mediana 5 } 2 11.5 200-249.5 400-449.} 76 5 $1.4688 Mediana 5 } 2 5 32.5 450-499.3872 (150) 300 1 39(0.4688 653. Merrit reunió los datos siguientes (en yardas) de los trabajos hechos la semana anterior. altamente de acuerdo. determine la mediana utilizando el método descrito anteriormente.176 b) xw 5 }S}x 5 } n 10 c) Debido a que los datos están ligeramente sesgados. en contra.5 250-299.08 1. elegimos 4-7 viajes. El valor modal es 15. utilizamos la ecuación 3-9: Moda d1 w Mo 5 LMo 1 } d1 1 d2 1 2 [3-9] donde. Agrupemos ahora estos datos en una distribución de frecuencias. pero no nos indica que la mayor cantidad de viajes está por debajo de 10. La moda nos dice que 15 es el número más frecuente de viajes. Es por esto que rara vez utilizamos la moda de un conjunto de datos no agrupados como una medida de tendencia central. En ocasiones. es decir. La moda es el valor que más se repite en el conjunto de datos. como en la tabla 3-14. por ejemplo. el azar puede desempeñar un papel importante en la organización de datos. ya que se presenta más a menudo que cualquier otro valor (tres veces). Si seleccionamos la clase que tiene el mayor número de observaciones.6 Una medida final de tendencia central: la moda Definición de moda Riesgos al usar la moda de datos no agrupados Búsqueda de la clase modal de datos agrupados La moda es una medida de tendencia central diferente de la media. La tabla 3-13.3. presenta el número de viajes de entrega por día que hace una revolvedora de concreto. Por esto. pues en realidad no se calcula mediante algún proceso aritmético ordinario. siempre que utilizamos la moda como una medida de tendencia central de un conjunto de datos. debemos calcular la moda de datos agrupados. podemos suponer que la moda está localizada en la clase que contiene el mayor número de elementos.7 es el resultado al calcular la media). Para determinar un solo valor para la moda a partir de esta clase modal. a la cual podemos llamar clase modal. pero un tanto parecida a la mediana. en la clase que tiene la mayor frecuencia. el azar hace que un solo elemento no representativo se repita lo suficiente para ser el valor más frecuente del conjunto de datos. • • LMO 5 límite inferior de la clase modal d1 5 frecuencia de la clase modal menos la frecuencia de la clase que se encuentra inmediatamente menor que ella Tabla 3-13 Viajes de entrega por día en un periodo de 20 días Viajes organizados en orden ascendente 0 2 5 7 15 0 2 5 7 15 1 4 6 8 15 1 4 6 12 19 } ← Moda Tabla 3-14 Distribución de frecuencias de los viajes de entrega 84 Capítulo 3 Clase de número de entregas Frecuencia 0-3 4-7 8-11 12 o más 6 8 1 5 ↑ Clase modal Medidas de tendencia central y dispersión en distribuciones de frecuencias .7 (6. Cálculo de la moda de datos agrupados Cuando los datos ya se encuentran agrupados en una distribución de frecuencias. Esta clase es más representativa de la actividad de la revolvedora que la moda de 15 viajes diarios. Como en todos los demás aspectos de la vida. Una moda de 15 implica que la actividad de la planta es mayor que 6. se graficaron los datos de la tabla 3-15. es la estimación de la moda. d2 5 187 2 82 5 105 y w 5 $50. Esta distribución. entonces. En la figura 3-6. Tabla 3-15 Errores organizados en orden ascendente Errores de facturación por día en un periodo de 20 días 0 2 0 4 1 1 1 } 4 ← Moda 4 } ← Moda 5 6 9 6 9 7 8 10 12 8 12 FIGURA 3-6 Datos de la tabla 3-15 que muestran una distribución bimodal Frecuencia 3 2 1 0 1 2 3 4 5 6 7 Número de errores 3. Se presentan con los valores correspondientes a 1 y 4 errores de facturación.d2 5 frecuencia de la clase modal menos la frecuencia de la clase inmediatamente mayor que ella • w 5 ancho del intervalo de la clase modal • Si utilizamos la ecuación 3-9 para calcular la moda del saldo de las cuentas de cheques de nuestro ejemplo (vea la tabla 3-12). d1 5 187 2 123 5 64. tiene dos modas y se le conoce como distribución bimodal. entonces LM 5 $100. Distribuciones multimodales Distribuciones bimodales ¿Qué sucede cuando tenemos dos valores diferentes y cada uno parece ser el mayor número de veces que aparece un valor en un conjunto de datos? En la tabla 3-15 se muestran los errores de facturación en un periodo de 20 días cometidos en las oficinas administrativas de un hospital. O 1 Mo 5 LMo 1 }d} w d1 1 d2 1 2 [3-9] 64 5 $100 1 }} $50 64 1 105 5 $100 1 (0.38)($50) 5 $100 1 $19 5 $119. La distribución de la figura 3-7 se conoce también como bimodal. Observe que hay dos puntos que son los más altos de la gráfica. Ambos aparecen tres veces.00 ← Moda El resultado obtenido. Observe que tanto 1 como 4 parecen ser el mayor número de errores del conjunto de datos. aunque en este caso los dos valores más altos no sean iguales.6 8 9 10 11 12 Una medida final de tendencia central: la moda 85 . $119. Es claro que estos puntos son mayores que los valores más cercanos de la frecuencia observada. Moda Moda FIGURA 3-7 Distribución bimodal con dos modas distintas Ventajas y desventajas de la moda Ventajas de la moda Desventajas de la moda La moda. escogemos el valor más frecuente del conjunto de datos como el valor modal. la mediana está a la derecha de la moda y la media se encuentra todavía más a la derecha de la moda y la mediana. la moda todavía se encuentra en el punto más alto de la distribución. debemos decidir si vamos a utilizar la media. los valores extremos no afectan indebidamente a la moda. como se usan la media y la mediana. A pesar de estas ventajas. Comparación de la media. la mediana y la moda son idénticas en una distribución simétrica Cuando trabajamos problemas de estadística. podemos hablar de estilos modales cuando. Resulta claro que la moda es una medida inútil en tales casos. la mediana y la moda La media. “nítida” y “borrosa”. por ejemplo. “nítida”. Una tercera ventaja de la moda es que la podemos utilizar aun cuando una o más clases sean de extremo abierto. cada valor es la moda. “nítida”. no es necesario escoger la medida de tendencia central. En esos casos. Aun cuando los valores extremos sean muy altos o muy bajos. la moda no se utiliza tan a menudo como medida de tendencia central. por ejemplo. Otra desventaja consiste en que cuando los conjuntos de datos contienen dos. pues cada uno de ellos se presenta el mismo número de veces. Podemos utilizar la moda sin importar qué tan grandes o qué tan pequeños sean los valores del conjunto de datos e independientemente de cuál sea su dispersión. Si una prensa estampa cinco impresiones que podemos clasificar como “muy nítida”. igual que la mediana. De manera análoga. pues ya está hecha la selección. entonces el valor modal es “nítida”. Las distribuciones simétricas que sólo contienen una moda siempre tienen el mismo valor para la media. En una distribución con sesgo positivo (es decir. se puede utilizar como una posición central para datos tanto cualitativos como cuantitativos. sesgada a la derecha). la mediana y la moda 86 Capítulo 3 Media Moda Media Moda Mediana Mediana (a) (b) Medidas de tendencia central y dispersión en distribuciones de frecuencias . En otras ocasiones. la mediana y la moda. que la tabla 3-14 contiene la clase de extremo abierto “12 viajes o más”. FIGURA 3-8 Distribuciones con sesgo (a) positivo y (b) negativo que muestran las posiciones de la media. es difícil interpretarlos y compararlos. Note. También. como la gráfica (a) de la figura 3-8. la mediana o la moda como medidas de tendencia central. al igual que la mediana. tres o más modas. los clientes de una mueblería prefieren muebles tipo “colonial” sobre cualquier otro estilo. Muchas veces. no existe un valor modal debido a que el conjunto de datos no contiene valores que se presenten más de una vez. 25-29. En cualquier otro caso. debe pensarse en las situaciones prácticas en las que cada una de ellas tiene más sentido. Aplicaciones ■ 3-38 Un bibliotecario encuestó a 20 personas al salir de la biblioteca y les preguntó cuántos libros habían sacado. Estime el valor de la moda mediante la ecuación 3-9. Sugerencia: al intentar decidir los usos de la media. Si se obtiene el promedio de un pequeño grupo de salarios en una fábrica bastante cercanos entre sí. Cada caso deberá considerarse de manera independiente. como en la gráfica (b) de la figura 3-8. c) Compare los incisos a) y b) y comente cuál es la mejor medida de tendencia central de estos datos. c) Grafique los datos de la frecuencia contra el número de libros sacados. SUGERENCIAS Y SUPOSICIONES Ejercicios 3. ¿Es la media o la moda una mejor medida de tendencia central para estos datos? 3. entonces la mediana es mucho más rápida y también bastante exacta. se requiere la media geométrica si se desea exactitud. ni la distorsionan los valores extremos como la media.La mediana puede ser la mejor medida de posición en distribuciones sesgadas En una distribución con sesgo negativo (es decir. la mediana está a la izquierda y la media se encuentra todavía más a la izquierda de la moda y la mediana. la moda sigue siendo el punto más alto de la distribución. no existen guías universales para la aplicación de la media. EA 3-10 Las edades de una muestra de estudiantes que asisten a Sandhills Community College este semestre son: 19 18 55 a) b) c) d) 17 33 19 15 32 22 20 29 25 23 24 28 41 19 30 33 18 44 21 20 19 18 17 20 20 22 39 Construya una distribución de frecuencias con intervalos 15-19. debido a que siempre está entre la moda y la media. todas con va- lores que no difieren en más de $10. Al manejar los efectos acumulados de la inflación o el interés. Ahora calcule la media de los datos sin procesar. la mediana o la moda como medidas de tendencia central para diferentes poblaciones. de acuerdo con las líneas generales que se analizaron. Cuando la población está sesgada negativa o positivamente. los diseñadores de automóviles tomarán mejores decisiones si usan el valor modal de 2. b) Calcule la media para este conjunto de datos. Un ejemplo de sentido común: aunque es cierto que la familia promedio tiene 1. Compare sus repuestas a los incisos b) y c) y comente cuál de las dos medidas de tendencia central es más adecuada para estos datos y por qué.0 niños. b) Calcule la media para este conjunto de datos. 20-24. 30-34 y 35 o más.6 Una medida final de tendencia central: la moda 87 . la mediana suele ser la mejor medida de posición.6 Ejercicios de autoevaluación EA 3-9 Las siguientes son las edades en años de los automóviles en los que trabajó Village Autohaus la semana pasada: 5 6 3 6 11 7 9 10 2 4 10 6 2 1 5 a) Calcule la moda para este conjunto de datos. la mediana y la moda. Las respuestas fueron las siguientes: 1 0 2 2 3 4 2 1 2 0 2 2 3 1 0 7 3 5 4 2 a) Calcule la moda de este conjunto de datos. Si existen 500 casas nuevas en un desarrollo urbano.000. la media aritmética es muy exacta y se calcula rápidamente. sesgada a la izquierda).65 hijos. La frecuencia de ocurrencia de un solo valor no influye mucho en la mediana como es el caso de la moda. Calcule la media de los datos sin procesar. . Estime el valor de la moda con la ecuación 3-9. 88-109. se desea que las medidas utilizadas reflejen los datos tanto como sea posible.99 3-3. d) Seleccione la respuesta entre los resultados de los incisos a). Compare sus respuestas a los incisos b) y c) y comente cuál de las dos es mejor medida de tendencia central para estos datos y por qué. se sabe que el informe sobre las pruebas circulará ampliamente y se usará como base para una legislación sobre los impuestos a las concesiones de los sistemas.9 72-76. . A continuación presentamos una distribución de la capacidad de almacenamiento de calor (en días) de 28 sistemas que fueron probados recientemente por University Laboratories.9 57-61.99 1-1. Con datos disponibles acerca de los ingresos obtenidos en el verano por todos los estudiantes que han solicitado ayuda económica a la oficina.99 5-5.9 67-71.99 ■ 88 Capítulo 3 Frecuencia 2 4 6 7 5 3 1 En los laboratorios. a) Calcule la media del conjunto de datos. b) Calcule la moda del conjunto de datos. . En consecuencia. 3-43 El número de sistemas de calentamiento solar disponibles al público es bastante grande y su capacidad de almacenamiento de calor. . Carolina del Norte. 3-42 Estime la moda de la distribución dada en el ejercicio 3-36. 91 88 95 79 97 89 66 92 86 98 87 98 127 142 145 139 127 129 154 184 149 147 145 158 192 162 241 a) b) c) d) ■ ■ Construya una distribución de frecuencias usando los intervalos 66-87. b) y c) que mejor refleje la tendencia central de los datos y justifique su elección.9 62-66.9 52-56. 3-44 Ed Grant es director de la Oficina de Becas Estudiantiles del Wilderness College. 3-40 ¿Cuáles son los valores modales para las siguientes distribuciones? (a) Color de cabello Frecuencia (b) Tipo de sangre Frecuencia (c) Día de nacimiento Frecuencia ■ Clase Negro 11 Castaño 24 Pelirrojo 6 Rubio 18 AB 4 O 12 A 35 B 16 Lunes 22 Martes 10 Miércoles 32 Jueves 17 Viernes 13 Sábado 32 Domingo 14 3-41 Los siguientes datos se refieren al número de departamentos en 27 complejos en la ciudad de Cary.99 2-2. c) Calcule la mediana del conjunto de datos.: Días 0-0.■ ■ 3-39 La edad de los residentes de Twin Lakes Retirement Village tiene la siguiente distribución de frecuencias: Frecuencia 47-51.99 4-4. Inc. diversa.9 77-81. desarrolló la distribución de frecuencias siguiente: Medidas de tendencia central y dispersión en distribuciones de frecuencias .9 4 9 13 42 39 20 9 Estime el valor modal de la distribución utilizando la ecuación 3-9.99 6-6. 220-241. 499 500.999 1.7 Dispersión: por qué es importante 89 . Esto sucede también con las tres distribuciones de la figura 3-9.000-1. Al igual que sucede con cualquier conjunto de datos. ¿cuántos solicitantes obtienen la beca? Soluciones a los ejercicios de autoevaluación EA 3-9 a) Moda 5 6 b) wx 5 }S}x 5 }87} 5 5.33 c) wx 5 }S}x 5 } n 30 d) Debido a que esta distribución está muy sesgada.999 2. b) Utilice la ecuación 3-9 para encontrar la moda de los datos que utilizó Ed.500-1.8 n 15 c) Como la frecuencia modal es sólo 3 y los datos son razonablemente simétricos. la moda es una mejor medida de tendencia central. EA 3-10 a) Clase 15-19 20-24 25-29 30-34 10 9 3 4 Frecuencia b) Mo 5 LM O d 1 10 1 1 }} w 5 15 1 }} d1 1 d2 10 1 1 $ 35 4 25 5 19. la media.499 2. c) Si las becas a los estudiantes están restringidas a aquellos cuyos ingresos en el verano fueron por lo menos 10% menores que la ganancia modal.000-2. La media de las tres curvas es la misma.Ingresos en el verano Número de estudiantes $ 0.000 o más 231 304 400 296 123 68 23 a) Encuentre la clase modal del conjunto de datos. y ésta tiene menor variabilidad que la C. B y C 3.500-2. Si medimos sólo la media de estas tres distribuciones.7 Dispersión: por qué es importante Necesidad de medir la dispersión o lo variabilidad Al inicio de este capítulo.999 3. pero la curva A tiene menor separación (o variabilidad) que la curva B. la mediana y la moda sólo nos revelan una parte de la información que debemos conocer acerca de las características de los Curva A Curva B FIGURA 3-9 Tres curvas con la misma media pero diferente variabilidad Curva C Media de A. estaremos pasando por alto una diferencia importante que existe entre las tres curvas. la media es mejor medida de tendencia central. pero uno con mayor dispersión que el otro. 3.55 76}0 5 25.499 1. mostramos dos conjuntos de datos con la misma posición central. en la figura 3-2. En el fútbol americano. nos proporciona información adicional que nos permite juzgar la confiabilidad de nuestra medida de tendencia central. En la cláusula “razón de despido” de su expediente personal deberá decir “ignoró la dispersión”. ya que existen problemas característicos para datos muy dispersos.22 m) de estatura y otro de 8 pies (2. Medidas de tendencia central y dispersión en distribuciones de frecuencias . Usos de las medidas de dispersión Usos financiero y en control de la calidad ¿Por qué es tan importante entender y medir la dispersión de la distribución? Primero. Los fabricantes de asientos para aviones hacen una suposición de la forma del viajero promedio. en teoría. como los que representa la curva C de la figura 3-9.0 (b) 3-46 ¿Cuál de las siguientes no es una razón válida para medir la dispersión de una distribución? a) b) c) d) Capítulo 3 Indica la confiabilidad del estadístico empleado para medir la tendencia central. Sin embargo.7 Conceptos básicos ■ 3-45 ¿Para cuál de las siguientes distribuciones la media es más representativa de los datos como un todo? ¿Por qué? 2. quizá se desee comparar las dispersiones de diferentes muestras. Segundo. De manera similar. Si los datos se encuentran muy dispersos.6 3 4 jugadas es más que las 10 SUGERENCIAS Y SUPOSICIONES yardas necesarias para conservar el balón. Atrae la atención respecto a problemas asociados con distribuciones que tienen una variabilidad muy grande o muy pequeña. los expertos en el control de la calidad analizan la dispersión de los niveles de calidad de un producto. separación o variabilidad.82 m). En algunas secciones de clase turista es común encontrar anchos de asientos de sólo 19″. Para aumentar nuestro entendimiento del patrón de los datos. debe ganar todos los juegos porque 3. Un equipo que en promedio recorre 3. un poco de mala suerte y una pérdida ocasional de 20 yardas. como un todo. la posición central es menos representativa de los datos. ignorar la dispersión de los datos puede causar problemas graves. necesitamos poder reconocerla y evitar elegir distribuciones que tengan las dispersiones más grandes. como en la curva A de la misma figura. debemos ser capaces de reconocer esa dispersión amplia para poder abordar esos problemas. o esto presenta riesgos inaceptables.43 m). quedaría despedido si se presenta con un aspirante de 4 pies (1. debemos medir también su dis- persión. Tercero. Advertencia: no invierta mucho en promedios a menos que sepa que la dispersión es pequeña. Las ganancias ampliamente dispersas —que van desde extremadamente altas a extremadamente bajas e incluso a niveles negativos— son indicativas de un riesgo mayor para los accionistas y para los acreedores que las ganancias que permanecen relativamente estables. que cuando éstos se agrupan más cerca alrededor de la media. afectan al invencible promedio teórico de 3. Utiliza más datos para describir una distribución.6 yardas. Un reclutador de la Fuerza Aérea de Estados Unidos que busca capacitar pilotos que en promedio midan 6 pies (1. por otro lado. Para alguien que pesa 250 libras (cerca de 113 kg) y usa talla 44. Permite comparar varias muestras con promedios similares. Una medicina cuya pureza promedio es buena.datos. Los analistas financieros están preocupados por la dispersión de las ganancias de una empresa.0 (a) ■ 90 2. Si no se desea tener una amplia dispersión de valores con respecto del centro de distribución.6 yardas por jugada. Ejercicios 3. pero que oscila desde muy pura hasta muy impura puede ser peligrosa para la vida humana. sentarse en un asiento de 19″ es como ponerse un zapato apretado. Establezca brevemente las razones que lo llevaron a elegir esas distribuciones. Explique brevemente la razón de cada elección. Tomar en cuenta las diferencias individuales de cada uno de ellos. escoja la que sirva mejor para describir la distribución de las edades de los grupos siguientes: miembros del Congreso. según los registros históricos. estudiaremos tres de las llamadas medidas de distancia: el rango. los educadores necesitan probar los niveles de conocimientos y habilidades de los estudiantes.0 (a) ■ ■ ■ 2. c) El promedio de calificaciones de cada uno de los 15. ¿qué método de envío recomendaría? 2.Aplicaciones ■ 3-47 Para medir el éxito escolar. d) El salario de cada una de las 100 personas que trabajan en empleos aproximadamente iguales en una empresa privada. miembros recientemente electos de la Cámara de Diputados. el rango interfractil y el rango intercuartil.000 estudiantes de una universidad estatal. b) El salario de cada una de las 100 personas que trabajan en empleos aproximadamente iguales en el gobierno federal. Al hacer su elección. Con la evidencia disponible. 3.0 (b) 3-49 De las tres curvas de la figura 3-9. e) El promedio de calificaciones de cada estudiante de una universidad estatal que ha sido aceptado en el posgrado. y presidentes de las diferentes comisiones de la misma cámara. Haga sus elecciones con base sólo en la variabilidad de las distribuciones. 3-50 ¿De qué manera cree que debe aplicarse el concepto de variabilidad a una investigación que realiza la Secretaría de Comercio (SC) con el propósito de determinar la posibilidad de que un grupo de fabricantes fije los precios de los productos? 3-51 Escoja cuál de las tres curvas que se muestran en la figura 3-9 describe mejor la distribución de las siguientes características de diferentes grupos. a) El número de puntos obtenidos por cada jugador de una liga profesional de básquetbol durante la temporada de 80 juegos. 3. Las curvas que se muestran a continuación representan las distribuciones basadas en resultados anteriores de dos pruebas distintas. permite a los profesores planear mejor el programa académico. f) El porcentaje de tiros a la canasta lanzados por cada jugador de una liga profesional de básquetbol durante la temporada de 80 juegos. no tome en cuenta la media de las curvas de la figura 3-9 y considere sólo la variabilidad de la distribución.8 Rangos: medidas de dispersión útiles 91 .8 Rangos: medidas de dispersión útiles Tres medidas de distancia La dispersión puede medirse en términos de la diferencia entre dos valores seleccionados del conjunto de datos. En esta sección. ¿Cuál de ellas seleccionaría usted como mejor opción para los propósitos de los profesores? A ■ B 3-48 Una empresa que usa dos métodos diferentes para enviar pedidos a sus clientes encontró las siguientes distribuciones del tiempo de entrega para los dos métodos. Cada tercio contiene cuatro observaciones (. podemos decir Rango la observación Rango 5 valor de más grande Características del rango 2 valor de la observación más pequeña [3-10] Utilizando esta ecuación. por ejemplo.25 o abajo de éste.041 ← 1/3 fractil Último tercio Medidas de tendencia central y dispersión en distribuciones de frecuencias . La mediana. el rango tiene muchas posibilidades de cambiar drásticamente de una muestra a la siguiente en una población dada. Para el hospital Valley Falls. pues no existe un valor “más alto” o “más bajo” en la clase de extremo abierto. 25% de los datos están en el fractil 0.000 2 $863.138 1.33% del total de 12 elementos).624 957 1.745 1. El rango sólo toma en cuenta los valores más alto y más bajo de una distribución y ninguna otra observación del conjunto de datos. pero su utilidad como medida de dispersión es limitada. El rango interfractil es una medida de la dispersión entre dos fractiles de una distribución de frecuencias. El rango de los pagos anuales a Cumberland es $1.883.000 5 $1.000 2 $490.883 1. Recuerde también que las distribuciones de extremo abierto no tienen rango. Debido a que sólo mide dos valores. es decir.020. como en la tabla 3-17.354 903 1. 33.5. Se dará cuenta que los fractiles son parecidos a los porcentajes. En una distribución cualquiera. Es fácil entender y encontrar el rango. podemos comparar los rangos de los pagos anuales que hace la asociación Blue Cross-Blue Shield a dos hospitales presentados en la tabla 3-16. Como resultado.802 1. Suponga que deseamos encontrar el rango interfractil entre el primero y segundo tercios de los donativos recibidos por Cumberland de la organización Blue Cross-Blue Shield. porque la mitad del conjunto de datos es menor o igual que este valor. aunque los valores que caen entre el más alto y el más bajo sean bastante parecidos.041. y tiene una gran influencia de los valores extremos.Tabla 3-16 Pagos anuales hechos por Blue Cross-Blue Shield (miles) Cumberland Valley falls 863 1. Rango interfractil Fractiles Significado del rango interfractil Cálculo del rango interfractil 92 En una distribución de frecuencias. una fracción o proporción dada de los datos cae en un fractil o abajo de éste. Empezamos por dividir las observaciones en tercios.883 490 610 540 620 560 630 570 660 590 670 600 690 Rango Definición y cálculo del rango El rango es la diferencia entre el más alto y el más pequeño de los valores observados.802 1. es el fractil 0.000. 25% de los datos cae en el vigésimo quinto percentil o es menor que éste. Entonces. En forma de ecuación.698 903 1.204 1. igualmente.000 5 $200. ignora la naturaleza de la variación entre todas las demás observaciones.000.354 1.745 957 1.041 1. la diferencia entre los valores de los dos fractiles.000 o abajo de Capítulo 3 Tabla 3-17 Primer tercio Segundo tercio Pagos anuales de la Blue Cross-Blue Shield al Hospital Cumberland (miles) 863 1.624 ← 2/3 fractil 1. el rango es $690.204 1.698 1.33% de los elementos está en $1.138 1. entonces.624.8 Rangos: medidas de dispersión útiles 93 . cuartil Observación más alta 1er. cuartiles y percentiles Rango intercuartil El rango intercuartil mide aproximadamente qué tan lejos de la mediana debemos ir en cualquiera de las dos direcciones antes de recorrer una mitad de los valores del conjunto de datos. cuartil Q3 FIGURA 3-10 FIGURA 3-11 Rango intercuartil Cuartiles SUGERENCIAS Y SUPOSICIONES Fractil es un término que usan más los estadísticos que el resto de las personas.000 es la dispersión entre el valor más alto del primer tercio de los pagos y el valor más alto del segundo tercio. más familiarizadas con 100 fractiles o percentiles. Observación más baja de las 1 4 observaciones de las 1 4 observaciones Observación más alta 1er. Los percentiles dividen al conjunto de datos en 100 partes iguales.0141. y el rango intercuartil es la diferencia entre los valores del primero y tercer cuartiles: Cálculo del rango intercuartil Rango intercuartil Rango intercuartil 5 Q3 2 Q1 [3-11] En la figura 3-10 se ilustra el concepto de rango intercuartil. Los fractiles tienen nombres especiales. dividimos nuestros datos en cuatro partes. en especial cuando se trata del percentil de la calificación en los exámenes de aptitud académica o de admisión a las universidades. cuartil significado del intervalo en especial cuando el profesor publica las calificaciones más altas y más bajas del siguiente examen de estadística.66 restando $1. será riesgoso apostar al promedio sin considerar la dispersión. los valores más altos de cada una de estas cuatro partes.66% es menor o igual que $1. Esta diferencia de $583. se sabe que 35% de quienes presentaron el examen lo hicieron peor que uno. Cuando se obtiene una letra que indica que el percentil de la calificación es 35. Los cuartiles dividen los datos en cuatro partes iguales.000 del valor $1. otra presentación de cuartiles donde éstos dividen el área bajo la distribución en cuatro partes iguales. cada una de las cuales contiene 25% de los elementos de la distribución. dependiendo del número de partes iguales en que dividen a los datos. entonces el tiempo dedicado a calcular los valores de dispersión quizá no valga mucho. Es más fácil comprender el Mediana 3er. 3.000.624. cuartil Q1 2do. Para calcular este rango. cada una contiene 25% del área. Observe que los anchos de los cuatro cuartiles no necesariamente son los mismos.este valor. Ahora podemos calcular el rango interfractil entre los fractiles . En la figura 3-11. Si todos los valores se ven parecidos. cuartil (mediana) Q2 3er.000. Los fractiles que los dividen en 10 partes iguales se llaman deciles. Fractiles especiales: deciles. y 66.33 y . Si los datos se dispersan mucho. Sugerencia: todos estos términos ayudan a manejar la dispersión de los datos. Los cuartiles son. 300 9.268 3.300 12.653 2.200 6.45 0.400 10.100 9.800 14.697 3.700 9.48 0. Encuentre el percentil 70 84 94 ■ 86 92 78 96 69 89 94 88 95 87 94 88 98 84 89 82 87 88 88 94 89 97 92 99 99 102 102 105 3-55 Los siguientes son los ingresos totales por viajes (en dólares) recolectados un martes por 20 taxis que pertenecen a City Transit. calcule el rango intercuartil.891 2. calcule a) el rango.469 2.10 0. 95 71 81 88 159 100 68 94 100 187 92 65 75 93 67 72 85 83 79 91 EA 3.668 3.66 0.67 0. obtuvo una muestra de 40 empleados para determinar el número de millas que cada uno maneja en un año.77 0. 147 185 95 92 193 115 127 126 143 157 101 193 123 133 83 51 135 125 129 132 Calcule el rango de estos datos y comente si piensa que es una medida de dispersión útil. Calcule el rango y el rango intercuartil. se determina que la mayoría de las perso- Capítulo 3 Medidas de tendencia central y dispersión en distribuciones de frecuencias .700 12.800 4.700 10.500 7.145 3. Encuentre el percentil 80. Arizona.300 14.51 3-57 La Warlington Appliances ha desarrollado una nueva combinación de mezcladora-vasija.842 2.700 8. 3.900 18. Los resultados del estudio son los siguientes. 0.69 0.268 3. b) el rango interfractil entre los percentiles 20 y 80.10 0.900 5.362 Aplicaciones ■ 3-54 Se dan las lecturas de temperaturas altas durante junio de 1995 en Phoenix. ■ 3-56 La empresa Redi-Mix Incoporated elaboró el siguiente registro del tiempo (redondeado a centésimos de minuto) que esperan sus camiones para la descarga en la obra.300 13.100 16.700 10.500 12.812 3.23 ■ 94 0.700 8. El director del Departamento de Finanzas.900 8.661 2.300 9.800 13.200 2.700 17. Calcule el rango y el rango intercuartil.12 0.20 0.228 3.500 11.841 3.200 8.12 La compañía Casual Life Insurance estudia la compra de una nueva flota de autos.95 0. 2.83 0. Ltd.598 2.249 2.59 1.700 11.8 Ejercicios de autoevaluación EA 3. c) el rango intercuartil.600 4.58 0.100 20.300 10.300 5.300 8.600 7.700 8. Tom Dawkins.897 2.53 1.549 3.500 4.89 0.Ejercicios 3. Mediante una demostración de mercadotecnia y una investigación de precios.500 11.000 13.32 0.000 11.50 0.692 3.300 Conceptos básicos ■ 3-52 Para los siguientes datos.900 10.11 Se presentan las calificaciones de un examen de historia. 99 72 ■ 75 91 84 74 61 93 33 54 45 76 66 52 97 91 69 77 55 68 3-53 Para la muestra siguiente. 8 Rangos: medidas de dispersión útiles 95 . El departamento de mercadotecnia espera encontrar un rango intercuartil más pequeño. se ordenan los datos en orden ascendente. ■ 3-60 Ted Nichol es un analista estadístico que trabaja para los altos mandos administrativos de Research Incor- porated. 40.6 19.5 6. se obtuvieron los siguientes datos: 4 13 16 7 13 16 8 13 16 9 14 17 9 14 17 10 14 17 11 15 18 12 15 18 12 16 19 13 16 19 Calcule los rangos interfractiles entre los percentiles 20.12 Rango 5 20.8 42.6 439. ■ 3-59 El Departamento de Carreteras de Nuevo México tiene la tarea de mantener en buen estado todos los caminos estatales. el volumen mensual en dólares de los contratos de investigaciones que la compañía firmó durante el año anterior.6 148. Soluciones a los ejercicios de autoevaluación EA 3.9 9.300 2 3.8 502.1 229.9 100.4 178.4 325.11 Primero.100 5 4.3 59. Los datos de Ted (en miles de dólares) son los siguientes: 253 143 104 380 633 467 157 162 500 220 201 302 Calcule lo siguiente: a) El rango interfractil entre los deciles 2 y 8. Los resultados en megabytes son los siguientes: 6.700 2 8. 60 y 80.8 305. la demostración y la investigación correspondiente se repitieron.6 Calcule el rango y el rango intercuartil.6 428.600 5 16.600 millas.6 284. sorpresivamente pequeño de $14.6 427. La compañía no desea desarrollar un programa que requiera demasiado espacio en el disco duro.3 8.6 477. estas cantidades mensuales deberían ser bastante estables.5 358. Idealmente. Ayudó a diseñar el lema publicitario de la compañía: “Si no puede encontrar la respuesta. 3. por lo que sondearon a 36 ejecutivos para determinar la cantidad de espacio disponible en sus computadoras.9 7.6 347. con un rango intercuartil.4 120.7 135.1 415. Una medida de la condición de una carretera es el número de grietas que presenta por cada 30 metros de recorrido.700 millas Rango intercuartil 5 Q3 2 Q1 5 12.6 440. A partir de la muestra anual que hace el departamento. EA 3. 59 85 65 87 67 88 68 91 71 92 72 93 75 94 79 95 81 100 83 100 El dato 16 (es decir 93) es el percentil 80.6 12.5 475.9 472.nas muestreadas estaría dispuesta a pagar aproximadamente $60 por ella.7 97.4 200. ¿La esperanza del departamento se hizo realidad? 52 72 55 69 ■ 35 69 38 66 48 38 51 35 46 37 49 34 43 55 46 52 40 52 43 49 61 50 64 47 49 31 52 28 57 41 60 38 58 60 61 57 65 45 68 42 46 41 49 38 3-58 MacroSwift ha decidido desarrollar un nuevo programa de software diseñado para directores ejecutivos y otros altos niveles.9 29.6 397. entonces ¡INVESTÍGUELA!” Ted acaba de recibir algunos datos que le preocupan. En un intento por obtener los mismos resultados.6 315.6 405. Los siguientes son los datos que se obtuvieron.2 10. b) La mediana. c) El rango intercuartil. debido a que una fluctuación demasiado grande en la cantidad de trabajo a realizar puede tener como resultado una cantidad extraordinaria de contrataciones y despidos de empleados. Q1 y Q3. cuando calculamos el rango. Después. Esta medida se conoce como la desviación estándar y es la raíz cuadrada de la varianza. Capítulo 3 Medidas de tendencia central y dispersión en distribuciones de frecuencias .) Para la varianza. pero a menudo resulta mucho más conveniente utilizarla si de hecho debemos calcular el valor de s2. por ejemplo. Dos de estas medidas son importantes para nuestro estudio de la estadística: la varianza y la desviación estándar. su símbolo es s2 (sigma cuadrada). La fórmula para calcular la varianza es: Varianza de población S(x 2 m)2 Sx2 s2 5 }} 5 } 2 m2 N [3-12] N donde: 2 • s 5 varianza de la población • x 5 elemento u observación • m 5 media de la población • N 5 número total de elementos de la población 2 2 • S 5 suma de todos los valores (x 2 m) . Antes de poder utiños. N N es matemáticamente equivalente a la definición.9 Dispersión: medidas de desviación promedio Dos medidas de desviación promedio Las descripciones más completas de la dispersión son aquellas que manejan la desviación promedio respecto a alguna medida de tendencia central. en consecuencia. queda en las mismas unidades que los datos originales. } Sx En la ecuación 3-12. o todos los valores x 2 2 (x 2 m) es la definición de s2. puede ser más conveniente utilizar la expresión S}} N Las unidades en las que se expresa la varianza ocasionan problemas 96 lizar esta fórmula en un ejemplo. Ambas medidas nos dan una distancia promedio de cualquier observación del conjunto de datos respecto a la media de la distribución. La desviación estándar. las unidades son “pagos de miles de dólares”. sin embargo. podremos regresar a la varianza en sí. necesitamos analizar un problema importante referente a la varianza. “dólares al cuadrado”. asignamos más peso a las desviaciones más grandes (desviación es la distancia entre la media y un valor).3. La última expresión. Al principio. Al elevar al cuadrado cada distancia. Al resolver ese problema. entonces. las unidades son el cuadrado de las unidades de los datos. aprenderemos qué es la desviación estándar y cómo calcularla. (En nuestros ejemplos. al mismo tiempo. las respuestas se expresaron en las mismas unidades que los datos. Para calcular la varianza de una población. ya que nos permite no calcular las desviaciones respecto a la media. Sin embargo. La raíz cuadrada de 100 dólares cuadrados es 10 dólares. cuando los valores de x son grandes y los valores x 2 m peque(x 2 m)2 para calcular s2. logramos que todos los números sean positivos y. la suma de los cuadrados de las distancias entre la media y cada elemento de la población se divide entre el número total de observaciones en población. puesto que tomamos la raíz cuadrada tanto del valor como de las unidades en que se miden. Varianza de población Varianza Fórmula para la varianza de población Cada población tiene una varianza. la expresión S}} 2 m2. Por esto debemos hacer un cambio significativo en la varianza para calcular una medida útil de la desviación que no nos dé problemas con las unidades de medida y. sea menos confusa. Estas unidades no son intuitivamente claras o fáciles de interpretar. Desviación estándar de la población Relación de la desviación estándar y la varianza La desviación estándar de la población. es simplemente la raíz cuadrada de la varianza de la población. (En la tabla 3-19 también calculamos s2 utilizando la Sx2 segunda mitad de la ecuación 3-12.15 0. podemos calcular la desviación estándar. La tabla 3-19 muestra la forma en que se utilizan estos datos para calcular la media (0. } 2 m2. A partir de esto. s.04 0. la desviación estándar está en las mismas unidades que las que se usaron para medir los datos. que es del 0. la desviación de cada valor respecto a la media (columna 3). • x 5 observación • m 5 media de la población • N 5 número total de elementos de la población 2 2 • S 5 suma de todos los valores (x 2 m) . 0.058%. Si tenemos una población de 15 frascos de compuesto producido en un día y probamos cada frasco para determinar la pureza del compuesto.49/15. los datos obtenidos podrían ser los de la tabla 3-18.22 0. el cuadrado de la desviación de cada valor respecto a la media (columna 4). ya que no tenemos que calcular las desviaciones respecto a la media.21 0.24 0.12 0. ya que a2 5 (2a)2. L.166 5 2. Chebyshev (1821-1894). elaboramos una tabla utilizando todos los elementos de la población. cuando obtenemos la raíz cuadrada de la varianza para calcular la desviación estándar los especialistas en estadística sólo consideran la raíz cuadrada positiva.06 0. podemos calcular la varianza. y la suma de los cuadrados de las desviaciones.14 0. dónde están localizados los valores de una distribución de frecuencias con relación a la media. Como la varianza es el promedio de los cuadrados de las distancias de las observaciones a la media.17 0.19 0. Sin embargo. Podemos hacer esto de acuerdo con un teorema establecido por el matemático ruso P.17 0. pero conN menos trabajo. Para calcular la varianza o la desviación estándar.21 0.14 0. Mientras que la varianza se expresa con el cuadrado de las unidades utilizadas para medir los datos. suma de los valores de la columna 1 dividida entre N). la desviación estándar es la raíz cuadrada del promedio de los cuadrados de las distancias entre las observaciones y la media.0034% al cuadrado. El teorema de Chebyshev establece que independientemente de la forma de la distribución. Usos de la desviación estándar Teorema de Chebyshev La desviación estándar nos permite determinar.25 Dispersión: medidas de desviación promedio 97 .18 3.) Tomando la raíz cuadrada de s2. La fórmula para la desviación estándar es: Desviación estándar de la población s 5 Ïs w2w 5 S(x 2 m)2 }} 5 Sx2 }} 2 m2 !§N§ !§ N § [3-13] donde.9 0. Observe que obtenemos el mismo resultado. con un buen grado de precisión. o todos los valores x • s 5 desviación estándar de la población 2 • s 5 varianza de la población Utilice la raíz cuadrada positiva Cálculo de la desviación estándar La raíz cuadrada de un número positivo puede ser positiva o negativa. al menos 75% Porcentaje de impureza observado Tabla 3-18 Resultados de la prueba de pureza de los compuestos 0. Observación (x) Media m 5 2.000 0.166 0.25 2.054 20.007 Tabla 3-19 Determinación de la varianza y la desviación estándar del porcentaje de impureza de los compuestos 0.0034 al cuadrado s 5 Ïs w2w 0.2s m-s m m+s m + 2s m + 3s Medidas de tendencia central y dispersión en distribuciones de frecuencias .126 20.166 0.17 0.003 0.0036 0.001 0.166 0.001 0.17 0.0196 0.044 20.24 0.024 20.058% de los valores caen dentro de 62 desviaciones estándar a partir de la media de la distribución.004 20.14 0.166 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 0.166 0.0225 0.000 0.106 20.051 5 } 15 0.18 0.014 20.0196 0.084 0.0576 0.005 0. Podemos medir aún con más precisión el porcentaje de observaciones que caen dentro de un rango específico de una curva simétrica con forma de campana.004 20.011 0.0289 0.0484 0.166)2 15 5 0.166 0.166 0.166 0.074 20.002 0.026 20.000 0.14 0. como la mostrada en la figura 3-12.06 0.0034 w 5 0.4643 ← Sx2 [3-12] [3-13] 5 Ï0. En estos casos.49 ← Sx 0.0034 al cuadrado 5 0. 2.0324 0.000 0.001 0.15 0. 99% 95% 68% FIGURA 3-12 Localización de las observaciones alrededor de la media para una distribución de frecuencias con forma de campana 98 Capítulo 3 m .0441 0.166 0.0361 0.0289 0.21 0.0016 0.19 0.04 0.002 0.046 20.22 0.166 0. y al menos 89% de los valores caen dentro de 63 desviaciones estándar a partir de la media.051 ← S(x 2 m)2 S(x 2 m)2 s2 5 }} N [3-12] Sx2 s2 5 }2 N2m ←O→ 0.49/15 Desviación (x 2 m) Desviación al cuadrado (x 2 m)2 Observación al cuadrado (x2) (1) (2) (3) 5 (1) 2 (2) (4) 5 [(1) 2 (2)]2 (5) 5 (1)2 20.12 0.016 20.0625 0. Aproximadamente 95% de los valores estará dentro de ±2 desviaciones estándar a partir de la media.0144 0.3s m .166 0.166 0.166 0.166 0. Aproximadamente 68% de los valores de la población cae dentro de ±1 desviación estándar a partir de la media.016 0.21 0.166 0.002 0.026 20.4643 5 } 2 (0.0441 0. podemos decir que: 1.044 20. la impureza media de los 15 frascos de compuesto es 0. Note que la distribución es razonablemente simétrica y que 93% es muy cercano al 95% teórico para un intervalo de ±2 desviaciones estándar a partir de la media de una curva con forma de campana. Como nuestra población tiene una media de 0.058.166 1 2(0. • x 5 observación tomada de la población • m 5 media de la población • s 5 desviación estándar de la población Suponga que observamos un frasco de compuesto que tiene 0.058 52 El resultado estándar indica que una impureza del 0.058 5 21 Una impureza observada del 0.166 5 }} 0. El teorema de Chebyshev nos dice que al menos el 75% de los valores (11 de nuestros 15 frascos) están entre 0.058 52 } 0.116 5} 0.166 2 2(0.116 unidades.166% y la desviación estándar es 0.9 Dispersión: medidas de desviación promedio 99 .282 2 0. 3.282% se desvía de la media en 2(0.166 5 }} Interpretación del resultado estándar 0. una observación de 0.058 0.058 0. En ellos. Aproximadamente 99% de los valores estará en el intervalo que va desde 3 desviaciones estándar a la izquierda de la media hasta 3 desviaciones estándar a la derecha de la media. entonces el resultado estándar calculado a partir de los datos de la población es: Resultado estándar m x 2} Resultado estándar de la población 5 } s [3-14] donde. Uso del teorema de Chebyshev Concepto de resultado estándar A la luz del teorema de Chebyshev. La desviación estándar es útil también para describir cuánto se apartan las observaciones individuales de una distribución de la media de la misma.282. 93% de las observaciones (14 de los 15 valores) están realmente en el intervalo.058) 5 0.058) 5 0.058) 5 0. Una medida que se conoce como resultado estándar nos da el número de desviaciones estándar que una observación en particular ocupa por debajo o por encima de la media. en términos de del número de desviaciones estándar alejado de la media.282% tendría un resultado estándar de 12: x2m Resultado estándar 5 } s [3-14] 0.108 2 0.3. analicemos los datos de la tabla 3-19.058%.050 y 0. De hecho.166 y una desviación estándar de 0.108% de impureza.108 tendría un resultado estándar de 21: Cálculo del resultado estándar x2m Resultado estándar 5 } s [3-14] 0. Si x simboliza la observación. que es igual a 12. podemos utilizar las siguientes fórmulas para calcular la varianza y la desviación estándar: Varianza de datos agrupados Sf (x 2 m)2 Sf x2 s2 5 }} 5 } 2 m2 N N [3-15] Desviación estándar de datos agrupados s 5 Ïs w2w 5 !§ !§ N N §§§ Sf (x 2 m)2 }} 5 Sf x2 } 2 m2 [3-16] donde. Con esos datos. S f x2 } 2 m2 da como resultado el mismo valor de s2. En la sección siguiente. s. Desviación estándar de una muestra Cálculo de la desviación estándar de una muestra Para calcular la varianza y la desviación estándar de una muestra. s. Dejamos como ejercicio para el lector curioso verificar que la segunda mitad de la ecuación 3-15. los datos respecto a las ventas en 100 restaurantes de comida rápida se encuentran agrupados en una distribución de frecuencias. • s2 5 varianza de la población • s 5 desviación estándar de la población • f 5 frecuencia de cada una de las clases • x 5 punto medio de cada clase • m 5 media de la población • N 5 tamaño de la población La tabla 3-20 muestra cómo aplicar estas ecuaciones para encontrar la varianza y la desviación estándar de las ventas en 100 restaurantes de comida rápida. Las fórmulas tienen el siguiente aspecto: Varianza de una muestra S(x 2 wx)2 Sx2 nxw 2 s2 5 }} 5}2} n21 n21 n21 [3-17] Desviación estándar de una muestra s 5 Ïw s2 5 100 Capítulo 3 !§ !§§§§ S(x 2 wx)2 5 }} n21 Sx2 nxw 2 }2} n21 n21 Medidas de tendencia central y dispersión en distribuciones de frecuencias [3-18] . sustituyendo m con xw y N con n 2 1. N Cambio a la varianza y la desviación estándar de una muestra Ahora estamos listos para calcular las estadísticas de muestra análogas a la varianza de población s2 y la desviación estándar de la población.Cálculo de la varianza y la desviación estándar utilizando datos agrupados Cálculo de la varianza y de la desviación estándar de datos agrupados En el ejemplo al principio del capítulo. Se trata de la varianza de la muestra s2 y la desviación estándar de la muestra. utilizamos las mismas fórmulas de las ecuaciones 3-12 y 3-13. observará que cambiamos la notación con letras griegas (que denotan parámetros de población) a las latinas correspondientes a las estadísticas de muestras. 099 1.000 5} 100 S(f 3 x) xw 5 } n 00 1.200-1.000 1.650 1.500-1.000 90.250 1.150 1.850 800.000 400.250 1.800-1.000 1.000 500.000.250 1.450 1.250 13.250 1.250 (miles de dólares) ← Media 125.000 0 120.300-1.950 700.000 10.120.000 810.250 Media m (4) 600 500 400 300 200 100 0 2100 2200 2500 2400 2300 x2m (1) 2 (4) 5 258.250 1.799 Clase Punto medio x (1) [3-16] [3-15] [3-3] 360.699 1.800 10.000 720.000 250.799 1.850 3.000 (x 2 m)2 [(1) 2 (4)]2 6.700-1.600 f2x (3) 5 (2) 2 (1) 001 2 7 9 10 13 17 12 4 7 8 Frecuencia f (2) 1.000 40.000 400.8 w00 w w2w s 5 Ïs 5 66.600-1.999 1.680.750 1.250 1.000-1.000 f (x 2 m)2 (2) 2 [(1) 2 (4)]2 .550 1.500 3.950 7.000 0 10.800 (o 66.299 1.350 1.100-1.950 14.000 5 }} 100 Sf (x – m)2 s2 5 }} N 5 1.250 1.050 1.5 ← Desviación estándar 5 $258.199 1.850 1.000 160.899 125.680.899 900.500 17.000 5.250 1.000 130.500 5 Ï66 w.399 1.000 40.250 1.250 1.750 1.250 1.400-1.599 1.800 [miles de dólares]2) ← Varianza 6.000 1.000 90.550 21.000 00360.500 11.120.000 100 1.250 1.550 13.000 250.3.499 1.9 Dispersión: medidas de desviación promedio 101 Determinación de la varianza y la desviación estándar de las ventas en 100 restaurantes de comida rápida situados en el distrito del este (miles) Tabla 3-20 10 1.000 160. 204 1.833.593. s2.351 1.204 3.351)2 5 }} 2 }} 11 11 1.529 120.883.769 815.024 S(x 2 xw)2 → 1.745 1.100 45.316 2.770 5 }} 11 5 144.236 96. Las ecuaciones 3-17 y 3-18 nos permiten encontrar la varianza y la desviación estándar de la muestra de los donativos anuales de Blue Cross-Blue Shield al Hospital de Cumberland que presentamos en la tabla 3-21.351 1.637. encontramos la varianza de la muestra (s2) para cada muestra y promediamos los resultados.888 [miles de dólares]2) ← Varianza de la muestra s 5 Ïw s2 O [3-18] 5 Ï14 w4.351 1.609 9 74.802 1.698 1.376 2.351 1. En el capítulo 7.182 12(1.138 1.236 203.593.593.247.849 1.351 1.351 1.704 155.041 1.083.Observación (x) Table 3-21 Determinación de la varianza y la desviación estándar de la muestra de los donativos anuales de Blue CrossBlue Shield al Hospital de Cumberland (miles) Media (1) (wx) (2) x 2 xw (1) 2 (2) 863 903 957 1.351 2488 2448 2394 2310 2213 2147 3 273 347 394 451 532 (x 2 xw)2 [(1) 2 (2)] x2 2 238.770 S(x 2 xw)2 s2 5 }} n21 (1)2 744.681 1.354 1.496.351 1. a menos que usemos n 2 1 como denominador en nuestros cálculos.401 00283.351 1.545. Capítulo 3 Medidas de tendencia central y dispersión en distribuciones de frecuencias .640) ← Desviación estándar de la muestra nxw2 Sx2 s2 5 } 2 } n21 n21 [3-17] 23.624 1.616 1.351 1.351 1.409 155. se dará la explicación estadística de por qué esto es cierto.770 5 }} 11 5 144.689 23. este promedio no tiende a igualar el valor de la varianza de la población.64 (es decir.144 200. observe que ambas mitades de la ecuación 3-17 producen el mismo resultado.496.204 003.409 915.369 21.182 ← Sx2 [3-17] 1.883 1.888 Uso de n 2 1 como denominador Cálculo de la varianza y la desviación estándar de la muestra para los datos del hospital 102 donde. s2 5 Varianza de la muestra • s 5 Desviación estándar de la muestra • x 5 Valor de cada una de las n observaciones • • wx 5 Media de la muestra • n 2 1 5 Número de observaciones de la muestra menos 1 ¿Por qué utilizamos n 2 1 como denominador en lugar de n? Los especialistas en estadística pueden demostrar que si tomamos muchas muestras de una población dada.025 3.888 (o $144.045.351 1. $380.449.044 1. w88 w8w 5 380.295. .9 Ejercicios de autoevaluación EA 3-13 Talent. aunque en menor grado que en el caso del rango. Sugerencia: puede evitarse la confusión entre usar N o n 2 1 como denominador para las muestras y poblaciones si se asocia el valor más pequeño (n 2 1) con el conjunto más pequeño (la muestra). Estos resultados indican a cuántas desviaciones estándar arriba o abajo de la media de la muestra se encuentra una observación dada. Ltd. y no puede calcularse en distribuciones de extremo abierto.Cálculo de los resultados estándar de la muestra Igual que utilizamos la desviación estándar de la población para derivar los resultados estándar de la misma.64 2488 5} 380. Podemos usarla para comparar distribuciones y para calcular resultados estándar. Sin embargo. los valores extremos que se encuentren en el conjunto de datos distorsionan el valor de la desviación estándar. que son un elemento importante de la inferencia estadística que analizaremos más adelante. esos valo- res extremos distorsionarán la respuesta. SUGERENCIAS Y SUPOSICIONES Ejercicios 3.64 5 21. Las edades de los 20 hombres que se entrevistaron primero son: 50 54 56 55 55 61 49 60 3.28: 2 wx Resultado estándar de la muestra 5 x} [3-19] s 863 2 1.28 En esta sección hemos demostrado por qué la desviación estándar es la medida de dispersión que más se utiliza. Al igual que la varianza. podemos usar la desviación estándar de la muestra para calcular los resultados estándar de la muestra. No es fácil calcularla como el rango. Además. La fórmula adecuada es: Resultado estándar de una observación de una muestra x 2 wx Resultado estándar de la muestra 5 } [3-19] s donde: • x 5 observación tomada de la muestra • xw 5 media de la muestra • s 5 desviación estándar de la muestra En el ejemplo anterior. está en proceso de elegir un grupo de extras para una película. la desviación estándar tiene también algunas desventajas.351 5 }} 380. la desviación estándar toma en cuenta cada observación del conjunto de datos. vemos que la observación 863 corresponde a un resultado estándar de 21. una compañía en Hollywood de selección de elenco. Al calcular y usar la desviación estándar se supone que no hay muchos valores demasiado grandes o demasiado pequeños en el conjunto de datos porque se sabe que la desviación estándar usa todos los valores.9 52 51 57 59 56 62 57 52 56 54 59 49 Dispersión: medidas de desviación promedio 103 . 50. Sabe por la factura que el peso promedio de un jitomate es 7. forma de campana. en 1988.4 2.5 onzas.5 1.8 8.8.5 onzas.4 7. aproximadamente cuántas observaciones deberán encontrarse en el intervalo 59. b) Dado que la distribución tiene. ¿Deberá preocuparse por la cantidad de empleados que van a utilizar el mes siguiente? 3-65 El consejo directivo del Banco de la Reserva Federal de Estados Unidos ha otorgado permisos a todos los bancos miembros para elevar las tasas de interés 0. en el que preguntaba a parejas casadas cuántos automóviles debe tener la familia promedio actual.7 2.2 8. de acuerdo con el teorema de Chebyshev? b) Si la distribución es simétrica y con forma de campana.5 1.60 y una forma de distribución desconocida.4 7.0 1. para certificados de depósito (CD) a un año.3 8.37. Aceptará los jitomates sólo si el peso promedio es 7. Las tasas de interés anteriores para cuentas de ahorro eran 51/4.5 Frecuencia 2 14.1 6.El director de la película quiere hombres cuyas edades se agrupen de manera cercana alrededor de los 55 años. 1.5? ¿Entre 0 y 2? ¿Cuántas caen de hecho en esos intervalos? Aplicaciones ■ 3-61 La chef en jefe de The Flying Taco acaba de recibir dos docenas de jitomates de su proveedora.6 6.2 7.6 8.3 7. promediaron las repuestas del hombre y la mujer. un fabricante de Miami: 17 ■ ■ ■ 104 21 18 27 17 21 20 22 18 23 El gerente de producción de la compañía siente que una desviación estándar de más de tres botes por día indica variaciones de tasas de producción inaceptables. Ltd.2 7. ¿Califica este grupo de extras? EA 3-14 En un intento de estimar la demanda potencial futura. 3-64 El número de cheques cobrados diariamente en las cinco sucursales del Bank of Orange County durante el mes anterior tuvo la siguiente distribución de frecuencias: Clase Frecuencia 0-199 200-399 400-599 600-799 800-999 10 13 17 42 18 Hank Spivey. debido a la carga de trabajo dispareja.4 7.6 8.2 7. sabe que una desviación estándar en el cobro de cheques mayor que 200 cheques diarios ocasiona problemas de personal y de organización en las sucursales.5 y 1. en teoría. ¿cuántas observaciones deben caer entre 0.9? c) Encuentre los resultados estándar para las siguientes observaciones tomadas de la distribución: 61. casi.65 y 51. a fin de obtener la respuesta global de la pareja. director de operaciones del banco.4 7. 84.1 7.0 23 1. el director sugiere que sería aceptable una desviación estándar de 3 años.5 7. Las respuestas se colocaron en una tabla: Número de autos 0 0. Con sus conocimientos de estadística. ¿Deberá preocuparse por las tasas de producción de la planta? 3-63 Un conjunto de 60 observaciones tiene una media de 66.8 7.2 a) Calcule la varianza y la desviación estándar.5% para todos los depositantes.7-73.7 7.5 onzas y la desviación estándar es menor que 0.5 7.4 ¿Cuál es la decisión de la chef y por qué? ■ 3-62 Los siguientes datos son una muestra de la tasa de producción diaria de botes de fibra de vidrio de la Hydrosport.. Los pesos de los jitomates son los siguientes: 6.8 7. la National Motor Company realizó un estudio. una varianza de 12. para CD a Capítulo 3 Medidas de tendencia central y dispersión en distribuciones de frecuencias . pero to- davía no los acepta. Para cada pareja. pero insiste en que todos tengan un peso uniforme. a) ¿Entre qué valores deberán caer al menos 75% de las observaciones. 75.45. 71/2%.0 7.5 7. Los datos son: Frecuencia en el hospital en días 1-3 4-6 7-9 10-12 13-15 16-18 19-21 22-24 Frecuencia 18 90 44 21 9 9 4 5 a) Calcule la desviación estándar y la media. ¿entre qué valores debe caer al menos 75% de las observaciones de la muestra? ¿Qué porcentaje de observaciones caen de hecho en ese intervalo? c) Dado que la distribución es casi una campana. 11%.. con una desviación estándar de $400. ¿Cuál de los tres tuvo el menor aumento en relación con la media y la desviación estándar de los aumentos correspondientes a su oficina? La American Foods comercializa con fuerza tres de sus productos a nivel nacional. Se entrevistó a tres empleados. En la sucursal de Nueva York. Uno de los objetivos fundamentales de la publicidad de cada producto consiste en lograr que los consumidores reconozcan que American Foods elabora el producto. ¿Para cuál de los productos estuvo el consumidor en cuestión más alejado del desempeño promedio.9 14. con una desviación estándar de $95. El presidente del First State Bank desea saber qué características tendrá la nueva distribución de tasas de interés si se le agrega 1 /2% a todas las tasas. En la oficina de Washington.0-11. si tuviera suficientes datos (es3.500.9 Dispersión: medidas de desviación promedio 105 . se le pidió a un grupo de consumidores que identificara lo más rápido posible a la compañía responsable de una larga lista de productos.. ¿cuántas estancias entre 0 y 17 días pueden esperarse? 3-67 FundInfo proporciona información a sus suscriptores para permitirles evaluar el desempeño de los fondos de inversión que consideran vehículos de inversión potencial. Si los datos utilizados para calcular los resultados se recolectaron en el periodo de 32 semanas. Sid tiene razones para creer que el número de pacientes sin mayores problemas por semana tendría una distribución en forma de campana. un tiempo promedio de 3. en unidades de desviación estándar? Sid Levinson es un médico especializado en el conocimiento y uso efectivo de medicinas que eliminan el dolor en pacientes gravemente enfermos. se quedan en el hospital después de una operación.0-15. El primer producto de la American Foods obtuvo un tiempo promedio.7 segundos.9 12. afirmó que el nivel de producción promedio por semana de su empresa fue 11.9 17. con una desviación estándar de 0. En Durham N. con una varianza de 49.0-16.004 segundos. con una desviación estándar de 0. ¿Cómo se relacionan las nuevas características con las anteriores? 3-66 El administrador de un hospital de Georgia investigó el número de días que 200 pacientes.9 15. D. Un estudio reciente de los fondos cuya meta de inversión establecida era crecimiento e ingreso produjo los siguientes datos de la tasa de retorno anual sobre la inversión total durante los últimos cinco años: Rendimiento anual (%) Frecuencia ■ 3-68 ■ 3-69 ■ 3-70 ■ 3-71 11. El empleado de Washington recibió un aumento de $1. el aumento promedio fue $850.5 segundos. 91/2.9 2 2 8 10 11 8 3 1 a) Calcule la media. elegidos al azar. ¿durante cuántas semanas estuvo el nivel de producción abajo de 11.9 16. ¿entre qué valores se esperaría encontrar 68% de las observaciones? ¿Qué porcentaje de las observaciones de hecho caen en ese intervalo? Nell Berman. E1 tercero.006 segundos. y para CD a cinco años.844? La compañía Creative Illusion Advertising tiene tres oficinas en tres ciudades distintas.729. Los niveles de salario difieren de un estado a otro.0-18.9 18.79 para el segundo y 3. 2.9 13.398 barras de pan. b) Según el teorema de Chebyshev. ha empezado a registrar el número de pacientes que atiende cada semana.175? ¿Y cuántas arriba de 11. Uno de los encuestados en particular tuvo los siguientes tiempos antes de reconocer la procedencia del producto: 2. En ese lapso. b) De acuerdo con el teorema de Chebyshev.C. 101/2. con una desviación estándar de 0. propietario de la Earthbread Bakery. y el de Durham uno de $500.495 para el primero. el aumento promedio a los salarios durante el año anterior fue $1. el de Nueva York.8 segundos.C. 83/4.09 segundos.0-14.90 para el tercero. Para medir qué tan bien cada anuncio logra ese reconocimiento.0-12. obtuvo un aumento de $3. a dos años. de 2.■ ■ 18 meses. su administrador registra el número de pacientes gravemente enfermos y el número de pacientes sin mayores problemas. la varianza y la desviación estándar de la tasa de rendimiento anual para esta muestra de 45 fondos de inversión. ¿cuántas estancias habrá entre 0 y 17 días? ¿Cuántas hay realmente en ese intervalo? c) Debido a que la distribución tiene aproximadamente forma de campana. el aumento promedio fue $3.200. El segundo producto tuvo un tiempo promedio de 2. Con el fin de saber aproximadamente cuántas enfermeras y personal administrativo debe emplear.100. a tres años.0-17.760. con una desviación estándar de $622.0-13. antes de ser reconocido. inspector del distrito escolar 18 no es la excepción.2 26.8 4. ha recolectado datos sólo durante las cinco últimas semanas.44 10.44 54 55 61 60 51 59 62 52 54 00049 1.2 21.04 17. Haga un favor a Tom y encuentre ese intervalo. A partir de los datos.2 0.20 } 5 3.2 1. y el excedente tiene una media de $40. 98.000 de dólares cuadrados.000 y una varianza de 100.8 0. y anciano.2 23. la junta directiva sugirió un presupuesto de investigación de medios de $350.8 1. ¿Dentro de qué límites deberá caer el “68% central” de estas cifras semanales? 3-72 El inspector de cualquier distrito escolar tiene dos problemas principales: primero.8 23.000.04 0.04 33.874 años. Tom Langley. ¿Cuál de los pacientes tiene el CI más alejado de la media.04 38. Este año. correspondiente a esa categoría en particular? Categoría Niño Adulto joven Adulto Anciano CI medio 110 90 95 90 Varianza de CI 81 64 49 121 Soluciones a los ejercicios de autoevaluación EA 3-13 x x 2 wx (x 2 wx)2 x x 2 wx (x 2 wx)2 50 56 55 49 52 57 56 57 56 59 25.64 0.24 0.38. la sicóloga ha calculado el Coeficiente Intelectual (CI) medio y la varianza de los coeficientes intelectuales dentro de la categoría.24 10.8 27. que muestra más variabilidad que la deseada Medidas de tendencia central y dispersión en distribuciones de frecuencias .64 14.24 3. tiene registros muy precisos sobre todos sus pacientes.44 0.24 1. Utilice el teorema de Chebyshev para encontrar los límites dentro de los cuales deberá caer el “75% central” del número de pacientes gravemente enfermos por semana.000. segundo. adulto joven. 3-73 Bea Reele. adultos jóvenes. Para cada categoría. adultos y ancianos. ha creado cuatro categorías dentro de las cuales puede colocar a todos sus pacientes: niños.20 Sx 1.64 23. la varianza y la desviación estándar para el número de pacientes sin mayores problemas por semana.104 5 55. Tom aprendió el teorema de Chebyshev cuando estuvo en la universidad. ■ ■ Pacientes gravemente enfermos 33 50 22 27 48 Pacientes sin mayores problemas 34 31 37 36 27 a) Calcule la media y la varianza para el número de pacientes seriamente enfermos por semana.44 0.64 14.2 26.2 años.2 5.24 0.8 20. una prestigiada sicóloga clínica. Las cifras que obtuvo se presentan en la tabla siguiente. la dificultad de tratar con la directiva escolar elegida y.2 3. adulto. b) Calcule la media. Por experiencias anteriores.44 46.8 0.8 3. la necesidad de estar siempre preparado para buscar un nuevo empleo debido al primer problema.2 1. Ha comprendido el valor de entender todas las cifras que aparecen en un presupuesto y de ser capaz de utilizarlas en su provecho.44 285. Sin embargo.2 20.to no es cierto para los pacientes gravemente enfermos). 92. que es cercano a los 55 años deseados xw 5 } 5 } n 20 s5 106 Capítulo 3 n 1 19 !§ !§ S(x 2 wx)2 }} 5 2 285. 90.8 24.8 6.104 21. 100.64 3. y piensa que podría serle útil para encontrar un intervalo de valores dentro del cual se encuentre el gasto real 75% del tiempo en los años en que la propuesta de presupuesto sea igual a la de este año. Durante cierto día Bea atendió a cuatro pacientes (uno de cada categoría) y sus CI fueron: niño. en unidades de desviación estándar. Tom sabe que el gasto real siempre sobrepasa al presupuesto solicitado. Relaciona la desviación estándar y la media.0 0. (0.7067 Sx 53.0 10.707 s2 5 }} 5 } 5 0. cerca del 68% de los datos.0 0. entonces. 1.10 Dispersión relativa: el coeficiente de variación Defectos de la desviación estándar El coeficiente de variación.5539 3.36 observaciones deben estar en este intervalo. la respuesta es no.640.3080 así s 5 Ïw0w . La unidad de medida. entonces alrededor del 95% de los datos. la variación relativa a la media es insignificante.5.2797 0. una medida relativa La desviación estándar es una medida absoluta de la dispersión que expresa la variación en las mismas unidades que los datos originales.0288 0.0288 autos n Sf (x 2 xw)2 15. es “porcentaje”. Lo que necesitamos es una medida relativa que nos proporcione una estimación de la magnitud de la desviación respecto a la magnitud de la media. por otro lado.9712 1.0191 1.0 7. Si.1643 2.0288 20.9155 0.95(52) 5 49.5 8. De hecho. Para una población.4 observaciones deben estar en este intervalo.5 2 14 23 7 4 02 52 0. expresando la desviación estándar como porcentaje de la media. y los que hacen al Hospital de Valley Falls (tabla 3-16). su media y cómo se compara la desviación estándar con la media. o 0. no podemos conocer la dispersión de un conjunto de datos hasta que conocemos su desviación estándar.EA 3-14 a) # de autos x Frecuencia f f2x x 2 xw (x 2 xw)2 f(x 2 xw)2 0. El coeficiente de variación es una de estas medidas relativas de dispersión.55 autos n21 51 b) (0.5. 44 observaciones están ahí. Los donativos anuales de Blue Cross-Blue Shield al Hospital de Cumberland (tabla 3-21) tienen una desviación estándar de $380.0 53.0585 0. los valores varían en una cantidad que es el doble de la media.5 52 xw 5 } 5 } 5 1. ¿Podemos comparar los valores de estas dos desviaciones estándar? Desafortunadamente.2220 0. En consecuencia. o 0.5 1. tienen una desviación estándar de $57.0008 0. la fórmula para el coeficiente de variación es: Coeficiente de variación Desviación estándar de la población s (100) Coeficiente de variación de la población 5 } Media de la población m [3-20] Para utilizar esta fórmula en un ejemplo. Si tenemos una desviación estándar de 10 y una media de 5. La desviación estándar no puede ser la única base para la comparación de dos distribuciones. tenemos una desviación estándar de 10 y una media de 5.1170 3.5 2.9431 2.0 1.5 21. De hecho. 50 observaciones caen en él. 2) es aproximadamente xw 6 2s.0 23.0 2. ¿Cuál de los dos técnicos muestra menos variabilidad? 3. El técnico B efectúa un promedio de 160 análisis diarios con una desviación estándar de 15. 3.4712 0. podemos suponer que cada día el técnico A del laboratorio realiza un promedio de 40 análisis con una desviación estándar de 5.10 Dispersión relativa: el coeficiente de variación 107 .5288 20.3 w0w8w0 5 0.3286 15.390 (que puede usted calcular).68(52) 5 35.7726 0 4.5) es aproximadamente wx 6 s entonces.4712 1.000. en lugar de las unidades de los datos originales. debido a que la media de producción de B es mucho mayor que la de A. el B. El gerente de crédito de Southeastern está evaluando los registros de crédito de estas tres tiendas. Pero B realiza sus análisis con una rapidez cuatro veces mayor que A. quien tiene una variación absoluta mayor que la del técnico A. ¿Qué programa de capacitación tiene menos variabilidad relativa en su desempeño? EA 3-16 Southeastern Stereos. el concepto es el mismo: se usa para comparar la cantidad de variación en grupos de datos que tienen medias diferentes. utilizamos el sistema Minitab para calcular algunas de las estadísticas sumarias para los datos de calificaciones dados en el apéndice 10. y el de los hombres corresponde a 20/160.A primera vista. Con un cociente sencillo se puede SUGERENCIAS Y SUPOSICIONES ver que las mujeres tienen 20/120. Para el primer grupo. En la figura 3-14 utilizamos Minitab para calcular varias medidas de tendencia central y de variabilidad para los datos sobre ganancias del apéndice 11. Aunque el coeficiente de variación es un poco más complejo que el cociente del ejemplo. Las estadísticas se dan para las 224 compañías juntas. En el segundo grupo. parece que el técnico B tiene una variación en su producción tres veces mayor que el técnico A. los tiempos requeridos para capacitar a los empleados tuvieron un promedio de 32. mientras que el peso promedio para las mujeres es alrededor de 120 libras. o sea cerca del 12. es decir 16. La estadística MEDREC (TRMEAN. deseaba convertirse en el proveedor de tres tiendas.7%.5% ← Para el técnico A 5} Cálculo del coeficiente de variación y Uso de la computadora para calcular medidas de tendencia central y de variabilidad 15 (100) Coeficiente de variación 5 } 160 5 94% ← Para el técnico B Así. Las estadísticas se muestran para cada sección. 2 5 ASE. En la figura 3-13.11 horas y una varianza de 68. Tomando en cuenta toda esta información. El peso promedio para los hombres es cerca de 160 libras.75 horas y la varianza fue 71. a menos que las medias sean parecidas.10 Ejercicios de autoevaluación EA 3-15 Basart Electronics piensa emplear uno de dos programas de capacitación. Suponga que un grupo de hombres y mujeres tiene un sobrepeso de 20 libras. trimed mean) es una “media recortada”. El grupo 1 recibió el programa A. el promedio fue 19. es decir. así como para el curso completo. y también se desglosan por bolsa de valores (1 5 OTC.14. Ejercicios 3. Advertencia: no compare la dispersión en los conjuntos de datos usando las desviaciones estándar. de sobrepeso. 3 5 NYSE). Esto ayuda a disminuir la distorsión ocasionada por los valores extremos que tanto afectan a la media aritmética. En los últimos 5 años. pero los faltantes en el inventario lo forzaron a seleccionar sólo uno. tiene una variación relativa menor que la de A. Esas 20 libras no son una buena medida del peso excesivo. Se capacitó a dos grupos para la misma tarea. podemos calcular el coeficiente de variación para ambos técnicos: s (100) Coeficiente de variación 5 } m [3-20] 5 (100) 40 5 12. El concepto y la utilidad del coeficiente de variación son evidentes si se intenta comparar a hombres con sobrepeso y mujeres con sobrepeso. una media calculada sin tomar en cuenta el 5% de los datos más altos ni el 5% de los datos más bajos. utilizamos la computadora para calcular nuestras medidas de tendencia central y de variabilidad. un distribuidor.5%. el grupo 2. Las cuentas por cobrar de las 108 Capítulo 3 Medidas de tendencia central y dispersión en distribuciones de frecuencias . Para conjuntos grandes de datos.09. tenemos que el técnico B. 72 1.00 64.50 48.04 24.00 13.60 109.90 7.38 49.00 53.95 2.00 51.00 113.71 54.00 74.21 1.00 72.07 50.90 45.08 76.52 111.96 44.61 1.36 102.56 MedRec 11.90 0.00 124.00 73.51 59.23 75.26 47.62 12.82 1.00 115.50 60.75 55.00 51.11 69.00 116.00 Mín 98.00 21.25 50.19 50.46 56.00 62.00 32.91 68.00 106.87 63.50 44.21 81.00 52.11 87.00 Q1 75.00 47.50 99.00 108.22 42.97 76.35 3.10 69.71 13.15 50.00 50.85 10.00 44.62 MediaSE 22.00 121.89 53.19 58.76 57.00 121.82 9.00 30.06 10.44 50.00 131.24 13.00 44.76 49.75 8.28 44.83 53.00 73.89 13.00 24.50 114.62 73.44 11.16 48.01 20.00 53..00 106.26 60.73 1.58 1.00 55.00 134.67 2.37 9.00 67.11 108.34 79.00 54.00 63.30 58.00 54.01 10.48 1.03 10.83 53.00 29.00 49.08 44.00 74.67 64.00 25.60 67.71 2.00 65.00 16.36 1.00 69.84 7.00 25.74 44.00 68.78 104.00 58.28 0.00 135.56 1.00 62.94 52.86 10.00 56.50 66.01 22.28 111.00 37.00 127.00 112.00 98.51 64.28 45.06 92.97 1.3.25 65.00 135.00 41.44 19.80 2.00 13.25 60.37 8.58 107.00 62.73 105.50 48.00 65.33 42.86 8.00 68.00 44.62 1.30 45.91 2.59 76.91 43.84 1.00 37.60 6.00 122.00 34.51 17.00 72.76 2.09 9.00 60.18 69.00 Mediana 68.16 113.53 46.00 31.60 2.00 40.27 44.00 68.08 68.10 Dispersión relativa: el coeficiente de variación 109 1 2 3 4 5 6 1 2 3 4 5 6 1 2 3 4 5 6 1 2 3 4 5 6 1 2 3 4 5 6 SECCIÓN 199 27 46 37 26 36 27 199 27 46 37 26 36 27 199 27 46 37 26 36 27 199 27 46 37 26 36 27 199 27 46 37 26 36 27 N 68.98 8.75 54.44 DesvEst FIGURA 3-13 Salida de Minitab que muestra el resumen estadístico para las calificaciones del curso TOTAL FINAL TAREA EXAM2 EXAM1 Variable Estadística descriptiva 0.00 41.08 11.87 49.00 Q3 .00 60.00 34.75 1.25 55.90 113.75 36.25 1.06 3.00 64.00 13.46 1.80 15.00 47.38 65.39 50.75 43.00 57.44 73.00 44.00 55.00 45.25 85.38 55.59 1.90 67.00 51.16 8.76 59.00 124.42 110.69 52.09 1.43 64.51 67.00 59.00 101.00 133.00 73.19 102.49 45.00 57.00 56.11 88.00 50.00 14.92 44.82 68.00 35.39 72.67 Media 69.22 47.00 38.00 30.69 62.00 66.60 1.00 72.50 55.00 35.61 8.00 105.95 4.00 49.12 52.44 11.50 8.59 10.50 50.00 59.00 73.85 74.76 2.47 48.32 50.00 43.00 35.00 55.75 44.00 57.07 112.00 127.26 1.30 73.75 50.34 17.49 10.95 68.77 49.79 53.00 72.00 65.05 40.59 39.98 49.50 41.57 67.20 59.41 80.00 120.00 63.00 17.13 0.00 16.00 21.68 11.00 Máx 62.64 16.00 45.00 71.00 114.00 45.00 44.96 65.05 98.00 37.00 59.00 107.06 1.60 110.59 56. 0200 -0.450 Máx 5.230 Q1 -0.130 Mín -5.4500 -3.083 0.199 0.2200 4.440 MediaTrim 0.2600 0.5110 0.837 1.045 0.130 FIGURA 3-14 Salida de Minitab que muestra el resumen estadístico para los datos de ingresos Variable MERCADO LQ89 1 2 3 Estadística descriptiva MediaSEM 0.0075 -0.560 -5.292 0.0485 0.2139 0.4400 0.740 5.7500 -0.8916 0.810 .459 DesvEst 0.1100 0.136 0.070 Q2 -0.2105 0.1070 0.0556 0.0766 0.2300 1.1300 0.085 0.415 Mediana 0.110 Capítulo 3 Medidas de tendencia central y dispersión en distribuciones de frecuencias N 224 111 38 75 Media 0. Infotech necesita un capturista rápido y consistente. con una desviación estándar del 5.0 63.350 horas con una desviación estándar de 6 horas. Tienen tres habitaciones idénticas para realizar el experimento.8 61. Otra máquina produce cantidades promediadas de 180 cc de medicamento y tiene una desviación estándar de 8.10 Dispersión relativa: el coeficiente de variación 84 111 . además del promedio menor. Si consideramos riesgoso asociarse con una compañía que tenga una alta dispersión relativa en la recuperación.8%.8%.5 62. diseñada para producir dosis de 100 cc. ¿Cuál de los dos equipos muestra mayor dispersión relativa respecto al peso de sus integrantes? 3-75 Una universidad ha decidido probar tres nuevos tipos de focos. La vida promedio del foco 3 es 1.0 Lee Forrest Davis 61. una agencia de empleos temporales.7 61. Los datos que presentamos a continuación son un registro del porcentaje de los objetivos logrados por tres vendedores durante los 5 años pasados. respectivamente.6 cc. Patricia John Frank ■ 27 30 88 76 104 68 88 88 89 90 118 92 86 88 103 79 123 a) ¿Cuál vendedor es más coherente? b) Comente sobre lo adecuado de utilizar una medida coherente junto con porcentajes de objetivos de ventas logrados para evaluar el desempeño de ventas.0 63. son 195 y 12. 3-77 Existe cierto número de medidas posibles del desempeño de ventas. Clasifique los focos en términos de la variabilidad relativa. ¿cuál de estas dos compañías ha seguido una estrategia más riesgosa? 3-79 Un laboratorio médico.9 61. tiene como dosis media 100 cc. con una desviación estándar del 4. con el fin de hacer una transacción lo menos riesgosa posible.7 60. ¿Cuál de las máquinas tiene la menor precisión desde el punto de vista de la dispersión relativa? 3-80 HumanPower.9 63. que provee medicamentos predosificados a un hospital. c) ¿Puede usted sugerir una medida alternativa más apropiada de consistencia? 3-78 La junta directiva de la empresa Gothic Products está considerando adquirir una o dos compañías y examinando minuciosamente la administración de cada compañía.8 63. El gerente siente que es importante la consistencia. los Trailblazers de Chicago.400 horas y una varianza de 81.2 cc. ha probado las habilidades para la captura de datos de muchas personas. con una desviación estándar de 5. la primera de las compañías tuvo una recuperación promedio de lo invertido del 28. utilice una medida de variabilidad relativa para sugerir en cuál de los dos grupos será más fácil enseñar. El foco 1 tiene una vida promedio de 1.5 Aplicaciones ■ ■ ■ 3-74 El peso de los integrantes del equipo de fútbol americano profesional Baltimore Bullets tiene media de 224 libras con desviación estándar de 18 libras. ¿Cuál es el mejor? 3-76 La edad de los estudiantes regulares que acuden a un curso en los turnos matutino y vespertino del nivel licenciatura de la Universidad Central se describe en las siguientes dos muestras: Turno matutino Turno vespertino ■ 23 27 29 34 ■ ■ 22 29 24 28 21 30 25 34 26 35 27 28 24 29 Si la homogeneidad de la clase es un factor positivo en el aprendizaje. Con base en la dispersión relativa.4 62.3%. ¿qué tienda sería el mejor cliente? 62. utiliza diferentes máquinas para los medicamentos que requieren cantidades de dosis diferentes.0 63. según la dispersión relativa? John Jeff Mary Tammy 63 68 62 64 66 67 79 68 68 66 75 58 62 67 59 57 69 69 72 59 72 3. El foco 2 tiene una vida promedio de 1. La otra compañía tuvo una recuperación promedio de lo invertido del 37. incluyendo qué tan coherente es un vendedor en el logro de los objetivos de ventas establecidos. mientras que los mismos datos correspondientes a su oponente del próximo domingo.470 horas y una varianza de 156.tiendas han sido sobresalientes por los siguientes números de días. Una máquina. Durante los últimos 5 años. ¿Qué empleado es el mejor para Infotech.9 61.2 62.0%. HumanPower revisa los registros de velocidad de 4 empleados con los siguientes datos en términos del número de entradas correctas por minuto.
Copyright © 2024 DOKUMEN.SITE Inc.