Laura Paz Millao Becerra 2011ESTADISTICA MEDIDAS DE TENDENCIA CENTRAL Presentación A través de estas páginas te invito a descubrir diferentes desafíos, podrás explorar, aprender y construir nuevos conceptos y aplicarlos para resolver diversas situaciones, actividades y problemas relacionados con la estadística descriptiva. Sabías que… La estadística es una teoría general aplicable a cualquier campo científico en el cual se hacen observaciones. El estudio y aplicación de los métodos estadísticos son necesarios en todos los campos del saber, sean estos de nivel técnico o científico. Se entiende como Estadística a una agrupación de datos ordenados en forma sistemática, en cuadros y/o gráficos. Los datos son medidas, valores o características susceptibles de ser observados y contados. En la Estadística está la “variable” que es una característica que puede tener diferentes valores en los distintos elementos o individuos de un conjunto. Se diferencian dos usos del método estadístico: Estadística Descriptiva y Estadística Inferencial. La Estadística descriptiva es el método para obtener, de un conjunto de datos, conclusiones sobre los mismos y que no sobrepasen el conjunto de conocimientos que proporcionan estos datos. Su estudio incluye el de las técnicas de colectar, presentar, analizar e interpretar los datos. Estadística inferencial es el método o conjunto de técnicas que se utilizan para obtener conclusiones que sobrepasen los limites de los conocimientos aportados por los datos. Por lo tanto el método estadístico es una herramienta utilizada por el hombre para comprender los hechos de la vida real. Las aplicaciones de la Estadística se dan en casi todos los campos de la investigación tales como: ciencias naturales, sociales, económicas, etc. I Exploremos un Contexto Global Problema 1: Según la Asociación de lucha contra la Bulimia y la Anorexia, las pautas culturales han determinado que la delgadez sea sinónimo de éxito social. Muchos jóvenes luchan para conseguir el “físico ideal” motivados por modelos, artistas o por la publicidad comercial. Durante el mes de marzo del año 2006, en el colegio “Alcántara” de la ciudad de Talca, después de las vacaciones de verano, se observó con precaución a 27 alumnos con síntomas de anorexia, registrándose los siguientes signos visibles: 2 Dieta Severa Uso de Ropa Holgada Miedo a Engordar Dieta Severa Dieta Severa Hiperactividad Uso de Laxantes Uso de Laxantes Uso de Ropa Holgada Miedo a Engordar Dieta Severa Dieta Severa Uso de Ropa Holgada Dieta Severa Uso de Laxantes Dieta Severa Hiperactividad Hiperactividad Hiperactividad Uso de Laxantes Uso de Ropa Holgada Dieta Severa Uso de Ropa Holgada Miedo a Engordar Uso de Ropa Holgada Uso de Laxantes Dieta Severa a) ¿Podrías ordenar o resumir la información presentada? Y saber ¿Qué porcentaje representa cada signo visible? b) ¿Se puede representar gráficamente la información anterior? c) ¿Cuál es el signo visible más común entre los jóvenes que presentan síntomas de anorexia? Solución: a) Respuesta: 1º Calculamos porcentaje de cada signo visible: f i = f n n i = frecuencia relativa = frecuencia absoluta = total de datos i Ej: Del signo visible: Dieta severa: f i = = 9 = 0, 3 27 → 0,333333 x 100 = 33,3 2º Tabla de distribución de los signos visibles de 27 alumnos con síntomas de anorexia, en el colegio Alcántara de la ciudad de Talca durante el mes de marzo del año 2006. Signo Visible Dieta severa Miedo a engordar Hiperactividad Uso de laxantes Uso de ropa holgada Total Número de alumnos ( 9 3 4 5 6 27 n) i Porcentaje de alumnos 33,3 11,1 14,8 18,5 22,2 100,0 f i x 100 3 b) Respuesta: Gráfico de distribución de los signos visibles de 27 alumnos con síntomas de anorexia, en el colegio Alcántara de la ciudad de Talca durante el mes de marzo del año 2006. c) Respuesta: Interpretación: El signo visible que se observa con mayor frecuencia es el de una dieta severa. Siendo la única medida posible de determinar: la moda, que en este caso corresponde al signo visible dado por la dieta severa. (9 de 27 jóvenes lo presenta) Se puede apreciar en la tabla, en la segunda columna; es la frecuencia absoluta que más se repite. También se puede apreciar en el gráfico, el mayor porcentaje. Problema 2: Se realizo una encuesta a 30 familias de una cierta población sobre la duración de las ampolletas; la información que se obtuvo fue la siguiente: 7 familias dijeron que les duraban entre 20 y 26 días 8 dijeron entre 27 y 33 días 5 dijeron entre 34 y 40 días 2 dijeron entre 48 y 54 días 3 dijeron entre 55 y 61 días, y una familia dijo que le duro más de 62 días. 4 i) ¿Cómo ordenarías esta información en una tabla de distribución? ii) ¿Cuánto duran en promedio las ampolletas? Interprete ese resultado. iii) ¿cual es la duración de las ampolletas que más mencionan las familias? Solución: i) Respuesta: Intervalos Marca de clase Frecuencia Absoluta Frecuencia Relativa x' i−1 – x' 1 x i n 7 8 5 4 2 3 1 i f i 20 – 26 27 – 33 34 – 40 41 – 47 48 – 54 55 – 61 62 - 68 n=30 23 30 37 44 51 58 65 0,233 0,266 0,166 0,133 0,066 0,10 0,033 ii) Respuesta: La interpretación que se le puede dar es que el control de calidad de las ampolletas no debe permitir que las ampolletas duren menos de 37 días. Para ser aceptadas deben durar más de 37 días. iii) Respuesta: La Moda: La mayor frecuencia absoluta es 8. Luego la moda esta en el intervalo 27 – 33 y la moda es: 5 Problema 3: Un investigador estaba realizando un estudio sobre el ingreso per cápita mensual de una cierta cantidad de familias en EEUU, pero accidentalmente dio vuelta la taza de café sobre su informe, perdiendo algunos datos. Después de secar la hoja de papel, se podían distinguir de una tabla de distribución simétrica de frecuencias la siguiente información sobre el ingreso per cápita en dólares de 150 familias. x 4 = 7000, i) ii) iii) iv) n 3 = 24, f 1 = 0,08, I = 7, F 4 = 0,62, n x = 48.000 i i ¿Puede reconstruir la tabla de distribución con los datos que tiene? ¿Cuál es el ingreso per cápita promedio de las familias? ¿Cuál es el ingreso per cápita más recurrente?, ¿Entre cuánto se encuentra el ingreso per cápita del 50% inferior de las familias? Solución: i) Respuesta: x' i−1 – x' 1 x i n i N i f i F i nx i i 3500 - 4500 4500 - 5500 5500 - 6500 6500 - 7500 7500 - 8500 8500 - 9500 9500 – 10.500 n = 150 4000 5000 6000 7000 8000 9000 10.000 12 21 24 36 24 21 12 12 33 57 93 117 138 150 0,08 0,14 0,16 0,24 0,16 0,14 0,08 0,08 0,22 0,38 0,62 0,78 0,52 1,00 48.000 x Si 1 = 4000 pues n = 0,08 * 150 = 12 = n 7 1 (simetría) x 4 = 7000 Se calcula c = amplitud del intervalo 4000 + 3c = 7000 c = 1000 ii) Respuesta: Calculamos el promedio: x = 4000 * 12 + 5000 * 21 + 6000 * 24 + 7000 * 36 + 8000 * 24 + 9000 * 21 + 10000 * 12 150 6 x = 1050000 = 7000 150 x = 7000 Ingreso per cápita promedio de las familias. iii) Respuesta: Mo = 6500 + 36 − 24 * 1000 [36 − 24] + [24 − 36] Mo = 12 * 1000 24 Mo = 7000 ingreso per cápita más recurrente. iv) Respuesta: Se calcula Me Me = Es decir el 50% inferior de las familias tiene un ingreso per cápita entre 3.500 y 7.000 dólares y el otro 50 % superior tiene un ingreso per cápita entre 7.000 y 10.500 dólares. 7 VERIFICANDO DISCO Recuerda que: Tablas de frecuencia: Es un tipo de representación que permite organizar datos. Frecuencia Absoluta n : Es el número de veces que se repita un dato, incluidos en un determinado i intervalo. Frecuencia Absoluta Acumulada N i : Es la suma de las frecuencias absolutas de los valores menores o iguales al valor de la variable en cuestión. El último valor de ésta debe ser igual al nº total de datos. Frecuencia relativa f i : Es el cociente entre la frecuencia absoluta y el nº total de datos o tamaño de la muestra. Frecuencia relativa acumulada (o porcentual) F i : Es el porcentaje de la frecuencia absoluta con respecto al tamaño de la muestra. Intervalos Marca de clase Frecuencia Absoluta Frec. Absoluta Ac. Frecuencia Relativa Frecuencia Relativa % x' i −1 – x' 1 x i n i N i f i F i II ¿QUÉ, PARA QUÉ Y CÓMO? Este texto pretende brindarte las posibilidades de emplear contenidos matemáticos en distintos contextos para que logres la comprensión de los mismos. ¿Qué…? En este breve texto, encontrarás una parte de la estadística descriptiva, denominada Medidas de Tendencia Central: Media Aritmética ó Promedio - Mediana y Moda. ¿Para qué…? Después de obtener, leer y analizar información de un conjunto de datos, de una tabla de frecuencia o de un gráfico, podrás calcular e interpretar las medidas de tendencia central ya mencionadas, desarrollando, al mismo tiempo, tu pensamiento y construyendo nuevos conocimientos a través de la resolución de problemas, además y especialmente, para desarrollar tus habilidades y pensamiento lógico ¿Cómo…? trabajando ya sea en forma individual o en equipo. 8 III.- CÓMO LO HARÍAS… III.1.- Inténtalo tú… Ejercicio 1: Marcos y su papá van a salir de cazar conejos el fin de semana, para lo cual compraron 25 cajas de municiones, cada una contenía 48 proyectiles. Pero antes de salir, decidieron revisar su contenido y se encontraron con que el número de proyectiles en mal estado en cada caja fue: 3 4 1 2 1 2 3 2 2 2 3 0 1 0 3 5 0 1 3 4 1 2 2 2 1 a) ¿Cómo podrían clasificar los resultados para saber el promedio por caja de proyectiles defectuosos? b) ¿En cuantas cajas encontraron el mayor numero de proyectiles defectuosos? c) ¿Cuántos proyectiles defectuosos están por debajo de la mitad de cajas? Ejercicio 2 Las edades de 50 de los directores ejecutivos de las mejores corporaciones de la nación reportadas aparecen en la siguiente tabla de frecuencias. Edades 50 y menos de 55 55 y menos de 60 60 y menos de 65 65 y menos de 70 70 y menos de 75 75 y menos de 80 Frecuencias 8 13 15 10 3 1 a) ¿Cuál es la edad promedio que tiene los directores ejecutivos? b) ¿Cuál es la edad más reportada, que presentan los ejecutivos? c) ¿Sobre el 50% de los ejecutivos, que edad presenta este grupo? Ejercicio 3: En una encuesta sobre los ingresos anuales en miles de soles de un grupo de familias, en la ciudad de Lima, se obtuvo la siguiente información: 9 [Li − Ls ) ni 10 – 30 30 – 50 50 – 70 70 - 90 Además, x = 54 y 20 20 n /n 2 3 = 1/5, ¿Cuál es el número de familias con ingreso no menos de 50 mil soles? III.2.- Inténtalo con tus compañeros Ejercicio 1: En una importante empresa láctea hay 600 empleados que cobran $300.000, 500 que cobran $400.000, 100 que cobran $600.000 y 5 socios que perciben $3.000.000 cada uno. ¿Cuál es el ingreso promedio de los empleados? ¿Puedes calcular la mediana de los ingresos? ¿Cuál es el ingreso que más recibido por los empleados? Discuta con sus compañeros, cual medida de tendencia central estima mejor el sueldo de los empleados de la empresa. Ejercicio 2: El entrenador de un equipo de natación debe elegir a uno de sus integrantes para la próxima competencia de estilo libre. Según los tiempos en segundos que obtuvieron los postulantes de las cinco últimas carreras de 100 m de estilo libre, ¿qué nadador le conviene elegir? Diego Tomás Sergio 61,7 61,5 60,7 61,7 62,9 62,4 62,3 62,9 62,7 62,9 63,7 62,7 63,1 63,7 63,2 Analiza y discute con tus compañeros, y fundamenten su respuesta, respecto a que nadador debe elegir el entrenador, mencionando y explicando que procedimiento y/o operaciones realizaron para determinarlo. Ejercicio 3: En una cierta empresa de 80 empleados, 60 de ellos ganan 500.000 pesos al mes y los 20 restantes ganan 700.000 pesos al mes, a cada uno de ellos. Se pide: a) Determinar el sueldo medio 10 b) ¿Sería igual la respuesta si los primeros 60 empleados ganaran un sueldo medio de 500.000 pesos y los otros 20 un sueldo medio de 700.000 pesos? c) Comentar si ese sueldo medio es o no representativo. IV MIRO MI ENTORNO Problema 1 Jóvenes protagonizan 25% de accidentes de tránsito. Es común enterarse por la prensa del día lunes de algún grave accidente de tránsito ocurrido los fines de semana, en los cuales los jóvenes son los protagonistas. Generalmente los jóvenes creen que nada malo les va a pasar y piensan que tener un accidente o no depende del azar. Por eso no toman conciencia de las horas sin dormir y el alcohol, entre otras puede traerle consecuencias graves. Nº de accidentes de tránsito los fines de semana, según horas del día Horario 01:00 a 04:00 04:00 a 07:00 07:00 a 10:00 10:00 a 13:00 13:00 a 16:00 16:00 a 19:00 19:00 a 22:00 22:00 a 01:00 Viernes 231 255 995 1014 1214 1482 1190 621 sábado 467 565 642 904 1098 1204 1107 824 Domingo 364 733 508 674 939 1068 1116 692 a) ¿En que hora del día sábado, ocurren más accidentes de tránsito? b) ¿Cuál es el promedio de accidentes durante todo el fin de semana? c) ¿Sobre el 50% de los accidentes que ocurren el día Viernes, en que horario se encuentran? Problema 2 La obesidad en el mundo Los últimos cálculos de la OMS indican que en 2005 había en todo el mundo: • • Aproximadamente 1600 millones de adultos (mayores de 15 años) con sobrepeso. Al menos 400 millones de adultos obesos. 11 Además, la OMS calcula que en 2015 habrá aproximadamente 2300 millones de adultos con sobrepeso y más de 700 millones con obesidad. En 2005 había en todo el mundo al menos 20 millones de menores de 5 años con sobrepeso. Aunque antes se consideraba un problema exclusivo de los países de altos ingresos, el sobrepeso y la obesidad están aumentando espectacularmente en los países de ingresos bajos y medios, sobre todo en el medio urbano. En un centro medico se está estudiando a la población infantil con sobrepeso, para lo cual se anotó en una tabla los siguientes datos, de un total de 150 niños evaluados. Kilos de sobrepeso 2–6 6 – 10 10 - 14 14 -18 18 – 22 22 o más Nº de niños 59 38 25 16 10 2 a) ¿Cuál es la cantidad de kilos de sobrepeso más frecuente entre estos niños? b) ¿Cuál es el sobrepeso promedio en este grupo de niños? c) La primera mitad del grupo de niños, entre cuantos kilos de sobrepeso se encuentran? Problema 3: Tabaquismo en chile Chile, es uno de los países con más alto consumo de cigarrillos en la región de las Américas. En los últimos 30 años se ha producido un aumento progresivo del consumo de tabaco. Los 14 mil millones de cigarrillos que se fuman anualmente en nuestro país estarían liberando al ambiente aproximadamente 20 toneladas de nicotina, 185 toneladas de material particulado respirable y 814 toneladas de monóxido de carbono. La población del país, se presenta pequeñas diferencias respecto al consumo de tabaco según la región en que viven. El estudio CONACE 20047 muestra que en la V Región se fuma más que en el resto del país, alcanzando en ese momento al 45,19% de su población y en la IX Región fumaría el 36, 9%, de los habitantes entre 12 y 64 años, lo que los convierte en la región menos fumadora. Se realizo una encuesta 250 fumadores, mayores de edad, de la ciudad de Arica, en un conocido mall, preguntándoles cuantos cigarrillos se fumaban al día; las respuestas están resumidas en la siguiente tabla: 12 Cantidad de cigarrillos 1–5 5 – 10 10 – 15 15 - 20 + de 20 Nº De fumadores 40 39 65 70 46 a) ¿Cuál es la cantidad más frecuente del consumo de cigarrillos entre los fumadores de Arica? b) ¿En promedio, cuántos cigarros al día se fuman estas personas? c) La mitad superior de esta muestra cuantos cigarrillos se fuman al día? V.- VERIFICANDO MI PROGRESO Ejercicio 1: Se han anotado las tallas, en centímetros, de los 40 alumnos de una clase y se han obtenido los siguientes resultados: 160, 167, 163, 148, 151, 158, 166, 166, 157, 153, 151, 151, 150, 155, 164, 162, 166, 171, 167, 165, 152, 150, 147, 152, 162, 155, 158, 158, 158, 164, 157, 155, 160, 154, 153, 156, 160, 159, 159, 158, 163, 161. a) ¿cómo determinarías la talla promedio de esos 40 alumnos? b) ¿Cuál es la talla que más se repite entre los alumnos? c) ¿Entre que tallas se encuentra la mitad más baja y entre que tallas se encuentra la mitad más alta? Ejercicio 2: Dos amigos decidieron comprobar cuanto duraba realmente la carga de batería de sus mp4 por lo que han estado anotando, cuidadosamente, varias veces, la duración, en minutos, de escuchar música continuamente y han obtenido: 40, 44, 42, 47, 41, 42, 47, 43, 48, 44, 49, 41, 46, 43, 47, 42, 46, 44, 54, 53, 47, 43, 40, 48, 54, 68, 66, 59, 51, 53, 49, 45, 52, 57, 63, 67 a) ¿cuántos minutos promedio pueden escuchar música en sus mp4, en forma continua? b) ¿Qué cantidad de minutos se repite más, en estas observaciones? c) ¿Cuál es la el intervalo más aceptado de duración para escuchar música continuamente? Ejercicio 3: En un estacionamiento cobran por cada minuto que está estacionado el vehículo $ 10. La ocupación del estacionamiento durante la semana pasada fue la siguiente: 13 Tiempo de estacionamiento (min.) 0 – 60 60 -120 120 -180 180 – 240 240 - 300 300 - 360 nº de vehículos 1240 3575 746 327 218 44 ¿Cual es el tiempo medio de estacionamiento, el más frecuente y el mediano? VI.- PARA GRABAR EN MI DISCO MEDIDAS DE TENDENCIA CENTRAL Las medidas de centralización son unos parámetros que representan la muestra. Son útiles porque hacen una estimación que indica alrededor de que valores se aglutinan los datos. Es decir, son los datos de la variable que se encuentran más cerca del resto de los datos. Se denominan, también, estadígrafos de tendencia central. Las principales medidas centrales son: la media aritmética ( Veamos en que consiste cada una de ellas: x ), la moda (Mo) y la mediana (Me). a) MEDIA ARITMÉTICA ( X ) La media aritmética también se llama “media” o “promedio aritmético” y es lo que siempre has ocupado para calcular el promedio de notas. La media aritmética se calcula dependiendo de cómo vengan los datos, pero en general es la suma de todos los datos dividida por el número total de datos. Media aritmética de datos no agrupados La media x de n datos corresponde al resultado de la expresión: 14 Donde: k x = Promedio o Media i k x= ∑x i =1 n ∑x i =1 i i = sumatoria de elementos x = Marca de clase o valor de la variable n Ejemplo Gonzalo ha obtenido las siguientes notas en Ciencias: 6,0 – 5,8 – 7 – 6,8 – 5,6 Su media aritmética o promedio es: = total de muestra o datos k : número de elementos con distinto valor. Lo que se redondea al décimo como 6,2. Media de datos en una tabla de frecuencia y/o agrupados en intervalos i) En el primer caso se debe multiplicar cada dato con su respectiva frecuencia, sumar todos estos productos, y el resultado dividirlo por la suma de los datos, esto es: k ∑x x= i =1 i ⋅ ni n Donde ni es la frecuencia o número de veces que se repite un valor. También ni puede ser la ponderación de cada valor xi. Ejemplo: Se ha lanzado un dado 40 veces obteniéndose los siguientes resultados: 15 Por lo tanto su media es: ii) En el segundo caso se define la marca de clase de un intervalo como la media aritmética entre los extremos de él. Si llamamos a la marca de clase de un intervalo: agrupados en intervalos es: , entonces la media de un conjunto de datos Ejemplo: La tabla de distribución siguiente nos muestra la duración en días que tuvieron un total de 30 ampolletas Rango de días días Frecuencia absoluta Frecuencia relativa x' i−1 – x' 1 x i n i f 7 8 5 4 2 3 1 i 20 – 26 27 – 33 34 – 40 41 – 47 48 – 54 55 – 61 62 - 68 n=30 23 30 37 44 51 58 65 0,233 0,266 0,166 0,133 0,066 0,10 0,033 16 ii) Propiedades del Promedio 1) Solución: == 2) Solución: 3) 4) 5) Promedio Total Si tenemos tres conjuntos de observaciones de los cuales el primero tiene n1 elementos y promedio X1 el segundo tiene n2 elementos y promedio X2 y el tercero tiene n3 elementos con promedio X3 entonces la media aritmética de los tres conjuntos es: 17 Generalizando Con n el número total de observaciones. b) LA MODA (Mo) Se define como aquel valor de la variable que representa la mayor frecuencia en una distribución. Es decir, La moda es el valor de la variable que más se repite. Ejemplo: Sean las calificaciones que obtiene un grupo de trabajadores de una empresa: 2; 4; 5; 2; 3; 4; 6; 4; 7 La moda es 4 pues hay tres trabajadores con la calificación 4 que es una moda unimodal, pero si tenemos 2, 1, 2, 4, 5, 4, 7 la moda es 2 y 4 que es una moda bimodal, por lo tanto la moda no es única. Si tenemos una tabla de distribución con intervalos la moda la calculamos de la siguiente forma: Primero debemos saber en que intervalo se encuentra, para ello se ubica la mayor frecuencia absoluta y luego aplicamos la formula. L.I. = limite inferior del intervalo d1 = |n1- ni-1| d2 = |ni-1 – ni| c = amplitud del intervalo Ejemplo: Consideremos la siguiente tabla de frecuencia, que nos muestra el nº de palabras que lee un niño de segundo básico por minuto. El estudio fue realizado en un curso de 40 alumnos. 18 x' i−1 – x' 1 x i n i N i f i F i f i % F i % 50 70 70 90 90 110 110 130 130 150 Hallar la moda Solución: 60 80 100 120 140 5 9 11 8 7 5 14 25 33 40 0,125 0,225 0,275 0,20 0,175 0,125 0,350 0,625 0,825 1,00 12,5 22,5 27,5 20 17,5 12,5 35 62,5 82,5 100 Para encontrar la moda, primero debemos saber en que intervalo esta para ello la mayor frecuencia absoluta es 11 por lo tanto la moda esta en el intervalo 90 – 110 Así c) LA MEDIANA (Me) Se define como el valor central de un conjunto de observaciones que ha sido ordenado en forma creciente o decreciente, es decir, deja el mismo número de observaciones bajo él, que sobre él (es el 50% de los casos). Ejemplo: Si tenemos el conjunto de valores 3, 9, 5, 18, 15, 14, 19. Hallar la mediana. Solución: La mediana se obtiene ordenando. 3. 5, 9, 14, 15, 18, 19 y es el valor central, es decir, 14 En cambio si tuviéramos 3, 5, 9, 14, 15, 18, 19, 21 La mediana es La mediana para datos agrupados (intervalos) Antes de poder calcular la mediana debemos saber en que intervalo se encuentra. Para ello se toma la mitad del tamaño de la muestra y se ve en la columna de las frecuencias absolutas acumuladas (Ni), cual es el menor valor que la contiene y este valor nos indica el intervalo donde esta la mediana. 19 Luego se aplica la siguiente formula para calcular la mediana: Me = Donde: Nja = es la frecuencia absoluta acumulada anterior al valor que contenía a n/2. nj = n i frecuencia absoluta del intervalo donde esta la mediana. Ejemplo: Calcule la mediana observando la siguiente tabla de distribución. La cual indica el pago de impuestos (en UF) de 40 contribuyentes. De un exclusivo condominio del sector oriente. UF Contribuyentes Frec. Ac. x' i−1 – x' 1 x i n i N i 50 70 70 90 90 110 110 130 130 150 Solución: 60 80 100 120 140 5 9 11 8 7 5 14 25 33 40 Y en la columna de los Ni el menor valor que lo contiene es 25, por lo tanto el intervalo donde esta Me, es 90 – 110. Entonces Me = Luego Me = Me = 100,9 20 VII.- ¿QUÉ APRENDÍ? Ejercicio 1: Algunas décadas atrás la gente moría por la tubercololis, enfermedad hoy ya casi erradicada, La tabla siguiente muestra la composición por edad, sexo y trabajo de un grupo de personas con tuberculosis pulmonar en la provincia de Vizcaya en el año 1979: Edad Trabajadores Varón Mujer 1 4 10 12 8 4 Total 3 14 42 59 46 26 No trabajadores Varón 25 20 15 13 10 7 Mujer 40 36 50 34 25 18 Total 65 56 65 47 35 25 Totales Varón 27 30 47 60 48 29 Mujer 41 40 60 46 33 22 Total 68 70 107 106 81 51 14-19 19-24 24-29 29-34 34-39 39-44 2 10 32 47 38 22 a) ¿Cuál es la edad en la que se observa con mayor frecuencia que no trabajan los varones? ¿Y las mujeres? Determinar asímismo la edad más frecuente (sin distinción de sexos ni ocupación). b) ¿Por debajo de qué edad está el 50% de los varones? c) ¿Por encima de qué edad se encuentra el 50% de las mujeres? Ejercicio 2: Una empresa grande de equipos deportivos está probando el efecto de dos planes publicitarios sobre las ventas de los últimos 4 meses. Dadas las ventas que se ven aquí, ¿cuál programa de publicidad parece producir el crecimiento promedio más alto en ventas mensuales? Mes Plan 1 Plan 2 Enero 1657,0 4735,0 Febrero 1998,0 5012,0 Marzo 2267,0 5479,0 Abril 3432,0 5589,0 21 Ejercicio3: Las ganancias diarias de los establecimientos de un centro comercial se presentan en una tabla de frecuencias con 6 intervalos de clase y se sabe que: la mínima ganancia es de $6, el rango es 36, el promedio de ganancias diarias es $25.14, el 50% de los establecimientos ganan más de 25.58 dólares diarios, F2=0.15, N2=120, f3=0.25, F5=0.93, n4=304, n2=2n1. ¿Se puede reconstruir la distribución de todas las frecuencias y hallar la ganancia más frecuente y la ganancia promedio? 22 VIII.- ¿CUÁNTO SÉ? Evaluación 1 CALCULAR PROBLEMA Al comenzar el invierno en Chile, durante el primer día de lluvia, los pluviómetros de 20 ciudades recogieron la siguiente información sobre las 2 cantidades en l/m de agua caída: MEDIA MODA MEDIANA 8 10 15 2 b) 2 17 15 8 10 8 2 8 17 2 1 15 15 10 17 15 En sus inicios como empresario Sebastián Piñera, comenzó comprando 20 acciones a $ 15 dólares cada una, 50 acciones a $20 dólares cada una, 100 acciones a $30 dólares cada una y 75 acciones a $35 dólares cada una, de una determinada empresa ¿Cuál es el precio promedio por acción? c) De una central telefónica salieron 70 llamadas de menos de 3 minutos promediando 2.3 minutos, 40 llamadas de menos de 10 minutos pero no menos de 3 minutos, promediando 6.4 minutos, y 10 llamadas de al menos 10 minutos promediando 15 minutos. Calcular la duración promedio de todas las llamadas. Coloca la puntuación que corresponda, según las respuestas dadas (sí, más o menos, no) SI 3 MÁS O MENOS 2 NO 1 Puntuación Ordene los datos en una tabla de Frecuencia (de cada uno de los problemas) Use los datos de la tabla de Distribución para resolver el problema. Esta correcto el resultado de cada una de las medidas De tendencia central solicitada Total 23 ¿Qué logré? Autoevaluación: Según todo lo visto en este capitulo y la cantidad de ejercicios que pudiste resolver contesta lo siguiente: Marca según tu apreciación Extraer y analizar datos en tablas de frecuencias No lo entendí Lo entendí Puedo Explicarlo Puedo calcular e interpretar la Media (de pocos datos) Puedo calcular e interpretar la Media (de muchos datos – intervalos - ) Puedo calcular e interpretar la Moda (de pocos datos) Puedo calcular e interpretar la Moda (de muchos datos – intervalos) Puedo calcular e interpretar la Mediana (de pocos datos) Puedo calcular e interpretar la Mediana (de muchos datos – intervalos -) 24 IX.- SINTESIS VERIFICANDO DISCO Completa el siguiente esquema con las formulas y los puntos más relevantes de cada una de las medidas de tendencia central: Estadística Descriptiva Medidas de tendencia central MEDIA MODA MEDIANA * Para calcular promedio de pocos datos k x= ∑x i =1 i n * Para calcular moda de una muestra con muchos datos (intervalos) 25 X.- PRÓXIMO DESAFIO… Ejercicio 1: Una empresa tenía a finales del pasado año mil seiscientos cincuenta accionistas distribuidos de la siguiente forma: Nº de acciones 0-20 20-60 60-100 100-500 500-1000 Nº de accionistas 1030 380 150 80 10 ¿Cuál es el promedio de acciones que tiene cada accionista? ¿Qué dispersión presenta con respecto a ese promedio? Ejercicio 2: Sean las siguientes muestras de las estaturas de 5 personas de diferentes etnias: Etnia A) 170, 160, 155, 175, 145, 185 Etnia B) 160, 170, 165, 170, 160, 165 a) ¿Cuál es el promedio de estatura de cada etnia? y ¿Cuál es la varianza de ambas muestras? b) ¿Qué muestra es más dispersa? Razona tu respuesta. Ejercicio 3: En un diagnóstico de educación física se pidió a los alumnos de los cuartos medios que hicieran abdominales durante 3 minutos. Se obtuvieron los siguientes resultados: 4º A: 45 33 4º B: 43 41 38 43 29 34 60 54 27 32 33 23 34 34 28 56 62 56 57 45 47 48 54 45 44 41 34 36 34 54 45 44 38 34 46 43 42 43 45 57 44 38 38 37 43 61 38 37 45 28 42 49 40 37 34 44 41 43 ¿Cuál de los dos cursos tiene el rendimiento más parejo? ¿Qué distribución estadístico permite comparar la distribución de este tipo de datos? 26 ANEXOS GLOSARIO Estadística: es la rama de la matemática que nos permite recoger, organizar y analizar datos. Existen dos conceptos importantes dentro de la estadística que nos permiten analizar y estudiar dichos datos, estos son: población y muestra. Población: es el conjunto de datos que caracteriza el fenómeno que se desea estudiar. Muestra: es un subconjunto de la población a estudiar, el cual es necesario que sea representativo de toda la población. Gráfica: es una representación de la relación entre variables, muchos tipos de gráficos aparecen en estadística, según la naturaleza de los datos involucrados y el propósito de la gráfica, es la de representar los valores tabulados obtenidos de los muestreos o los datos del total de la población. Distribución de frecuencia: Al resumir grandes colecciones de datos, es útil distribuirlos en clases o categorías, y determinar el número de individuos que pertenecen a cada clase llamado frecuencia de clase. Una disposición tabular de los datos por clases junto con las frecuencias correspondientes de clase se llaman distribuidores de frecuencia o tablas de frecuencia. Medidas de dispersión: Describen la cantidad de dispersión o variabilidad que se encuentra entre los datos. Datos bastante agrupados poseen valores relativamente pequeños, y datos mas dispersos tienen valores más grandes. El agrupamiento mas extenso ocurre cuando los datos carecen de dispersión. 27 SOLUCIONARIO III.1.- Inténtalo tú Ejercicio 1: x 0 1 2 3 4 5 i n 3 6 8 5 2 1 i N 3 9 17 22 24 25 i f i F i f 12 24 32 20 8 4 i % F i % 0,12 0,24 0,32 0,20 0,08 0,04 0,12 0,36 0,68 0,88 0,96 1,00 12 36 68 88 96 100 III.2.- Inténtalo con tus compañeros Ejercicio 1: x = (600x300.000 + 500x400.000 + 100x600.000 + 5x3.000.000)/(600 + 500 + 100 + 5) = 455.000.000/1205 = 377.593,361 Me= 400.000 Mo = 300.000 Dado que se trata de una distribución tan asimétrica, la mediana es la medida más recomendable. V.- VERIFICANDO MI PROGRESO Ejercicio 1: variable [145,150) [150,155) [155,160) [160,165 165,170) 170,175] Marca clase 147,5 152,5 157,5 162,5 167,5 172,5 de Frecuencia ab. 2 9 12 10 6 1 Frecuencia relativa 2 11 23 33 39 40 f i * x i 295,0 1372,50 1890,00 1625,00 1005,00 172,50 6360, 0 total 28 a) x = 6360 = 159 40 La talla que más se repite está entre 155 y 160 Los de menor talla están entre 145 y 158,75 y los de mayor talla están entre 158,75 y b) Mo = 158 c) Me = 158.75 los 175 cm. X.- PROXIMO DESAFIO… Ejercicio 2 Muestra 1 x 170 media 165 160 varianza 210 155 175 145 185 Muestra 2 x 160 media 165 170 varianza 20 165 170 160 165 x [ 4 0 ,4 5 ) [ 4 5 ,5 0 ) [ 5 0 ,5 5 ) [ 5 5 ,6 0 ) [ 6 0 ,6 5 ) [ 6 5 ,7 0 ] f 13 11 6 2 1 3 36 m 4 2 ,5 4 7 ,5 52 ,5 57,5 6 2 ,5 6 7 ,5 media moda mediana rango varianza 4 9 ,4 1 4 2 .5 4 2 .5 28 6 3 ,6 4 29
Report "Solo problemas de MEDIDAS DE TENDENCIA CENTRAL"