ESTADÍSTICA GENERALRECOLECCIÓN, ORGANIZACIÓN Y PRESENTACIÓN DE DATOS 1.1. Introducción a la Estadística. 1.2. Estadística: definición y clasificación. 1.3. El método estadístico. 1.4. Conceptos básicos. 1.5. Variables: concepto y clasificación. 1.6. Escalas de medición: concepto y clasificación. 1.7. Cuadros estadísticos. 1.8. Gráficos estadísticos. 1.1. Introducción a la Estadística Aunque no existe una definición rigurosa, o más bien existen varias, para nuestro estudio definiremos la Estadística como “parte del método científico que, mediante el análisis matemático de conjuntos numéricos, nos permite obtener información sobre la realidad que nos rodea”. La estadística es tan antigua como el hombre puesto que las primeras sociedades organizadas ya sentían la necesidad de contar con datos numéricos de su población y sus condiciones materiales de existencia. Sin embargo es en el siglo XVII cuando cobra interés en los modernos países europeos el estudio de censos económicos, militares y de cualquier aspecto relacionado con la población. Aunque el hueso de astrágalo sitúa los juegos de azar en los albores de la humanidad, el estudio de este tipo de problemas podemos datarlo también en el siglo XVII con la correspondencia entre Fermat y Pascal a propósito de las cuestiones planteadas por el Caballero de Méré sobre ciertas apuestas en juegos con dados. Dado el fundamento matemático de estas dos partes de la Estadística, es en el siglo XIX cuando ambas se desarrollan vertiginosamente siguiendo la estela del desarrollo matemático de esta época. Con la conciencia de que se posee potentes herramientas que se desperdician en juegos de azar y contabilidad de existencias, llegamos al siglo XX donde ambas disciplinas, que hasta el momento habían seguido caminos separados, se unen para dar lugar a la Estadística moderna. El objetivo de nuestras aplicaciones estadísticas será un mejor conocimiento sobre alguna(s) característica(s) de cierto conjunto de elementos, generalmente de tamaño inabordable, por lo que se experimentará sólo sobre alguno de ellos, obteniendo una serie de datos u observaciones que nos darán información sobre dicho subconjunto, información que bajo ciertas condiciones será extrapolable al conjunto total. 1.2. Estadística: definición y clasificación. Definición: La Estadística es una ciencia que permite a través de un conjunto de métodos y procedimientos recopilar, clasificar y describir los datos en forma adecuada, para luego tomar decisiones o predecir algo acerca de la población a partir de los datos extraídos de la misma. Clasificación: La Estadística se clasifica en: estadística descriptiva e inferencial. Estadística Descriptiva Trata de la planificación, recopilación, organización, presentación, análisis e interpretación de los datos. Estadística Inferencial Nos proporciona la teoría necesaria para afirmar acerca de las características de la población en base a los datos extraídos a partir de una muestra. 1.3. El método estadístico. La aplicación de la Estadística a un problema determinado, comprende las siguientes etapas: Planificación del estudio: planificar es esencial no sólo para calcular el tiempo que durará la investigación, el personal que se requiere y el presupuesto necesario, sino con el fin de que la investigación se realice con metas perfectamente definidas. Recolección de datos. Organización de datos. Presentación de datos. Análisis e interpretación de los resultados. 1.4. Conceptos básicos. Población Se denomina población a un conjunto de elementos (personas, objetos, etc) que contienen una o más características observables de naturaleza cualitativa o cuantitativa que se pueden medir en ellos. Muestra Es un subconjunto de la población que es tomada aleatoriamente, para ser estudiada como parte representativa de la población. Unidad de muestreo Elemento sobre el que se aplicará la técnica de selección. Unidad de análisis MUESTRA ESTADÍSTICA DESCRIPTIVA TEORÍA DE MUESTREO POBLACIÓN INFERENCIA ESTADÍSTICA Es el elemento indivisible que será estudiado en una población. Parámetro Es la medida descriptiva que resume una característica de la población (media μ, varianza σ 2 , etc), calculada a partir de los datos observados de toda la población. Estadígrafo Es la medida descriptiva que resume una característica de la muestra (media x , varianza s 2 , etc), calculada a partir de los datos observados de una muestra aleatoria. Dato Es el resultado de medir una característica observable de una unidad elemental, denominado también, valor observado. 1.5. Variables: concepto y clasificación. Concepto: Se denomina variable estadística una característica definida en la población por la tarea o investigación estadística, que puede tomar dos o más valores (cualidades o numéricos). Ejemplo: - Género: masculino, femenino. - Estado civil: soltero, casado, viudo, divorciado, conviviente. - Número de hermanos: 0, 1, 2, … Clasificación: Las variables se clasifican en cualitativas y cuantitativas. Variables Cualitativas Son aquellos que están asociados a una cualidad o atributo que presenta una población o muestra. Ejemplo: Género. Estado civil. Raza de ganado. Religión. Variables Cuantitativas Son aquellos que están asociados a una característica que puede ser medida (valor cuantificable). Los valores cuantitativos pueden ser: Discretos: Es cuando sus valores correspondientes sólo pueden ser expresados por números enteros, con frecuencia son el resultado de la enumeración o del conteo. Ejemplo: Número de hermanos. Número de docentes. Continuas: Es cuando sus valores pueden ser expresados como números reales, con frecuencia es el resultado de la medición. Ejemplo: Talla de un estudiante. Peso de un estudiante. 1.6. Escalas de medición: concepto y clasificación. Concepto: Se denomina escala de medición a un instrumento de medida, con el que se asigna valores (cualidades o números) a las unidades estadísticas para una variable definida, su conocimiento es importante pues cada una de ellas tiene métodos estadísticos específicos. Clasificación: Las escalas de medición se clasifican en: nominal, ordinal, interválica y de razón. Escala Nominal Se define una escala nominal si dos o más valores de una variable, sólo permiten percibir las diferencias o semejanzas de las unidades estadísticas que se midan. Tales valores son como etiquetas que identifican a las unidades estadísticas y las hacen iguales o diferentes entre sí. Ejemplo: Género. Estado civil. Religión. Escala Ordinal Es una escala ordinal donde los valores de la variable se pueden ordenar en forma ascendente o descendente. En una escala ordinal, los valores reflejan el orden de las unidades estadísticas, sólo son válidas las relaciones de igualdad, de no igualdad y de orden. Ejemplo: Nivel educativo. Cargos en una empresa. Escala de Intervalos Son aquellos que suponen un orden y grados de distancia iguales entre las diversas categorías, pero no tienen un origen natural, sino convencional, es decir, tiene el cero relativo. Ejemplo: Coeficiente intelectual. Temperatura. Escala de Razón Es una escala de intervalos con un origen natural, es decir, tiene el cero absoluto. Ejemplo: Talla. Peso. Número de hermanos. 1.7. Cuadros Estadísticos Después de la recopilación de los datos, es necesario resumirlos y representarlos en forma tal, que faciliten su comprensión y su posterior análisis y utilización, para ello se ordenan en cuadros estadísticos. Los cuadros estadísticos presentan ordenadamente los datos en filas y columnas, clasificados y agrupados de acuerdo a un criterio específico. Un cuadro debe contener como elementos siguientes: 1. Número de cuadro. 2. Título. 3. Encabezamiento o conceptos. 4. Cuerpo. 5. Notas al pié o llamadas. 6. Fuente. 7. Elaboración. Cuadros de Distribución de Frecuencias Consiste en distribuir los datos de una muestra en clases o categorías e ir colocando el número de datos que cae dentro de cada intervalo. Para ello, se requiere conocer algunas definiciones previas: Alcance o recorrido (A) Es el intervalo definido por el menor y mayor de los datos. [Xmin - Xmax] Rango (R) Es la diferencia entre el mayor y menor valor. R = Xmax - Xmin Intervalos de Clase (Li) Son grupos que resultan de particionar el alcance o recorrido. > ÷ +1 [ i i L L , i = 1, 2, 3, …K. Número de Intervalos (k) El número de intervalos óptimo, se determina según la regla propuesta por Sturges. ) ( 32 . 3 1 n Log k + = Donde: n, es el número total de datos Además, “k” se redondea al entero superior o inferior según convenga. Ancho de Clase (w) Es la diferencia que hay entre los extremos de cada intervalo de clase. Cuadro 01: Nivel de Ingresos de la MYPES* Ingresos (S/.) Frecuencia Porcentaje <2000 2 4 2000 – 3000 12 24 3000 – 5000 28 56 > 5000 8 16 Total 100 100 * MYPES: Micro y Pequeñas Empresas Fuente: Encuesta a MYPES Elaboración: Grupo NR (3) (1) (2) (4) (5) (6) (7) Xmin Xmax k R L L w i i = ÷ = +1 Marca de Clase (X’i) Son los puntos medios de los intervalos de clase. 2 1 ' + + = i i i L L X Frecuencia Absoluta Simple (fi) Es el número de datos que cae dentro de cada intervalo. ¿ = ÷ s s ÷ k i i i f n f 1 0 Frecuencia Relativa Simple (hi) Es el cociente entre la frecuencia absoluta y el número total de datos. 1 1 0 1 = ÷ s s ÷ = ¿ = k i i i i i h h n f h Frecuencia Absoluta Acumulada (Fi) Es aquella que resulta de sumar sucesivamente las frecuencias absolutas simples. k i f F i j j i , 1 , 1 = = ¿ = Frecuencia Relativa Acumulada (Hi) Resulta de sumar sucesivamente las frecuencias relativas simples. k i h H i j j i , 1 , 1 = = ¿ = Ejemplo 1 El gobierno desea averiguar si el número medio de hijos por familia ha descendido respecto de la década anterior. Para ello ha encuestado a 50 familias respecto al número de hijos, y ha obtenido los siguientes datos: Se pide: - Construir el cuadro de distribución de frecuencias - ¿Cuál es el número de familias que tiene como máximo 2 hijos? - ¿Cuántas familias tienen más de 1 hijo, pero como máximo 3? - ¿Qué porcentaje de familias tiene más de 3 hijos? Solución La población objeto de estudio es el conjunto de familias de un determinado país. La variable que estamos estudiando es el número de hijos por familia. El tipo de variable es discreta ya que el número de hijos solo puede tomar determinados valores enteros (es imposible tener medio o un cuarto de hijo). Para construir la tabla de frecuencias tenemos que ver cuantas familias tienen un determinado número de hijos. Podemos ver que el número de hijos, toma los valores existentes entre 0 a 6 hijos. Por tanto, el cuadro queda de la siguiente manera: xi fi Fi hi Hi 0 2 2 0.04 0.04 1 4 6 0.08 0.12 2 21 27 0.42 0.54 3 15 42 0.30 0.84 4 6 48 0.12 0.96 5 1 49 0.02 0.98 6 1 50 0.024 1 n = 50 1 - El número de familias que tienen dos o menos hijos es: 2+4+21 = 27. - El número de familias que tienen más de un hijo pero tres como máximo es: 21 + 15 = 36 - Por último el porcentaje de familias que tiene más de tres hijos, son aquellos que tienen 4; 5 y 6 es decir 6+1+1= 8 2 4 2 3 1 2 4 2 3 0 3 3 4 5 2 0 3 2 1 2 2 2 2 3 2 6 2 3 2 2 3 2 2 3 1 4 2 3 2 4 3 2 3 3 4 3 3 2 2 1 El porcentaje será el tanto por uno multiplicado por cien es decir, la frecuencia relativa de dichos valores multiplicado por 100: (0.12+0.02+0.02)* 100 = 0,16 * 100 = 16 % Ejemplo 2 Un nuevo hotel va a abrir sus puertas en cierta ciudad. Antes de decidir el precio de sus habitaciones, el gerente investiga los precios por habitación de 40 hoteles de la misma categoría de esa ciudad. Los datos obtenidos en decenas de nuevos soles fueron: 3,9 4,7 3,7 5,6 4,3 4,5 5,3 3,9 4,3 5,0 6,0 4,7 3,3 4,3 4,1 5,8 4,4 4,2 4,0 5,4 3,9 4,7 3,3 4,5 4,9 5,0 6,1 5,1 4,5 4,8 4,7 5,1 4,2 4,4 5,8 4,8 6,1 4,3 5,3 4,5 Se pide: 1.- Construir el cuadro de distribución de frecuencias 2.- ¿Cuántos hoteles tienen un precio entre 3,2 y 3,7? 3.- ¿Cuántos hoteles tienen un precio superior e igual a 4,7? 4.- ¿Qué porcentaje de hoteles cuestan como mucho 4,2? Solución 1.- La población objeto de estudio son los hoteles de una ciudad. - La variable que estamos estudiando es el precio. - El tipo de variable es continua. Además, existen muchos valores diferentes, por tanto es bueno agrupar la serie en intervalos. La manera de hacerlo sería la siguiente: Primero, calculamos el rango R = xmax – xmin = 6,1–3,3 = 2,8 Por lo tanto: R = 2,8 Segundo, cuando no se nos dice nada el nº de intervalos, se obtiene mediante la fórmula propuesta de Sturges sobre el número de datos observado. 31 , 6 ) 40 ( 32 . 3 1 = + = Log k Por lo tanto: k = 6 Tercero, obtener la amplitud de clase. 46 , 0 6 8 , 2 = = w Importante: La amplitud es de 0,46 por lo que además de no ser muy fácil de operar, puede que no cubra el rango de la variable. Lo podemos evitar, realizando la corrección de límites, así: 3 , 6 3 , 3 5 , 0 6 min = + × = + = ' ' ' X kw X Luego: X’max= Xmax+ 0,1 = 6,1 + 0,1 = 6,2 X’min= Xmin - 0,1 = 3,3 - 0,1 = 3,2 Por lo tanto, el cuadro queda de la siguiente manera: [LI-1 - LI) fi Fi hi Hi [3,2 - 3,7) 2 2 0,05 0,05 [3,7 - 4,2) 6 8 0,15 0,2 [4,2 - 4,7) 12 20 0,3 0,5 [4,7 - 5,2) 11 31 0,275 0,775 [5,2 - 5,7) 4 35 0,1 0,875 [5,7 - 6,2) 5 40 0,125 1 n = 40 2.- 2 3.- 20 4.- % = F2*100 = 0,2*100 = 20% 1.8. Gráficas Estadísticos La representación gráfica se utiliza para facilitar al lector la comprensión de los resultados; el objetivo de las gráficas es que la información “impacte” directamente al lector y que se exprese el “perfil” de la distribución. X’min = 3,2 X’max= 6,2 Xmin = 3,3 Xmax= 6,1 Diferencia 6,3 – 6,1 = 0,2 luego dividirlo en dos partes (0,1), sumarle al valor máximo y restarle al valor mínimo. Si dicha diferencia es impar asignarle una unidad más a la parte superior 1 , 6 3 , 6 max = = ' ' ' X X - El diagrama de barras o rectángulos, consistente en asociar a cada modalidad de la variable un rectángulo cuya superficie refleje su frecuencia: las modalidades se suelen situar en horizontal y la escala de frecuencias absolutas o relativas en vertical. Los rectángulos suelen representarse separados en este tipo de gráficas, que también pueden aparecer con las barras horizontales y las modalidades situadas verticalmente. También es usada para variables discretas. - El diagrama de sectores, que refleja como sectores de un círculo las frecuencias de cada modalidad. Como el radio es constante en un círculo, para cumplir la regla fundamental de proporcionalidad basta hacer al ángulo de cada sector proporcional a la frecuencia, lo que se consigue multiplicando los 360º del círculo por la frecuencia relativa de cada modalidad. Este tipo de gráficas es muy útil para comparar los resultados de una variable cualitativa en dos o más muestras. - El histograma, que es la gráfica adecuada para representar variables cuantitativas continuas. En la práctica, lo que se hace es agrupar los valores en intervalos y gráficamente se representan rectángulos cuyas bases descansan sobre la horizontal y cuyas alturas son tales que el área de cada rectángulo sea proporcional a la frecuencia de cada intervalo. 0 10 20 30 40 x1 x2 x3 x4 X F i - Polígono de frecuencias, es la recta que une los extremos de las variables de una distribución. - Ojivas, En este gráfico se emplea un polígono de frecuencia o curva suavizada con una característica muy particular: muestra las frecuencias absolutas o relativas acumuladas. 1.9. Medidas de Tendencia Central Media o Promedio aritmético ( x ) Es el cociente entre la suma de todos los datos y el número de ellos (teniendo en cuenta que si un valor se repite hay que considerar estas repeticiones). Datos sin agrupar Datos agrupados Mediana (Me): Es el valor que separa por la mitad las observaciones ordenadas de menor a mayor, de tal forma que el 50% de estas son menores que la mediana y el otro 50% son mayores. Si el número de datos es impar 0 2 4 6 8 x1 x2 x3 x4 x5 F r e c u e n c i a s n x x n i i ¿ = = 1 n w f x m i i i ¿ = = 1 la mediana será el valor central, si es par tomaremos como mediana la media aritmética de los dos valores centrales. Datos sin agrupar Datos agrupados i i F n F s < ÷ 2 1 | | | | . | \ | ÷ + = ÷ i i i i e f F n w L M 1 2 Donde: i L : Límite inferior del intervalo i. i w : Ancho de clase del intervalo i. Moda (Mo): Es el valor de la variable que más veces se repite. En algunos casos existen varias modas. Datos sin agrupar La moda es el valor de la variable correspondiente a la mayor frecuencia absoluta. Datos agrupados | | . | \ | ÷ + ÷ ÷ + = + ÷ ÷ ) ( ) ( 1 1 1 i i i i i i i i o f f f f f f w L M Donde: i f = Frecuencia absoluta más alta. Ejemplo 3 Determinar la media, mediana y moda de los datos del ejemplo 1. Solución Las fórmulas a utilizar son para datos agrupados: ¦ ¦ ¹ ¦ ¦ ´ ¦ + = + + impar es n si x par es n si x x M n n n e , , 2 2 1 1 2 2 Media: 50 1 6 1 5 6 4 15 3 21 2 4 1 2 0 × + × + × + × + × + × + × = x 52 , 2 = ¬ x Esto significa, que el promedio de hijos por familia es de 2,52 hijos. Mediana: i i F n F s < ÷ 2 1 27 25 6 3 2 = s < = ¬ F F 3 = i 90 , 2 21 6 25 1 2 25 3 2 3 3 = | . | \ | ÷ + = | | . | \ | ÷ + = f F w L M e 90 , 2 = ¬ e M Esto significa, que el 50% de las familias tiene a lo mucho 2,9 hijos por familia. Moda: | | . | \ | ÷ + ÷ ÷ + = + ÷ ÷ ) ( ) ( 1 3 3 1 3 3 1 3 3 3 3 f f f f f f w L M o 74 , 2 ) 15 21 ( ) 4 21 ( 4 21 1 2 = | | . | \ | ÷ + ÷ ÷ + = o M 74 , 2 = ¬ o M Esto significa que la mayoría de las familias tiene 2,74 hijos EJERCICIOS 1. Los sueldos mensuales (en dólares) de 60 empleados de la empresa Pirámide S.A. en el año 2002 son los siguientes: 440 560 335 587 613 400 424 466 565 393 453 650 407 376 470 560 321 500 528 526 570 430 618 537 409 600 550 432 591 428 440 340 558 460 560 607 382 667 512 492 450 530 501 471 660 470 364 634 580 450 574 500 462 380 518 480 625 507 645 382 2. Se distribuye el número de empresas según sus inversiones en millones de soles. | ) s i L L ÷ i f 4 – 10 1 10 – 16 3 16 – 22 6 22 – 28 12 28 – 34 11 34 – 40 5 40 – 46 2 ¿Cuántas empresas intervienen en menos de 25 millones de soles?, obtener X , Me y Mo. 3. Se tiene las temperaturas observadas en el hemisferio norte durante 24 días en °C. | ) s i L L ÷ i f hi -19 - -17 -17 – -15 2 -15 – -13 8 -13 – -11 0.125 -11 – -9 4 -9 – -7 0.2083 ¿Durante cuántos días se obtuvo una temperatura de –16 a –10? , obtener X , Me y Mo. - Construya la tabla de frecuencia. - Identifique la población, muestra y la variable, obtener , M e y M o . 4. Se revisaron 20 lotes de 48 artículos cada uno y se encontró el siguiente número de artículos defectuosos por lote: 3, 2, 5, 0, 1, 3, 2, 1, 0, 1, 3, 4, 2, 4, 4, 4, 3, 3, 2, 3 Construir el cuadro de distribución de frecuencias y ¿qué porcentaje de lotes tienen 2 o más pero menos de 4 artículos defectuosos? 5. Dado el siguiente cuadro estadístico referente a los pesos de cierto número de pacientes en un hospital. | ) s i L L ÷ i f 0 – 12 5 12 – 24 24 24 – 36 18 36 – 48 36 48 - 60 17 ¿Cuántos pacientes pesan más de 19 y menos de 38 kilos?, obtener X , Me y Mo. 6. En el curso de Estadística I; se tiene las notas de los alumnos distribuidas según el siguiente histograma de frecuencias, entonces la nota promedio del curso es: 7. Al calcular la medía de 125 datos, resultó 42. Un chequeo posterior mostró que en lugar del valor 12.4 se introdujo 124. Corregir la media. 8. Dada la siguiente distribución de frecuencias, calcular el valor de “n” sabiendo que la moda es 60 y pertenece al tercer intervalo. Calcular además, X y Me. | ) s i L L ÷ i f 16 – 32 6 32 – 48 n 48 – 64 8 64 – 80 3n 80 - 96 3 0 2 4 6 8 10 12 14 16 4 6 8 10 12 14 Alumnos Notas 9. En una encuesta sobre los ingresos anuales en miles de soles de un grupo de familias se obtuvo la siguiente información: | ) s i L L ÷ i f 10 – 30 20 30 – 50 50 – 70 70 - 90 20 Además, 54 = x y 5 / 1 / 3 2 = f f , calcular el número de familias con ingreso no menos de 50 mil soles. 10. Dada la siguiente distribución de frecuencias, calcular el valor de “n” sabiendo que la mediana vale 6 . 61 y que pertenece al quinto intervalo. | ) s i L L ÷ i f 20 – 30 3 30 – 40 1 40 – 50 2 11. De una muestra de tamaño tres se sabe: la suma de los cubos de las tres observaciones es 1971, la media aritmética es 7 y la mediana es 6. Calcular el valor de cada una de las observaciones. 12. De las edades de cuatro personas, se sabe que la media es igual a 24 años, la mediana es 23 y la moda es 22. Encuentre las edades de las cuatro personas. 13. De la curva de frecuencias de los sueldos de 30 empleados de una empresa, se sabe que Mo =$200, Me =$220, y X =$250. Califique como verdadera o falsa las siguientes afirmaciones, justificando su respuesta: a) El sueldo más frecuente es de $200 y más de la mitad de todos empleados gana más de esa cantidad. b) Con una suma de $3,300 se asegura el pago de la mitad de los empleados y con $7,500 el de todos los empleados. 14. Dada la siguiente distribución de frecuencias, calcular el valor de “n” sabiendo que la mediana vale 36 y que pertenece al tercer intervalo. | ) s i L L ÷ i f 20 – 26 8 26 – 32 4 32 – 38 n 38 – 44 6 44 - 50 10 15. Las notas de un examen se presentan a continuación: 09, 18, 12, 16, 10, 11, 12, 14, 17, 12, 15, 07. Calcular e interpretar: X , Me, Mo. 16. Dada la siguiente distribución de frecuencias en base al ingreso familiar de 200 familias. | ) s i L L ÷ i f Fi - 12 - 270 - 300 30 90 - 126 330 - - 50 ¿Cuántas familias tienen un ingreso comprendido entre 260 y 320? 17. Se tiene la siguiente distribución simétrica. | ) s i L L ÷ i f Fi hi - 8 12 - - 1/5 - 24 17 - Si el ancho de clase es constante. ¿Cuántos datos habrá en el intervalo [12 – 20>? 18. Completar el siguiente cuadro que corresponden a las notas de un examen: Intervalos Marca de clase hi Hi - 0.15 6 - 0.45 - 0.70 - 13.5 - 0.10 Total - - ¿Qué porcentaje de notas se encuentran aproximadamente en el intervalo de 8 – 14? 19. En una compañía en sueldo mínimo y máximo de 200 empleados es de $150 y $300 respectivamente. Tales sueldos se tabulan en una distribución de frecuencias de 5 intervalos de igual amplitud. Si se sabe que 20 empleados ganan al menos $150, pero menos de $180, 60 ganan menos de $210, 110 ganan menos de $240, 180 ganan menos de $270 y el 10% restante de empleados gana a lo más $300; reconstruir la distribución de frecuencias. 20. La organización del tiempo, en minutos, que tardaron 100 obreros para ejecutar cierta tarea, ha dado una tabla de frecuencias de cuatro intervalos de igual amplitud cuyo histograma correspondiente es simétrico. Si el intervalo 1 = [6, >, la frecuencia absoluta: f2 = 2 f1 + 5, y si se sabe que el 85% de los obreros demoraron menos de 12 minutos. Completar la distribución de frecuencias. 21. Las notas de un examen se tabularon en una distribución de frecuencias de 3 intervalos de amplitud iguales a 5. si la nota mínima es igual a 5, el 48% de las notas son menores que 12, y si el 80% de las notas con inferiores a 16, reconstruir la distribución de frecuencias Seminario 01 1. Realice una distribución de frecuencias para cada uno de los siguientes conjuntos de datos, que contenga Frecuencias: Absoluta; Relativa; Acumulada; Relativa Acumulada; además realice un gráfico adecuado e interprete los resultados A. Los siguientes datos representan la distancia en Km. que recorren diariamente 30 personas desde sus casas a los sitios de trabajo: 2,0 3,0 0,3 3,3 1,3 0,4 0,2 6,0 5,5 6,5 0,2 1,5 4,0 5,9 1,8 4,7 0,7 4,5 0,3 1,5 0,5 2,5 1,6 6,0 5,6 6,0 1,2 0,2 2,0 1,5 1,6 2,3 5,0 B. Los contenidos de nicotina, en miligramos, hallados en los dedos de 40 fumadores se registran a continuación: 1,09 1,92 2,31 1,79 2,28 1,74 1,47 1,97 0,85 1,24 1,70 2,17 2,55 2,11 1,86 1,90 1,68 1,51 2,03 1,64 1,71 1,85 1,82 1,79 2,46 1,88 2,08 1,67 1,37 1,93 1,72 2,09 1,75 1,63 2,37 1,75 1,69 1,58 0,72 1,40 2. Los siguientes datos pertenecen a la distribución de la producción de papas (en Tn.) en 40 zonas del país X’1 = 20 f2 - f5 = 2 X’5 = 100 f1 = 4 f3 = 20 Si se sabe que la distribución es simétrica y presenta 5 intervalos de clase. Reconstruya los intervalos de clase y obtenga las frecuencias absolutas y relativas. 3. La siguiente gráfica recoge la cantidad de parejas de zapatos de mujer vendidas en una tienda a lo largo del día: 0 5 10 15 20 25 30 35 36 37 38 39 40 Nº de zapato N º d e p a r e s v e n d i d o s a) ¿Cuántas parejas de zapatos del número 37 se han vendido? b) Pasa los datos a una tabla de frecuencias absolutas. c) ¿Cómo se llama la gráfica que nos han dado? d) ¿Qué porcentaje de zapatos vendidos eran números del 39 o 40? 4. En la tabla de frecuencias que se da a continuación faltan algunos datos. Complétela, y represéntela gráficamente. Valores X'i fi Fi hi Hi 0 2 1 5 2 9 3 14 0,70 4 0,20 5 Total 5. En la tabla de frecuencia que se brinda a continuación faltan algunos datos. Complétela y represéntela gráficamente. Clases X'i fi hi Fi Hi 20 - 24 0.10 24 - 28 0.25 - 32 11 0.55 32 - 0.85 - 40 1.00 Total Obtener el porcentaje de datos que se encuentran entre 22 a 30. 6. El siguiente cuadro de distribución de frecuencias representa a la cantidad de residuos orgánicos (en kilogramos) que generan en un día 40 familias de la Ciudad de Huaraz. Valores X'i fi Fi hi Hi - 5 - 8 24 - 0,20 - 0,90 - 17 Total 1,00 Complete el cuadro, y calcule el porcentaje de familias que generan en un día entre 10,5 a 15,5 kilogramos de residuos orgánicos 7. Las ganancias diarias de los establecimientos de un centro comercial se presentan en una tabla de frecuencias con 6 intervalos de clase y se sabe que: la mínima ganancia es de $6, el rango es 36, el promedio de ganancias diarias es $25.14, el 50% de los establecimientos ganan más de 25.58 dólares diarios, H2=0.15, F2=120, h3=0.25, H5=0.93, f4=304, f2=2f1. Reconstruir la distribución de todas las frecuencias. 8. Los tiempos de vida útil (en días) de un tipo de batería, se tabuló en una distribución de 5 intervalos de igual amplitud con frecuencias relativas acumuladas: 0.10, 0.25, 0.55, 0.80, 1.00. Determine la distribución de frecuencias absolutas si la tercera frecuencia absoluta acumulada es 11, si la segunda marca de clase es 6, y si el límite inferior del cuarto intervalo es 12. 9. Los ingresos mensuales de una muestra de pequeños comerciantes se tabularon en una distribución de frecuencias simétrica de 5 intervalos de igual amplitud resultando: ingreso mínimo $125, marca de clase del cuarto intervalo $300. Si el 8% de los ingresos son menores que $165 y el 70% de los ingresos son menores a $275, ¿Qué porcentaje de ingresos son superiores a $285? 10. El tiempo (en horas) de 120 familias que utilizan su computadora se tabularon en una distribución de frecuencias de 5 intervalos de amplitud iguales a 4, siendo; el tiempo mínimo de uso 2 horas, la primera y segunda frecuencias iguales al 10% y 15% del total de casos respectivamente. Si el 73.75% de las familias lo usaron menos de 17 horas y el 85% menos de 19 horas, determine las frecuencias. 11. Los puntajes de una prueba de aptitud se tabularon en una distribución de frecuencias de 6 intervalos de igual amplitud. Si se tienen: marca de clases dos y cuatro, 40 y 80 respectivamente, frecuencias: h1=h6, h3=h5, h4=0.25, h2=h4-h1, h3=h1+0.10, y F6=60, completar la distribución de frecuencias absolutas