Tratamiento de Datos y azar•Rango: Diferencia entre el máximo y el mínimo valor de una variable.(r) Numero de clase: es el numero de grupos en los que se divide los valores de la variable Existen varias técnicas para determinar el número de intervalos a utilizar: 1- A criterio del investigador. 2- Usar una de las fórmulas: Fórmula de Sturges K Velleman k siempre que n>50 Tamaño de un intervalo: o amplitud de clases el cociente entre el valor del rango y la cantidad de intervalos que se desea obtener. Se recomienda tomar como longitud de los intervalos un valor entero que sea mayor o igual al cociente obtenido. a= r k Limites reales o fronteras reales: en cada clase o intervalo el valor menor se conoce como limite inferior (Li) y el valor mayor como limite superior (Ls) Se obtienen calculando el promedio entre Ls y el Ls del siguiente intervalo. Marcas de clase o punto medio: es el punto medio de cada intervalo y se obtiene al promediar los limites de este. m = Ls + Li 2 Construye una tabla de frecuencias cuyos datos estén agrupados en ocho intervalos. 1°Para poder construir la tabla de frecuencias lo primero que debemos hacer es calcular el rango (r). r=Dato mayor - dato menor = 73 - 1 = 72 Por lo tanto; r = 72 2° Calcular el Numero de clase: (k) En el problema nos dicen que debemos agruparlo en 8 intervalos o clases K=8 3° Calcular la Amplitud: La amplitud de un intervalo es la diferencia entre el límite superior y el límite inferior. La amplitud(a) de los intervalos puede calcularse mediante la expresión: a= r k 4° Ahora podemos comenzar a construir la tabla de frecuencias: El primer intervalo comienza con el dato menor y el limite superior será (dato menor + a ) - 1 5° Calcular los limites reales: Lr = Limite inferior del primer intervalo + limite superior del segundo intervalo 2 6° Calcular los marca de clase: m = Ls + Li s Edades fa Limites Marca faa fr Fra reales de clase 1 – 10 11 – 20 21 - 30 31 – 40 41 – 50 51 – 60 52 – 60 61 – 70 a) Del total de personas encuestadas, ¿cuántas personas tienen entre 31 y 40 años? b) Del total de personas encuestadas, ¿cuántas personas tienen 60 o menos años? c) ¿Cuál es el porcentaje de las personas encuestadas estén entre 11 y 20 años? d) ¿Cuál es el porcentaje de que las personas encuestadas tenga 50 años o menos? a) Del total de personas encuestadas, ¿cuántas personas tienen entre 31 y 40 años? Respuesta: Observamos los datos obtenidos en la tabla y tenemos que: El dato lo obtenemos de la columna de la frecuencia absoluta. Recuerda que: Frecuencia absoluta Corresponde a la cantidad de veces que se repite un dato. Denotamos este valor por fi. Por lo tanto la respuesta es 6 personas. b) Del total de personas encuestadas, ¿cuántas personas tienen 60 o menos años? Respuesta: Observamos los datos obtenidos en la tabla y tenemos que: El dato lo obtenemos de la columna de frecuencia absoluta acumulada. Recuerda que: Frecuencia absoluta acumulada es la suma de las frecuencias absolutas observadas hasta el intervalo i. En este caso es el intervalo 6. Por lo tanto la respuesta es 36 personas tienen 60 o menos años. c) ¿Cuál es la probabilidad de, que al elegir al azar a un persona consultada, esta tenga entre 11 y 20 años? Respuesta: Observamos los datos obtenidos en la tabla y tenemos que: El dato lo obtenemos de la columna de frecuencia relativa. Recuerda que: Frecuencia relativa Corresponde a la probabilidad de pertenecer a cierta categoría. Se puede expresar en tantos por ciento. En este caso es el intervalo 2, ya que es ahí donde se encuentran las edades entre 11 y 20 años. Entonces la respuesta es: La probabilidad es 14%. Por último vamos a repasar el concepto de: Frecuencia relativa acumulada (Hi), Es la probabilidad de observar un valor menor o igual al valor que toma la variable en estudio en ese intervalo. Se calcula dividiendo Fi por el número total de datos. También puedes calcularlo Sumando la frecuencia relativa de cada grupo con la frecuencia relativa acumulada del grupo anterior. Si haces correctamente estos cálculos, el último grupo tendrá una frecuencia acumulada de 1, o muy cerca de 1, permitiendo redondear el error. Recuerda que este valor se puede expresar como porcentaje, para esto solo debes multiplicar el valor obtenido por 100 y listo!!! Este calculo te sirve en el caso de que te pregunten: d) Si le preguntas a una persona cualquiera ¿Cuál es la probabilidad de que tenga 50 años o menos? Un nuevo hotel va abrir sus puertas en una cierta ciudad. Antes de decidir el precio de sus habitaciones, el gerente investiga los precios por habitación de 40 hoteles de la misma categoría de esta ciudad. Los datos obtenidos (en miles de pesetas) fueron: 3.3 3.3 3.7 3.8 3.9 3.9 3.9 4.0 4.1 4.2 4.2 4.3 4.3 4.3 4.3 4.4 4.4 4.5 4.5 4.5 4.5 4.7 4.7 4.7 4.7 4.8 4.9 5.0 5.0 5.1 5.1 5.3 5.3 5.4 5.6 5.8 5.8 6.0 6.1 6.1 Procedimiento: 1.- El menor valor es 3.3 y el mayor 6.1, la diferencia es 2.8 y por tanto r=2.8. 2.- K= 1+3,322 log(40) = 6.3 ≈ 6 números de intervalos 3.- a = 2.8 / 6 = 0.467 ≈ 0.5 tamaño de los intervalos clases fa Limites Marca faa fr Fra reales de clase ¿Cuantos hoteles tienen un precio entre 3.3 y 3.8? ¿Cuantos hoteles tienen un precio superior a 4.8? ¿Que porcentaje de hoteles cuestan como mucho 4.3? 27.5 % En una entrevista se han preguntado a 100 alumnos que tomaron la asignatura de estadística cuales fueron sus calificaciones finales. Los resultados son los siguientes 100 84 33 98 57 90 82 77 55 62 87 65 33 70 47 83 85 55 51 93 98 47 100 62 64 57 68 100 57 54 82 66 69 70 86 95 72 80 47 58 93 25 77 65 25 85 65 55 64 95 47 70 88 70 66 100 76 52 75 83 40 85 63 84 40 67 23 85 65 33 53 36 17 52 100 60 96 60 70 68 88 61 42 60 32 42 30 53 45 34 58 34 55 54 39 65 45 82 75 60 La forma de la distribución de frecuencias se percibe más rápidamente si la representamos gráficamente. Se resume la información de la muestra de forma grafica con fines clarificadores o para enfatizar y descubrir determinadas características que de otra manera seria muy difícil de apreciar. Un grafico siempre es mas inmediato de comprender que un conjunto de datos estadísticos. Las representaciones graficas varían según el tipo de variable: DIAGRAMA DE BARRAS: Es la representación gráfica usual para variables cuantitativas discretas o para variables cualitativas. En el eje de ordenadas representamos los diferentes valores de la variable (xi). Sobre cada valor levantamos una barra de altura igual a la frecuencia (absoluta o relativa). HISTOGRAMA: Es la representación gráfica de las frecuencias agrupadas de una variable continua sobre intervalos. A diferencia de los diagramas de barras, los histogramas dibujan rectángulos unidos entre si, lo que significa que existe continuidad en la variable cuyos valores se representan en el eje horizontal que se haya dividido en intervalos de igual amplitud. Las áreas de los rectángulos son proporcionales a las frecuencias que representan. Es dentro de las técnicas de análisis exploratorio de datos una de más usadas ya que permite mostrar el orden de rangos así como la forma de un conjunto de datos en forma simultanea Se caracteriza por ser fácil de construir y dar más información que un histograma, debido a que muestra los valores reales No hay cantidad única de tallos ni hojas aún cuando se recomienda seleccionar entre 5 a 20 tallos Datos cuantitativos Trace un diagrama de tallo y hoja para los siguientes datos. 70, 72, 75, 64, 58, 83, 80, 82, 76, 75, 68, 65, 57, 78, 85, 72 1.Ordenar en forma ascendente 2.Seleccionar rangos (ancho de clases) define tallos 3.Incorporar hojas Tallo Hoja 5 7 8 6 4 5 8 7 0 2 2 5 5 6 8 8 0 2 3 5
Report "Tabla de Distribución de Frecuencias Para Datos Agrupados"