Estadistica Descriptiva

ESTADÍSTICA DESCRIPTIVAP. Reyes / Sep. 2007 ESTADÍSTICA DESCRIPTIVA Elaboró: Hector Hernández / Primitivo Reyes Aguilar Septiembre de 2007 Mail: [email protected] Tel. 58 83 41 67 / Cel. 044 55 52 17 49 12 Página 1 de 20 ESTADÍSTICA DESCRIPTIVA P. Reyes / Sep. 2007 CONTENIDO 1. Introducción 2. Medidas de tendencia central y dispersión para datos simples 3. Otras medidas de dispersión: Percentiles y quartiles 4. Distribución de frecuencias, histogramas, diagama de tallo y hojas 5. Medidas de tendencia central y de dispersión para datos agrupados 6. Usos frecuentes de la desviación estándar 7. Uso de Minitab y Excel 8. Ejercicios Página 2 de 20 tabulación. Medidas de tendencia central  Media: ( x ) Es el promedio aritmético de todos los valores que componen el conjunto de datos. encontraremos que existe variabilidad en esos parámetros. es muy útil contar con información sobre los valores que se agrupan hacia el centro y sobre que tan distanciados o dispersos estén unos respecto a otros. Desviación estándar = s. Coeficiente de correlación = r) La Estadística descriptiva proporciona un criterio para lograr mejoras. MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN PARA DATOS SIMPLES. si utilizamos instrumentos de medición con la resolución suficiente. análisis e interpretación de datos cuantitativos y cualitativos. debido a que sus técnicas se pueden usar para describir y comprender la variabilidad. Desviación estándar = σ.ESTADÍSTICA DESCRIPTIVA P. para tomar decisiones que se requieran a fin de que el comportamiento de los datos se mantenga dentro de los parámetros de control establecidos.  Estadístico – Es una característica numérica de una muestra. consideremos en una caldera de vapor la presión del combustible alimentado y la eficiencia de la caldera. se identifica con letras griegas (Media = µ. Proporción = p. Introducción La Estadística descriptiva es la rama de las matemáticas que comprende la recopilación. Se calcula mediante la siguiente fórmula: Para una muestra y para una población se tiene respectivamente: x xi n  Página 3 de 20 xi n . Por ejemplo. debe ser representativa de la misma. Coeficiente de correlación = ρ)  Muestra (n) – Es una parte de la población.  Población (N)– Es el conjunto de todos los elementos de interés para determinado estudio  Parámetro – Es una característica numérica de la población. 2. se identifica con letras latinas (Media = X. y mediante el uso de técnicas estadísticas podemos realizar mejoras para reducir la variación en rendimiento de la caldera. Comenzaremos por definir estas medidas: La estadística inferencial se refiere a la estimación de parámetros y pruebas de hipótesis acerca de las características de la población en base a los datos obtenidos con una muestra. Para poder obtener consecuencias y deducciones válidas de los datos de un estadístico. Proporción = π. Reyes / Sep. 2007 ESTADÍSTICA DESCRIPTIVA 1. 97.1.ESTADÍSTICA DESCRIPTIVA P.60.1.7.1. buscando el número que ocupa la sexta posición en los datos ordenados encontramos el valor de la mediana ~ x  1.34. 3.4.2.54.1.54.1.82.42.1. 5.82.2.97.9.9.1.65.6. 6 con media = 20/5 = 4 Página 4 de 20 . ordenado los datos obtenemos: 8.82 Medidas de dispersión Para comprender el concepto de varianza.3.87.4.79. 4.74. Calcule la media. Como tenemos 11 datos.20  63.9.1.6.79.79.1.67. calculando la media de los datos restantes obtenemos ~x .1. por lo cual eliminamos 2 datos el más bajo y el más alto.60.4.34.1.82.9.31.80.68. Reyes / Sep.5.3.1.72.1.31.71.67. el 20% de 11 es 2.97.72.2.33.7.67.73 n 11 Mediana: ( ~ x ) Los datos de "n" observaciones son ordenados del más pequeño al más grande.7. 1. Se puede calcular mediante: n 2  n 2  1 2 Ejemplo 2: Para el ejemplo anterior ¿cuál es la mediana? Ordenando los datos de mayor a menor se obtiene: 1.80.73. los valores a eliminar son: 8.1.73  Media acotada (Truncated Mean): Determinado porcentaje de los valores más altos y bajos de un conjunto dado de datos son eliminados (tomando números enteros)..70.73.74.3.1.6. supóngase que tenemos los datos siguientes de los cuales queremos saber que tan dispersos están respecto a su media: 2.5.6.7.71.70.84.4 y 97.1.9.1.2.97.42.8.1.33.1.79.87.2. x  xi 19   1.1. Ejemplo 3: Para la siguiente serie de datos calcule la media acotada al 20%: 68. Como tenemos 11 datos el número es non por lo que (n+1)/2 = 12/2 = 6.84. Cuando el tamaño de la muestra es "par" la mediana es el promedio de los dos valores que se encuentran al centro del conjunto de valores.2.65. Si el tamaño de la muestra es "non" la mediana es el valor ordenado en la posición (n+1)/2.1.2.3.67.73.73. 2007 Ejemplo 1: En un equipo de fútbol. para los valores restantes se calcula la media.4. una muestra de estaturas de sus integrantes son las siguientes: 1.82. Por ejemplo para el conjunto de datos siguiente: 2. var iación  CV  (100) X Página 5 de 20 .2.3.de. s Coeficient e.3. s2    ( xi  x ) 2 n ( xi  x ) 2 n 1 Desviación estándar: Es la raíz cuadrada de la varianza: Para el caso de una población   Para el caso de una muestra  s ( xi  x ) 2  n ( xi  x ) 2  n 1 Rango ( R ): es la diferencia positiva entre el valor mayor y el valor menor de un conjunto de datos.8.0. que tan distanciados están de la media  Poblacional (σ2 ) Se obtiene dividiendo el valor anterior entre n = 5.8.2.5.2. Reyes / Sep.9.2.0 Su rango es R = 4.1.2.0 = 2.3. tomando n -1 datos.2.6. 2   Poblacional (s2 ) Se obtiene dividiendo el valor anterior entre n .3.0 – 2. ya que representa una medida relativa de dispersión.0.2.1. o sea el promedio de la suma de las diferencias al cuadrado. Si ahora tomamos esas mismas diferencias al cuadrado y las sumamos se tiene: 4 + 1 + 0 + 1 + 4 = 10 Varianza de los datos Es una medida que nos ayuda a comprender la variabilidad de los datos. o sea el promedio de la suma de las diferencias al cuadrado. 2007 Si tomamos la suma de diferencias de cada valor respecto a su media y las sumamos se tiene: (-2) + (-1) + (0) + (1) +(2) = 0 Por lo que tomando diferencias simples no es posible determinar la dispersión de los datos.6.1 = 4.4.0  Coeficiente de Variación (CV): Se utiliza para comparar la dispersión de dos conjuntos de datos que tienen unidades diferentes. tomando n datos.4.9.0.4.ESTADÍSTICA DESCRIPTIVA P. 8.7 Por otra parte si la media de temperaturas es de 10 y su desviación estándar de 2.9. la desviación estándar (s).06% CV = 38. por lo cual deducimos que es presenta menor variabilidad.1. 4.0. Reyes / Sep.7 y su desviación estándar es 12.0. mediana.2. Página 6 de 20 .56 5 s= Xi .4.0. el CVs de las temperaturas es: CVt  CVs  2 (100)  20% 10 Por tanto la dispersión de las temperaturas es mayor que la de los tiempos de de respuesta. 2. 2. para esto es necesario tomar una muestra y calcular la media.11. 2. Ejemplo 5: Se desea hacer un estudio estadístico de la temperatura del agua. 3.8.6. 4.ESTADÍSTICA DESCRIPTIVA P.6.56/248*100= 5. 2. 2007 Por ejemplo si la media de tiempos de respuesta es de 78.0. 3.14 (100)  12. rango y coeficiente de variación.9. desviación estándar.625 Aunque la media en ambas muestras es la misma. Ejemplo 4: La resistencia al rompimiento de dos muestras de botellas es la siguiente: Muestra 1: Muestra 2: 230 190 250 228 245 305 258 240 265 265 240 260 Calcule la desviación estándar para ambas muestras.x )2 = 790 Suma( n-1=5 n-1 = 5 s= 790 = 12.x )2 = 7510 7510 = 38. 3.5. Se realizan 14 observaciones arrojando los siguientes resultados en ºC: 2.75 5 Rango = 265 – 230 = 35 Rango = 305 – 190 = 115 CV = 12. Muestra 1: Muestra 2  x  248  x  248 Suma(Xi .75/248*100 = 15. 2. el CVt: 12. es posible comparar estas dispersiones con el CV aunque los dos conjuntos de datos sean completamente disímbolos.05% 78. 3. media acotada al 15%. son menores en la muestra 1.14. rango y coeficiente de variación. 2. Los deciles separan un conjunto de datos ordenado en 10 subconjuntos iguales y los percentiles en 100 partes. desviación estándar.7. Reyes / Sep. DECILES Y QUARTILES Cada conjunto de datos ordenado tiene tres cuartiles que lo dividen en cuatro partes iguales.85 100 O sea que el percentil 35 está al 85% del trayecto comprendido entre la observación 17 que es 29 y la observación 18 que es 31 o sea L35 = 29 + (0. 50 y 75 proporcionan la localización de los cuartiles Q1. rango y coeficiente de variación. De la misma forma los percentiles 25. Por tanto el 35% de las observaciones están por debajo de 30. El primer cuartil es ese valor debajo del cual clasifica el 25% de las observaciones y sobre el cual se encuentra el 75% restante. la ubicación de un percentil se encuentra en: L p  (n  1) Donde: P 100 Lp es el sitio del percentil deseado en una serie ordenada n es el número de observaciones P es el percentil deseado Por ejemplo para el conjunto de datos siguiente: 3 4 7 9 10 10 12 14 15 17 19 20 21 25 27 27 29 31 31 34 34 34 36 37 38 38 39 43 45 47 48 48 52 53 56 56 59 62 63 64 67 67 69 72 73 74 74 76 79 80 La localización del percentil 35 se halla en: L35  (50  1) 35  17.7. Q2 y Q3 respectivamente. Página 7 de 20 .85)(31-29) = 30.ESTADÍSTICA DESCRIPTIVA P. media acotada al 5%.  Q2 o Mediana: es el número que representa al percentil 50 (hay 50% de los datos por debajo de este). El segundo cuartil divide a los datos a la mitad similar a la mediana. desviación estándar. mediana. OTRAS MEDIDAS DE DISPERSIÓN: PERCENTILES.  Q1: es el número que representa al percentil 25 (hay 25% de los datos por debajo de este). 2007 1) Calcular la media.7 y el 65% restante por encima de 30. 3. DISTRIBUCIÓN DE FRECUENCIAS E HISTOGRAMAS Cuando tenemos una cantidad grande de datos es difícil poder analizarlos.5RIC Rango Intercuartílico = RIC = Q3 – Q1 Valores atípicos Bigotes Figura 1. Se tienen las siguientes definiciones:  Distribución de frecuencias: es un resumen tabular de un conjunto de datos que muestra el número o frecuencia de artículos en cada una de varias clases que no se traslapan.ESTADÍSTICA DESCRIPTIVA P.  Frecuencia relativa (f): Es la frecuencia de la clase dividida entre el total n de datos.5 RIC 950 Q1 850 Q1 – 1. consiste en un diagrama de barras donde las bases corresponden a los intervalos y las alturas a las frecuencias.  Distribución de frecuencias porcentuales: es la representación de las frecuencias relativas porcentuales. Reyes / Sep. Página 8 de 20 . El histograma es una de ellas. 2007  Q3: es el número que representa al percentil 75 (hay 75% de los datos por debajo de este). Para construir un histograma es necesario tener un mínimo de 50 a 100 datos.  Rango o Recorrido intercuartílico: es la diferencia entre Q1 y Q3. Se puede representar en porcentaje. Diagrama de caja con sus cuarteles y bigotes 4. a menos que hagamos uso de herramientas que nos permitan hacerlo con mayor facilidad y claridad. DIAGRAMA DE CAJA Es la representación gráfica de los datos en forma de caja: 1 10 4 1050 Q3 Q2 Mediana Weight Q3 + 1. 36 49.47 94.32 Paso 1: Contar el número de datos n = 130 Paso 2: Calcular el rango R = Valor mayor – Valor menor.18 59.58 94.21 32.65 39. 2007 Frecuencia acumulada (F): es la acumulación secuencial de las frecuencias de cada clase.86 70. Por lo cual el Paso 4: Calcular el tamaño del intervalo de clase ( C ).58  9 .30 62.55 48.07 94.29 38.94 20.18 66.72 51.64 40.74 96.24 79. 11  Otra manera de calcular el tamaño del intervalo es el siguiente: Dividir el valor del rango entre un cierto número de clases (K).95 50.60 94. Ejemplo 6 Construir un histograma con la siguiente serie de datos: 2.70 45.80 36.62 48.44 66.91 78.91 46.03 64. resultando el tamaño del intervalo 9.34 4.02 50. R = 96.58 35.31 37.79 83.58 40.01 45. Generalmente los datos no están ordenados por lo cual resulta conveniente ordenarlos de menor a mayor para tener una mejor visualización. dividiendo el rango entre el número de 94.56 55.46 72. Número de datos (N) Menos de 50 50 a 100 100 a 250 Más de 250 Número de clases (K) 5–7 6 – 10 7 – 12 10 – 20 Página 9 de 20 81.35 80.64 38.71 55.31 24.98 63. mediante histograma se compone de 11 columnas n = 130  11.83 88.81 60.08 45.14 72.69 77.22 54.20 16.75 30.06 44.61 44.87 69.53 62.45 67.46 9.44 32.03 18.29 58.63 31.03 59.29 65.37 45.20 20.08 36.49 17.47 16.10 76.64 43.ESTADÍSTICA DESCRIPTIVA  P. Reyes / Sep.78 62.93 48.08 55.31 48.51 33. En el ejemplo los datos ya han sido previamente ordenados.04 56.10 50.09 47.41 = 94.33 49.21 82.41 40.28 89.73 13. Paso 3: Seleccionar el número de columnas.67 89.14 36.92 37.46 8.10 45.59 12.58 35. La tabla de abajo es una guía que nos muestra para diferentes cantidades de datos el número recomendado de clases a utilizar.19 28.11 17.05 71.02 48.40 51.23 37.98 49.37 columnas: C =  8.76 34.77 74.26 76.02 39.31 85.28 54.12 64.23 55.37.52 45.87 56.18 15.37 71.03 74.56 67.27 61.41 51.21 47.15 11.78 .50 47.04 4.78-2.10 50.69 19.56 47.89 33.37 82.36 30.77 52.37 59.4  11.43 53.93 36.61 59.09 69.87 18.41 3. .ESTADÍSTICA DESCRIPTIVA P. primero se ordenan los dígitos principales a la izquierda de una línea vertical. Paso 6: Contar el número de valores que caen en cada intervalo utilizando una hoja de registro. A la derecha de esta línea se registra el último dígito para cada dato conforme se revisan las observaciones en el orden en que se registraron. considerando que el tamaño del intervalo representa la diferencia entre dos límites de clase adyacentes ya sean inferiores o superiores. [ 9-17]. Diagrama de tallo y hojas Es otra representación de la información. Por ejemplo: Con Minitab: Stat > EDA > Steam and leaf… Indicar columna de datos. 2007 Paso 5: Calcular los limites de clase de cada intervalo: [0-8]. increment = 10 Stem-and-leaf of Respuest Leaf Unit = 1. Columna 1 2 3 4 5 6 7 8 9 10 11 Intervalo 0 -8 9-17 18-26 27-35 36-44 45-53 54-62 63-71 72-80 81-89 90-98 Registro de frecuencias IIIII IIIII IIII IIIII I IIIII IIIII I IIIII IIIII II IIIII IIIII IIIII IIIII IIIII IIIII IIIII IIIII III IIIII IIIII IIIII III IIIII IIIII III IIIII III 5 9 6 11 17 28 18 13 10 8 5 Histograma 30 Frecuencia 25 20 15 Frecuencia 10 5 0 9 18 27 36 45 54 63 72 81 90 99 Clase Paso 7: Basándose en los datos anteriores construya el histograma. de esta manera se obtiene la frecuencia para cada intervalo.0 N = 50 Página 10 de 20 . Tabla 1. etc. Reyes / Sep. 5 84.5 94.  La media con datos agrupados: se calcula así: Xg   fM n Donde f es la frecuencia o número de observaciones en cada clase M es el punto medio de cada clase.0 1014. Página 11 de 20 .5. Reyes / Sep. n es el tamaño de la muestra o la suma de todas las frecuencias de las clases Ejemplo: Clase (Presión) Frecuencia de clase (días) 50-59 60-69 70-79 80-89 90-99 100-109 3 7 18 12 8 2 50 Xg  M fM 54. 2007 89 233566 01123456 12224556788 002466678 2355899 4678 24 1 5.0 756. MEDIDAS DE TENDENCIA CENTRAL Y DE DISPERSIÓN PARA DATOS AGRUPADOS.5 104.ESTADÍSTICA DESCRIPTIVA 2 8 16 (11) 23 14 7 3 1 6 7 8 9 10 11 12 13 14 P.7 50  Mediana de datos agrupados: Primero se identifica la clase donde se encuentra la mediana cuya F es >= n / 2.5 74.5 451.0 209. en este caso la clase de 70 a 79 con punto central de clase = 74.5 64.0 3935.5 163. se determina como el valor medio entre los límites de clase.5 1341.0 Frecuencia acumulada F 3 10 28 40 48 50 3935  78. 25 4160.75 18 74.5 64.75 70-79 99904.5 451.00 90-99 71442.0 8930.5 756. 50 .  Da    18  7 Moda  Lmo   (C )  70   10  76.25 2 104.33 pasajeros  18   f md  Donde: Lmd es el límite inferior de la clase de la mediana cuya F es >= n / 2 o sean (70) F es la frecuencia acumulada de la clase que antecede a la clase de la mediana (10) Fmd es la frecuencia de la clase de la mediana (18) C es el intervalo de clase de la mediana que es la diferencia entre dos límites de clase (10)  Moda de datos agrupados: Primero se halla la clase que tenga la frecuencia más alta.5 1341.5 209.25 3935.0 7140.25 12 84.25 8910. 2007 n / 2  F  ~  50 / 2  10  Mediana  X  Lmd   (C )  70   10  78. Reyes / Sep.47  (18  12)  (18  7)   Db  Da  Donde: Lmo es el límite inferior de la clase modal con la frecuencia más alta (70).50 3 7 54.0 Página 12 de 20 316902.5 163.0 10920.50 80-89 85683.ESTADÍSTICA DESCRIPTIVA P.25 8 94.0 5550.5 2790. en este caso la clase 70 a 79.00 100-109 21840.5 1014. Da es la diferencia entre la frecuencia de la clase modal y la clase que la antecede (18 – 7 = 11) Db es la diferencia entre la frecuencia de la clase modal y la clase que le sigue (18 – 12 = 6) C es el intervalo de la clase modal ( 80 – 70 = 10 )  s2  Varianza y desviación estándar de datos agrupados:  fM s s 2  nX 2 n 1 2 Para los datos anteriores se tiene: Clase (Presión) Frecuencia de clase (días) M fM M2 fM2 50-59 60-69 29121. Establece que para todo conjunto de datos por lo menos (1  Por ejemplo si K =  3 desviaciones estándar respecto a la media.ESTADÍSTICA DESCRIPTIVA P. CASO DE LA DISTRIBUCIÓN NORMAL 68.5% de las observaciones se encuentran dentro de  2 desviaciones estándar de la media 99. 2007 3935  78. se dice que existe un sesgo a la derecha y viceversa.3% de las observaciones se encuentran dentro de  1 desviación estándar de la media 95.14 pasajeros Xg  Con esta información el personal puede tomar sus decisiones 6. se tiene que por lo menos el: (1  1 1  )%  1  2 %  88. USOS FRECUENTES DE LA DESVIACIÓN ESTÁNDAR  EL TEOREMA DE TCHEBYSHEV 1 )% de las observaciones se K2 encuentran dentro de  K desviaciones estándar de la media.7% de las observaciones se encuentran dentro de  3 desviaciones estándar de la media  SESGO En la distribución normal si no es simétrica y tiene una cola más amplia del lado derecho.7) 2 s2   147.89% 2 K  3  De las observaciones estarán dentro de dicho intervalo.50  50(78.31 pasajeros 49 s  12. El coeficiente de sesgo o asimetría P se determina como sigue: Página 13 de 20 .7 50 316902. Reyes / Sep. con K >= 1. 03 Los datos están un poco sesgados hacia la derecha.ESTADÍSTICA DESCRIPTIVA P P.14 Coeficiente de asimetría de Fisher Otra estimación del sesgo o coeficiente de asimetría se hace a través de momentos estadísticos (diferencias contra la media) como lo sugiere Fisher: n Mj  (X i 1 i  X)j n j  1.01 Página 14 de 20 . si P > 0 están sesgados a la derecha. Reyes / Sep. 12.33)  0. 3/ 2 M 23 / 2 1 n    ( Xi  X ) 2   n i 1  Se puede considerar que una distribución es simétrica si  1  0 . 4 1 n ( Xi  X ) 3  n i 1 M3 o 1  Para la distribución normal debe ser 0. 2007 3( X  Mediana ) s Si P < 0 los datos están sesgados a la izquierda. si P = 0 están distribuidos normalmente. Para el caso de los datos del ejemplo anterior se tiene: P 3(78. 2. Sesgo  ˆ1  Por ejemplo: Ejemplo de una distribución con sesgo negativo o sesgada hacia la izquierda con Sesgo = -1.3. asimétrica hacia la izquierda con  1  0 o hacia la derecha  1  0 .7  78. ESTADÍSTICA DESCRIPTIVA P.  2  0 .3 o 2   3 Para la distribución normal debe ser 2 M 22 1 n 2   ( Xi  X )   n i 1  0. si es mayor es más picuda o más plana al revés. Coeficiente de Curtosis de Fisher Kurtosis   2  1 n ( Xi  X ) 4  n i 1 M4 . La distribución es mesocúrtica (plana normal) si Ejemplo de curva más plana que la normal Curtosis = -1.03 Página 15 de 20 más .08  CURTOSIS En la distribución normal si no es acampanada y es más picuda o aplanada de lo normal se dice que tiene una Curtosis diferente de cero que es lo normal. leptocúrtica si  2  0 puntiaguda que la normal o platicúrtica (más plana que la normal ) con  2  0 . 2007 Ejemplo de una distribución con sesgo positivo o sesgada hacia la derecha con Sesgo = 1. Reyes / Sep. 2007 Ejemplo de curva más picuda que la normal Curtosis = 0. Seleccionar los estadísticos específicos que se desean obtener: Página 16 de 20 . USO DE MINITAB y EXCEL Para la obtención de las estadísticas descriptivas con Minitab las instrucciones son:  Stat > Basic statistics > Display descriptive statistics Indicar las variables de las cuales se quieren obtener las estadísticas básicas y la variable categórica si se desean varios grupos. Seleccionar las gráficas opcionales para los datos: Histograma.76 7. Reyes / Sep. diagrama de caja y de puntos.ESTADÍSTICA DESCRIPTIVA P. 32 StDev 49.ESTADÍSTICA DESCRIPTIVA P. 2007 Los resultados son los siguientes: Descriptive Statistics: Peso en gr Variable Peso en gr Línea 1 2 N 250 250 N* 0 0 Variable Peso en gr Línea 1 2 Q3 4040.5 5.0 12.0 4202.0 4121.5 10.8 Median 3999.0 Q1 3967.0 3954.0 17.0 Diagramas de caja en Minitab: 1.5 Minimum 3877.5 20. A continuación se muestra el diagrama de caja: Boxplot of Caja 22.0 Histograma en Minitab: Página 17 de 20 .6 SE Mean 3.0 7.6 52.5 Mean 3999. Seleccione la variable C1 como se muestra en la pantalla y presione clic en ok 4.5 4087.14 3.6 4085. Capture datos en la hoja de trabajo: 7 8 9 9 11 12 12 13 14 15 16 17 18 19 20 22 2. Reyes / Sep.8 4048.5 Caja 15. Seleccione la opción: Graph> Boxplot 3.0 Maximum 4113. 5.1 0 30 60 DATOS 90 USO DE EXCEL Página 18 de 20 120 50. P. 4.399 . Probability Plot of DATOS Normal 99. 3. 2007 Capture los datos del ejemplo 6 en la hoja de trabajo: Seleccione la opción: Graph> Histogram (simple) Seleccione la variable C1 como se muestra en la pantalla y presione clic en ok En Options se puede cambiar el número de celdas con Number of intervals (6 – 8) A continuación se muestra el Histograma: Histogram of DATOS 40 Frequency 30 20 10 0 -10 20 50 DATOS 80 110 Prueba de normalidad en Minitab: 1. si P value > 0. 2. 4.380 0. Reyes / Sep.05 22.05 los datos son normales.50 130 0. 2. 3.ESTADÍSTICA DESCRIPTIVA 1. 5.9 Mean StDev N AD P-Value 99 Percent 95 90 80 70 60 50 40 30 20 10 5 1 0. Capture los datos del ejemplo 6 en la hoja de trabajo: Seleccione la opción: Stat > Basic statistics Seleccione la variable C1 como se muestra en la pantalla y presione clic en ok Seleccione la prueba de Anderson Darling A continuación se muestra la grafica normal. Seleccione Resumen de estadísticas.5049388 506.1 22. En opciones de salida seleccione en Rango de salida. En el menú Herramientas seleccione la opción Análisis de datos. La hoja mostrará las siguientes medidas estadísticas de los datos presentados: Columna1 Media Error típico Mediana Moda Desviación estándar Varianza de la muestra Curtosis Coeficiente de asimetría Rango Mínimo Máximo Suma Cuenta 50. una celda de la hoja de calculo que este en blanco (a partir de está celda serán insertados los resultados).9738137 49. 2007 1.345 50. Reyes / Sep.41 96. Seleccione la opción Estadística descriptiva.ESTADÍSTICA DESCRIPTIVA P.0352296 94.99 130 Página 19 de 20 . 2. 5.4466339 -0. 4.78 6506. Seleccione el rango de entrada.37 2.0537692 1. estos corresponden a los datos numéricos de la tabla.47227 -0. 3. Datos de ejemplo 6. 27 9.92 13.62 11.83 9.35 6.83 9.69 7.29 8.06 16.62 12.47 8.70 12.36 10.90 18.61 8.00 8.70 11.94 5.71 12.62 7.37 9.35 10.04 10.30 10.12 15.07 9.91 12.96 14.In_1 2.56 5.69 8. Reyes / Sep.98 6.19 12.37 8.73 7.MTW): BTU.85 6.82 9.84 9.15 7.60 13.16 12.23 7.49 10.42 13.21 10.16 7.78 6.47 13.76 9. EJERCICIOS: 1. Una muestra de consumidores de 90 hogares con calefacción de gas arrojó lo siguiente (FURNACE.43 9.00 5.28 12.09 11.40 10.62 7.24 14.38 13.94 7. 2007 8.60 9.93 8.12 11. Las empresas de generación de energía eléctrica están interesadas en los hábitos de consumo de los clientes para obtener pronósticos exactos de las demandas de energía.52 9.81 9.20 5.64 10.97 4.26 .50 10.ESTADÍSTICA DESCRIPTIVA P.67 8.43 a) Determinar los estadísticos de tendencia y dispersión b) Construir un diagrama de caja e histograma c) Realizar una prueba de normalidad de los datos d) Establecer conclusiones Página 20 de 20 13.21 11.35 15.58 8.80 6.28 10.72 6.95 11.31 12.28 10.69 12.24 16.26 8.11 13.96 10.29 7.58 9.87 7.62 6.43 11.29 11.54 8.

Comments

Description