Ejercicios Estadistica Descriptiva e Inferencial

May 1, 2018 | Author: Karen Volantin | Category: Confidence Interval, Linear Regression, Estimator, Hypothesis, Standard Deviation


Comments



Description

DATOS AGRUPADOS Y O AGRUPADOSDatos no agrupados Ejercicio 1. (Población) La familia Pérez del Olmo está compuesta por 6 personas, se observó que durante una caminata recorrieron las distancias como a continuación se presentan: 1.18, 1.19, 1.20, 1.25, 1.26 y 1.29 kilómetros en el lapso de una hora. A partir de estos datos, calcula lo siguiente: a) La media. b) La mediana. c) La moda. d) La varianza e) La desviación estándar Ejercicio 2: (Muestra) De un grupo de alumnos de primer semestre se tomó una muestra de 10 de ellos determinando los siguientes pesos en kilogramos (Kg): 62.5, 58.4, 62.5, 70.0, 65.70, 65.5, 68.0, 69.5, 69.5, 65.0, determine lo siguiente: a) La media. b) La mediana c) La moda d) La varianza e) La desviación estándar Datos Agrupados Ejercicio 1: Referido a Población El supervisor de producción de la compañía “Comercializadora de Occidente, S.A.”, ha obtenido una muestra aleatoria del tiempo promedio de traslado de su casa a la fábrica de 50 empleados, los datos que encontró se encuentran representados en la siguiente tabla: Tiempo de traslado Frecuencia De este conjunto de datos, calcule: (min) (f) 33 - 41 6 a) La media. 42 – 50 5 b) La mediana. 51 – 59 7 c) La moda. 60 – 68 11 d) La varianza. 69 – 77 9 e)La desviación estándar. 78 – 86 7 87 – 95 4 96 -104 1 50 PRÁCTICA NO. 1. DISTRIBUCIONES DE FRECUENCIA Y SUS REPRESENTACIONES Practica 1 A continuación se describe el problema: El departamento de producción de Grupo Maya, empresa dedicada a la manufactura de discos compactos realizó un estudio de tiempos y movimientos de los registros de producción. Los siguientes datos corresponden a los niveles de producción que reportaron las 34 máquinas con que cuenta la empresa en el lapso de una hora. Tabla de datos reportados Nivel de Nivel de Nivel de Máquina Máquina Máquina producción producción producción 1 10,6 13 12,2 25 11,8 2 12,5 14 10,8 26 12,7 3 11,1 15 16,5 27 11,4 4 9,2 16 15,0 28 9,3 5 11,5 17 10,3 29 8,6 6 9,9 18 12,4 30 8,5 7 11,9 19 9,1 31 10,1 8 11,6 20 7,8 32 12,4 9 14,9 21 11,3 33 11,1 10 12,5 22 12,3 34 10,2 11 12,5 23 9,7 12 12,3 24 12,0 A partir de estos datos, desarrolla las siguientes acciones: a) Representa los datos en una distribución de frecuencias por clases. b) Determina la media, mediana y moda. c) Determina la varianza y la desviación estándar. d) Construye un histograma, un polígono de frecuencia y la ojiva. e) Elabora un reporte en donde se interprete de manera clara esta información obtenida por el departamento de producción para que la empresa realice la toma decisiones. PRÁCTICA N° 2 OBTENCIÓN DE POSIBILIDADES Problema 1 Seimur (empresa nacional) fabrica videocaseteras y compra un circuito integrado, llamado CR25 a tres proveedores diferentes de los cuales 30% son suministrados por Arkamax (empresa nacional), 20% son suministrados por Sneider (empresa alemana) y 50% por Zebra (empresa coreana). El fabricante de las videocaseteras cuenta con registros de los tres fabricantes y sabe que 3% de los circuitos integrados de Arkamax están defectuosos, 5% de los circuitos integrados de Sneider son defectuosos y 4% de los circuitos de Zebra también son defectuosos. Cuando los circuitos integrados llegan a Seimuir, se colocan directamente en un depósito y no se inspeccionan ni se identifican de acuerdo con el proveedor, un técnico elige uno para instalarlo en una videocasetera y se da cuenta que está defectuoso ¿Qué probabilidad de que el fabricante sea Sneider? Problema 2 Supongamos que existen ocho diferentes países para asignar y que ocho empleados reciban capacitación en un programa de capacitación en un corporativo internacional ¿De cuántas maneras diferentes pueden ser asignados los ocho empleados a los ocho países distintos? Problema 3 Un equipo de expertos en negocios internacionales compuesto por dos licenciados en Negocios Internacionales y tres Licenciados en Comercio Internacional debe formarse a partir de un grupo de cinco Licenciados en Negocios Internacionales y nueve Licenciados en Comercio Internacional ¿Cuántos equipos de expertos diferentes pueden formarse con los catorce candidatos? EJERCICIO 2 DISTRIBUCION NORMAL Problema 1: Una distribución normal tiene una media (µ) de 100 y una desviación estándar de 25. ¿Qué porcentaje de la población de valores se encuentra entre los siguientes intervalos? Realiza una gráfica representativa de cada uno de ellos. a) De 90 a 110 b) De 90 a 100 c) De 70 a 80 d) De 110 a 120 e) De 100 a 110 f) Mayor a 100 g) Menor a 100 h) Mayor a 120 i) Menor a 90 Problema 2: Calcule los valores de z que corresponden a estas probabilidades a) El área entre +z y –z es 0 64. . c) El área a la derecha de z es 0 2500 b) El área entre +z y –z es 0.47 d) El área a la izquierda de z es 0.2500 EJERCICIO 3 DISTRIBUCIÓN MUESTRAL DE MEDIAS Problema 1. Una población consta de los siguientes números 2, 5, 7, 9. Considere todas las muestras posibles de tamaño 2 que pueden obtenerse con reemplazamiento de esta población, se pide calcular: a) La media poblacional b) La desviación estándar poblacional c) La media de la distribución muestral de medias d) La desviación estándar de la distribución muestral de medias. Problema 2. Una población consta de los siguientes números 2, 5, 7, 9. Considere todas las muestras posibles de tamaño 2 que pueden obtenerse sin reemplazamiento de esta población, se pide calcular: a) La media poblacional b) La desviación estándar poblacional c) La media de la distribución muestral de medias d) La desviación estándar de la distribución muestral de medias. Distribución muestral de proporciones Problema 3 Calcule la probabilidad de que los próximos 200 bebés que nazcan. a) Menos del 40% sean niños b) Entre 43% y 57% sean niñas c) Más del 54% sean niños Considere que la probabilidad para el nacimiento de niños y niñas es del 50% en ambos casos. PRÁCTICA N° 3 DISTRIBUCIÓN DE PROBAILIDADES Problema 1: Una distribución normal tiene una media (µ) de 50 y una desviación estándar de 5. ¿Qué porcentaje de la población de valores se encuentra entre los siguientes intervalos? Realiza una gráfica representativa de cada uno de ellos. j) De 40 a 50 k) De 49 a 50 l) De 40 a 45 m) De 56 a 60 n) De 40 a 65 o) De 45 a 55 p) Mayor a 50 q) Menor a 50 Problema 2: Calcula los valores de z que corresponden a estas probabilidades: e) El área entre +z y –z es 0.5000 f) El área entre +z y –z es 0.8400 g) El área a la derecha de z es 0.3500 h) El área a la izquierda de z es 0.3500 Problema 3 El director que autoriza las franquicias en Petróleos Mexicanos (PEMEX) tiene un informe de que en la actualidad cuentan con 4000 estaciones de servicio en toda la República Mexicana; con base en esta información solicita al Director de Operaciones realice una encuesta para verificar que las estaciones afiliadas cumplan con el programa de mantenimiento continuo. La información con la que se cuenta se muestra en la siguiente tabla que incluye una clasificación por categoría y región a la que pertenecen: Región Categoría 1 2 3 4 Total 5 Estrellas 700 520 500 480 2,200 4 Estrellas 560 460 400 380 1800 Total 1260 980 900 860 4000 El Director de Operaciones desea obtener una muestra probabilística de n=200 estaciones de servicio para verificar el cumplimiento del programa de mantenimiento y generalizar sus resultados. a) Si el Director de Operaciones cuenta con un listado de las 4000 estaciones de servicio ¿Qué tipo de muestra se podría obtener? b) ¿Cuál sería la ventaja de obtener una muestra aleatoria simple? c) ¿Se podrá utilizar una muestra estratificada para seleccionar la muestra? d) ¿Se podrá utilizar una muestra por conglomerados para seleccionar la muestra? e) Justifica y proporciona argumentos para cada una de tus respuestas. ESTIMACIÓN DE PARÁMETROS Si tenemos la siguiente información del precio de los combustibles Precio Máximo de Mes Gasolina Magna Enero $15.99 Febrero $15.99 Abril $16.50 Mayo $16.42 Junio $16.22 Julio $16.25 Agosto $16.43 Septiembre $16.63 Octubre $16.71 Noviembre $16.76 a) Desarrolla una estimación puntual para la media y desviación estándar. b) Una estimación por intervalo del 95%. c) Si deseamos desarrollar un estudio. ¿De qué tamaño será la muestra? Si se desea: Un nivel de confianza del 96%. Error máximo permisible de $0.5 Con una desviación estándar de $0.70. PRACTICA N° 4 ESTIMACIONES DE PARÁMETROS DE UNA POBLACIÓN Planteamiento: Con referencia a una población compuesta por el número de transacciones comerciales hechas entre México y Japón en el año 2009, un corporativo requiere determinar un estimador que le permita decidir si es conveniente invertir en el año 2011 en ambos países. El corporativo internacional usa como datos de referencia: una desviación estándar de $20.00, una muestra de 100 transacciones y una media muestral de $220.00. a) Encuentre el error estándar de la media. b) Establezca el mejor estimador puntual para la media y para la desviación estándar. c) Determine un intervalo de confianza que incluya la media de la población para los siguientes niveles de confianza 99% d) Determine un intervalo de confianza que incluya la media de la población para los siguientes niveles de confianza 95% e) Determine un intervalo de confianza que incluya la media de la población para los siguientes niveles de confianza 90% f) Determine un intervalo de confianza que incluya la media de la población para los siguientes niveles de confianza 85% g) Explique si el corporativo debe invertir en ambos países de acuerdo con los resultados obtenidos del estimador y cuál es el intervalo de confianza más conveniente a utilizar. PRACTICA 5 CONTRASTE DE HIPOTESIS Problema 1. General Electric, S.A. fabrica circuitos integrados, después de realizar estudios de la población, se determina que estos tienen una duración que se distribuye de forma aproximadamente normal con una media de 800 horas y una desviación estándar de 40 horas. Si una muestra aleatoria de 30 circuitos eléctricos, tiene una duración promedio de 788 horas. ¿Estos datos muestran evidencia suficiente para aseverar que la duración media ha cambiado? Utiliza un nivel de significancia del 0.04 Para resolver este planteamiento se requiere que también: a) Establezcas la hipótesis nula y alternativa. b) Establezcas la regla de decisión. c) Calcules el valor estadístico de prueba d) ¿Cuál es tu decisión con respecto a la hipótesis nula? Explica y proporciona argumentos. Problema 2 Un fabricante de semiconductores produce controladores que se emplean en aplicaciones de motores automovilísticos. El cliente requiere que la fracción de controladores defectuosos en uno de los pasos de manufactura críticos no sea mayor que 0.05, y que el fabricante demuestre esta característica del proceso de fabricación con este nivel de calidad, utilizando 𝛼 = 0.05. El fabricante de semiconductores toma una muestra aleatoria de 200 dispositivos y encuentra que cuatro de ellos son defectuosos. Con base en esta información ¿El fabricante puede demostrar al cliente la calidad del proceso? Para resolver este planteamiento se requiere que también: a) Establezcas la hipótesis nula y alternativa. b) Establezcas la regla de decisión. c) Calcules el valor estadístico de prueba d) ¿Cuál es tu decisión con respecto a la hipótesis nula? Explica y proporciona argumentos. ANALISIS DE REGRESION Y CORRELACION LINEAL Problema 1 Para los siguientes datos tomados de una muestra. X 4 8 9 5 6 2 6 5 8 13 8 3 8 4 8 Y 7 5 5 9 7 9 7 0 2 5 9 7 1 9 4 Determina: a) Elabora el diagrama de dispersión b) La ecuación de regresión lineal. c) El coeficiente de correlación y de determinación d) Utilizando la ecuación de regresión lineal, estima para un valor de la variable x= 12, el valor de la variable “y” e) Utilizando la ecuación de regresión lineal, estime para un valor de la variable “y=3” el valor de la variable “x”. Problema 2 Para los siguientes datos tomados de una muestra. X 2 5 9 10 12 Y 1 3 5 7 9 Determina: a) Elabora el diagrama de dispersión b) La ecuación de regresión lineal. c) El coeficiente de correlación y de determinación d) Utilizando la ecuación de regresión lineal, estima para un valor de la variable x= 8, el valor de la variable “y” e) Utilizando la ecuación de regresión lineal, estime para un valor de la variable “y=8” el valor de la variable “x”. Problema 3 En la industria Mexicana, se crean partes de motor, el tamaño del lote de los motores depende de la demanda No. de lotes Tamaño del lote (X) Horas hombre (Y) 1 30 73 Determina: 2 20 50 3 60 128 a) La gráfica de dispersión 4 80 170 b) La ecuación de regresión lineal. 5 40 87 6 50 108 c) El coeficiente de correlación y 7 60 135 determinación. 8 30 69 9 70 148 10 60 132 PRACTICA 6 COMPARACION DE VARIABLES Problema 1 Un hotel de la Ciudad de México de nivel internacional, obtiene su ingreso bruto de la renta de sus instalaciones y de su restaurante. Los propietarios del hotel desean saber el grado de dependencia que existe entre el consumo del restaurante y la ocupación habitacional del hotel. La siguiente tabla presenta una muestra de 10 días donde se registró el ingreso y las habitaciones ocupadas por día. Día Habitaciones Ingresos (y) Ocupadas (x) 1 27 $1,545 2 20 $2,150 3 30 $4,850 4 31 $5,275 5 25 $2,240 6 19 $1,000 7 24 $2,150 8 31 $2,270 9 35 $10,295 10 26 $2,460 Con base en esta información: f) Grafica el diagrama de dispersión y traza la línea de regresión lineal en el mismo. g) Determina la ecuación de regresión lineal h) Utilizando la ecuación de regresión lineal, estima el número de habitaciones que se deberían ocupar para tener un ingreso de $6,000 i) Utilizando la ecuación de regresión lineal, estima el ingreso que se obtendrá cuando la ocupación de habitaciones sea de 22. j) Calcula el error estándar del estimador k) Calcula el coeficiente de determinación l) Calcula la variación total Problema 2 El director de operaciones de una gran cadena de supermercados que opera en Latinoamérica, desea saber cuál es la relación entre la cantidad gastada en alimentos por mes y el ingreso mensual de sus clientes. De manera muy específica desea conocer si a mayor ingreso hay un mayor consumo en alimentos. Dispones de la información que se representa en la siguiente tabla: Familia Ingresos en cientos de Consumo (Y) unidades monetarias(X) 1 100 730 2 150 50 3 850 500 4 75 170 5 40 87 6 1000 600 7 150 135 8 70 69 9 95 30 10 60 60 Con base en esta información: a) Determina la ecuación de regresión lineal. b) Utilizando la ecuación de regresión lineal, estima para un valor de la variable x= 50 el valor de la variable “y” c) Utilizando la ecuación de regresión lineal, estima para un valor de la variable “y=40”, un valor de la variable “x”. d) Responde al planteamiento expresado por el director de operaciones sobre la relación de las variables Problema 3 El profesor de Estadística Descriptiva e Inferencial de la Licenciatura de Negocios Internacionales, desea establecer la relación que existe entre el número de horas que sus alumnos estudian previo a un examen y las calificaciones obtenidas en este. Estudiante Horas de estudio (X) Puntos de calificación (Y) 1 2 7 2 1 3 3 3 8 4 4 10 Con base en esta información: a) Determina la ecuación de regresión lineal. b) Utilizando la ecuación de regresión lineal, estima para un valor de la variable x= 10 horas de estudio, un valor de la variable “y” puntos de calificación. c) Utilizando la ecuación de regresión lineal, estima para un valor de la variable “y=20” de calificación, un valor de la variable “x” horas que se estudiaron. ACTIVIDAD DE RECUPERACION 1 DATOS AGRUPADOS Planteamiento El área de Recursos Humanos y Finanzas de un gran corporativo internacional, está valorando la posibilidad de retabular los sueldos de sus gerentes corporativos en América Latina, recaba información de la nómina que perciben 380 de sus gerentes en Centro América y el Caribe. El fin es establecer si hay homogeneidad entre ellos, y decidir si se realiza la retabulación. La información disponible es la siguiente: Salario y número de gerentes Salario anual Número de gerentes (pesos) 0 a 300,000 10 300,000 a 600,000 20 600,000 a 900,000 35 900,000 a 1,200,000 40 1,200,000 a 1,500,000 45 1,500,000 a 1,800,000 80 1,800,000 a 2,100,000 75 2,100,000 a 2,400,000 60 2,400,000 a 2,700,000 10 2,700,000 a 3,000,000 5 Total 380 Actividad 1. Medidas de tendencia central, variabilidad y representación gráfica. (10%) Con base en la información de salarios y número de gerentes disponible, determina: a) La media, la mediana, la moda. b) La varianza y la desviación estándar. c) El coeficiente de sesgo y de asimetría. d) Construye un polígono de frecuencia, el histograma y la ojiva. Actividad 2. Intervalos de confianza y prueba de hipótesis (10%) Del mismo conjunto de datos referidos a salarios y gerentes del corporativo en América Latina, determina: a) El porcentaje de gerentes que tienen un sueldo inferior a $ 600,000 b) El porcentaje de gerentes que tienen un sueldo mayor a $ 1,200,000 c) El porcentaje de gerentes que tienen un sueldo entre $ 900,000 y $ 1,500,00 d) Estima entre que valores se encuentra la media poblacional usando un intervalo de confianza del 95%. Actividad 3. Regresión lineal y correlación (10%) Considerando los mismos datos de salarios y gerentes de América Latina, desarrolla: a) La ecuación de la recta de regresión lineal y el coeficiente de correlación. ACTIVIDAD DE RECUPERACION 2 DATOS NO AGRUPADOS Planteamiento A fin de conocer el tipo de clientes, perfil y las preferencias de consumo de productos de alta tecnología de importación, se recabaron los siguientes datos, éstos representan la edad de 40 personas y se obtuvieron como resultado de la aplicación de una encuesta en un importante centro comercial. 17, 12, 14, 18, 13, 10, 11, 35, 13, 21, 12, 23, 25, 31, 17, 34, 28, 38, 27, 19, 48, 31, 37, 17, 44, 27, 31, 47, 53, 47 13, 15, 16, 27, 30, 41, 42, 28, 29, 41 Actividad 1. Medidas de tendencia central, variabilidad y representación gráfica. (10%) Del conjunto de edades que se encontraron en las encuestas aplicadas, determina: a) La media, la mediana, la moda. b) La varianza y la desviación estándar. c) El coeficiente de sesgo y de asimetría. d) Construye un polígono de frecuencia, un histograma y la ojiva. Actividad 2. Intervalos de confianza y prueba de hipótesis (10%) Del mismo conjunto de datos de edades, determina: a) El porcentaje de personas que tienen una edad inferior a 20 años b) El porcentaje de personas que tienen una edad superior a 40 años c) El porcentaje de personas que tienen una edad entre 18 y 35 años d) Estima entre que valores se encuentra la media poblacional usando un intervalo de confianza del 95%. Actividad 3. Regresión lineal y correlación (10%) Con base en la información disponible sobre las edades, determina: a) La ecuación de la recta de regresión lineal y el coeficiente de correlación.
Copyright © 2024 DOKUMEN.SITE Inc.