MÓDULO DE ESTADÍSTICA BÁSICA YPROBABILIDADES JUAN ARTEAGA CRAWFORD LICENCIADO EN MATEMÁTICAS Y FÍSICA, UNIVERSIDAD DE CÓRDOBA INGENIERO MECÁNICO, UIS. CONTENIDO PRÓLOGO UNIDAD I CONCEPTOS GENERALES. 1. 2. 3. 4. 5. 6. 7. INTRODUCCIÓN. DEFINICIÓN DE ESTADÍSTICA. IMPORTANCIA DEL ESTUDIO DE LA ESTADÍSTICA. TIPOS DE ESTADÍSTICA. Estadística descriptiva. 4.1. 4.2. Estadística Inferencial. 4.3. Población. 4.4. Muestra. TIPOS DE VARIABLES. 5.1. Variable Cualitativa. 5.2. Variable Cuantitativa. 5.2.1. Variable cuantitativa discreta 5.2.2. Variable cuantitativa continua DATOS ESTADÍSTICOS. 6.1. Datos de nivel nominal Datos de nivel ordinal. 6.2. 6.3. Datos de nivel de intervalo 6.4. Datos de nivel de razón. EJERCICIOS DE LA UNIDAD. UNIDAD II ESTADÍSTICA DESCRIPTIVA. 1. 2. 3. 4. 5. INTRODUCCIÓN DISTRIBUCIONES DE FRECUENCIA. 2.1. Definición. 2.2. Elaboración. 2.3. Propiedades de las distribuciones de frecuencia. REPRESENTACIONES TALLO Y HOJA. REPRESENTACIONES GRÁFICAS DE UNA DISTRIBUCIÓN DE FRECUENCIAS. 4.1. Histograma. 4.2. Polígono de frecuencias. 4.3. Distribuciones de frecuencias acumuladas 4.4. Diagramas circulares. EJERCICIOS DE LA UNIDAD. UNIDAD III MEDIDAS DE TENDENCIA CENTRAL Y MEDIDAS DE DISPERSIÓN. 1. 2. 3. 4. 5. 6. 7. 8. 9. INTRODUCCIÓN. MEDIA ARITMÉTICA. 2.1. Media poblacional. 2.2. Media muestral. 2.3. Propiedades de la media aritmética MEDIA PONDERADA. MEDIANA. 4.1. Propiedades de la mediana. MODA. MEDIA GEOMÉTRICA. 6.1. Aumento porcentual promedio en un período determinado. MEDIDAS DE TENDENCIA CENTRAL PARA DATOS AGRUPADOS. 7.1. Media. Mediana. 7.2. 7.3. Moda. MEDIDAS DE DISPERSIÓN. Amplitud o intervalo de variación. 8.1. 8.2. Desviación media 8.3. Varianza 8.4. Desviación estándar. 8.5. Medidas de dispersión para datos agrupados. 8.5.1. Amplitud de variación. 8.5.2. Desviación estándar. 8.6. Deciles, cuartiles y centiles. 8.7. Interpretación y usos de la desviación estándar. 8.7.1. Teorema de Chebyshev. 8.7.2. Regla empírica. 8.8. Dispersión relativa. EJERCICIOS DE LA UNIDAD. UNIDAD IV. PROBABILIDADES. 1. 2. 3. INTRODUCCIÓN. DEFINICIONES PREVIAS. 2.1. Experimento. 2.2. Evento. 2.2.1. Eventos mutuamente excluyentes 2.3. Espacio muestral. DEFINICIÓN DE PROBABILIDAD DE UN EVENTO. 2.1. 7. varianza y desviación estándar de una distribución de probabilidades discreta. 8. REGLAS DE PROBABILIDAD. 4.1.3. 4. Media de una distribución de probabilidad binomial. 5. 5. 4. Media. Probabilidad objetiva 4. Regla de la Multiplicación 5. 5. 6. Media de una distribución de probabilidad de Poisson. REGLA DE LA PROBABILIDAD TOTAL. 4. 5. VARIABLE ALEATORIA.1.3. 4.4. 9.1. PRINCIPIOS DE CONTEO. 4. Desviación estándar de una distribución de probabilidad de Poisson.4.1.1.2.3. 10. La distribución de Poisson 4.1. Regla del complemento DIAGRAMAS DE ÁRBOL. 3. 4.2. Principio multiplicativo de conteo. Función de distribución acumulativa 4. Permutaciones. varianza y desviación estándar de una distribución de probabilidades continua . TEOREMA DE BAYES. Regla de la adición.1. 4.3.4. 9. DEFINICIÓN. Probabilidad Clásica. Función de distribución acumulativa 5.2. Desviación estándar de una distribución de probabilidad binomial. 9.3.2. 4. 9.1.3. PUNTOS DE VISTA DE LA PROBABILIDAD. Uso de tablas en la distribución binomial. La distribución binomial. 5.1. Uso de tablas en la distribución de Poisson DISTRIBUCIÓN DE PROBABILIDAD CONTINUA. Media. DISTRIBUCIONES DE PROBABILIDAD.3. Probabilidad empírica. 4. 4. 1.2. INTRODUCCIÓN.3.4.2.4. Combinaciones. 4.4. 9. UNIDAD V.2. Principio aditivo de conteo. EJERCICIOS DE LA UNIDAD. 2. Probabilidad subjetiva. DISTRIBUCIÓN DE PROBABILIDAD DISCRETA. 2. 5. TABLAS 5. .3. EJERCICIOS DE LA UNIDAD. Cálculo de probabilidades. Distribución normal estándar 5. 5.3.1.3. 6.La distribución normal. Uso de la tabla de la distribución normal estándar.3.3. Por último. descuidando el enorme poder que hay en ella principalmente si se adapta a situaciones cotidianas y si se interpretan y analizan casos. de Poisson y normal estándar para que el estudiante disponga de ellas al momento de resolver problemas. Este módulo no es un tratado de la estadística. pero si muestra el sendero para que el estudiante con las ideas básicas profundice en libros un poco más detallados. . especialmente desde la estadística inferencial. hojas de cálculo como Excel. El contenido está dirigido principalmente a los estudiantes del programa de educación a distancia de la Universitaria de Investigación y Desarrollo UDI y su principal objeto es aproximar el conocimiento de la estadística al conjunto de todos ellos. Los temas que se explican se muestran de una manera concisa. Muchos de los cálculos que se hacen a mano se pueden facilitar si se conocen las funciones de las calculadoras científicas digitales o si se manejan. Para cualquier comentario.PRÓLOGO Este módulo es el fruto de mi travesía por la estadística. La redacción de este módulo se da en un lenguaje propio y es el mismo que utilizo en el aula de clases. Al final del módulo se anexan tablas de distribuciones binomiales. agradezco a la Universitaria de Investigación y Desarrollo permitirme producir este módulo. Juan Arteaga Crawford Bucaramanga. La experiencia propia en cursos de estadística muestra que la mayoría de los estudiantes ven a esta materia como un proceso de aplicación de fórmulas sin sentido y que sólo sirve de relleno. un tanto reiterativa cuidándome de no rayar en la redundancia. opinión o sugerencia le agradeceré enviarlo al correo juacrar@yahoo. por ello invito al docente de la materia a que incentive en los estudiantes la utilización de estas herramientas. por tanto se espera que lo que aquí se escriba se contraponga con las ideas de textos de estadística y en lo posible se complemente.com. en lo más mínimo. Junio de 2005. De acuerdo a lo que diga nuestro sentido del tacto decidiremos si tomamos o no el agua. si queremos tomar agua fría. Cuando se hace todo lo anterior. 1. Distinguir entre variable discreta y variable continua. • • • • • • Definir el concepto de estadística. ¿cuánto?. OBJETIVO GENERAL. OBJETIVOS ESPECÍFICOS. Diferenciar entre todos los niveles de los datos estadísticos. Explicar cuando una variable es cualitativa y cuando es cuantitativa. se contribuye a que en futuras experiencias se actúe de manera más eficiente. Es en este momento cuando toma gran importancia el concepto de tratamiento y manipulación de datos. cualificar y cuantificar todo lo que le rodea bien sea en forma técnica o inconsciente. vamos a la nevera. Explicar la diferencia entre la estadística descriptiva y la estadística inferencial.UNIDAD I. Comprender el concepto de estadística y la importancia de su estudio. el gobierno. es por ello que se deben acudir a muestras para tomar decisiones. medir. Por ejemplo. Al entender esto. ¿qué tan lejos?. que es fundamentalmente de lo que trata la estadística. Diferenciar claramente los conceptos de población y muestra. para después responder preguntas tales como: ¿cuándo?. CONCEPTOS GENERALES. los seres humanos y hasta los animales enfrentan situaciones similares. Es de apreciar que en el ejemplo se está tomando una decisión basado en una muestra. ¿qué tan grande?. En muchos momentos de nuestras vidas necesitamos tomar decisiones. todas ellas referentes a las experiencias vividas. ¿qué tan rápido?. sacamos el agua y palpamos el recipiente que la contiene. ¿con qué regularidad?. Las empresas. ¿con qué calidad?. el hombre se ha encaminado a contar. para hacerlo dirigimos los sentidos necesarios a fin de recolectar información. . INTRODUCCIÓN. métodos y técnicas especializadas para recolectar. necesarios. si esta fuera necesaria. no efectúan una análisis estadístico. para comprender perfectamente dichos análisis. Es la ciencia que utiliza una serie de teorías. describir. analizar e interpretar datos con el objeto de extraer de ellos conclusiones útiles para ayudar decisiones efectivas. la mayoría de las personas que toman decisiones. pues esta operación le corresponde a personas especializadas en la estadística. para aportar una mejor comprensión respecto a la forma en que ellas afectan. Resumir toda la información de manera eficiente.2. tabular. Se puede. La necesidad de tales conocimientos no se limita a la persona que en últimas decide. Generalmente los estudiantes al iniciar sus estudios en esta materia se preguntan ¿por qué debo estudiar estadística?. Se hace necesario conocer por qué se toman ciertas decisiones. IMPORTANCIA DEL ESTUDIO DE LA ESTADÍSTICA. La respuesta más simple es que en todas las áreas de desempeño profesional hay que tomar decisiones. ordenar. . DEFINICIÓN DE ESTADÍSTICA. Todos deben estar al tanto de las técnicas actuales de esta ciencia. Analizar la información disponible. entonces. Las técnicas estadísticas se utilizan para tomar decisiones que influyen en la vida cotidiana. pero hay que tener un nivel mínimo de conocimientos estadísticos. 3. Para poder tomar una decisión es necesario: • • • • • Determinar si la información con la que se cuenta es la adecuada o si se necesita más. Sacar conclusiones y realizar inferencias y estar evaluando para saber si se llega a una conclusión incorrecta. Tener la capacidad para reunir la información adicional. organizar. identificar tres razones por las cuales se debe estudiar estadística: • • • En todos los campos del conocimiento y desempeño profesional se encuentra información numérica. En realidad. en una empresa por ejemplo. presentar gráficamente. 2. objetos o medidas que poseen características comunes y que son de interés para su estudio. Es el conjunto de todos los posibles individuos. presentación. marcaran y contaran todos los peces sierra que hay en el mar caribe colombiano. Comprende primordialmente la recolección. recopilación.2. se toma una muestra en lugar de toda la población están: • Por razones económicas. 4. estos se dejan caer desde cierta altura de tal manera que al golpear contra el suelo sufren avería. Los libros de la biblioteca. Estadística Inferencial. en muchas ocasiones. ordenamiento. Es una porción o parte de la población de interés. Ejemplos de población pueden ser: Los estudiantes que estudian en la UDI. Por ejemplo si se desea cuál es la predilección de la ciudadanía sobre cierto candidato a la presidencia. es por eso que se toma una muestra representativa de la población. organización.2. No se puede tomar toda la población de codos porque eso implica un gasto total de la producción y por ende la no venta de ellos. Dentro de las razones por las cuales. • Por imposibilidad de tomar toda la población. Generalmente las pruebas de control de calidad son destructivas. • Por la necesidad de hacer pruebas destructivas. por tanto una . Las estaturas de todos los jugadores de la selección colombiana de fútbol. El estudio de la estadística se divide en dos ramas: Estadística descriptiva y Estadística inferencial. cuando se quiere medir la resistencia al impacto de los codos de PVC. tratamiento matemático. Lo que se hace en este tipo de estadística es suministrar una información de manera detallada. Sería imposible que unos biólogos marinos capturaran. 4. y análisis de datos con el objeto de presentarlos de manera informativa. 4. Población. sería muy costoso indagar a los 45 millones de habitantes que hay en el país. TIPOS DE ESTADÍSTICA. tabulación. de tal manera que lo que se quiere describir sea de fácil interpretación y análisis. Estadística descriptiva.1. 4.1. También conocida como inferencia estadística o estadística inductiva. Muestra. Para comprender mejor el objeto de estudio de esta rama es necesario definir los conceptos de población y muestra. por ejemplo.4.2. Por ejemplo. Es aquella que puede asumir ciertos valores que están separados.2. para poder aplicar los diversos métodos estadísticos y someterlos a análisis. Existen dos tipos básicos de variables: variable cualitativa y variable cuantitativa. 5.1. la clase de empaque. 5. se deben convertir a valores numéricos. Variable cuantitativa discreta. entre otras. . las profesiones elegidas. entrevistar a todas las personas de una población. la cantidad de estudiantes de un salón de clases. Hay precios de productos que varían muy poco de un supermercado a otro. Variable Cualitativa. En ocasiones no se dispone de todo el tiempo para. el número de hijos de una familia. esta última puede ser. la religión. A los datos correspondientes a variables cualitativas. Cuando la variable en estudio es no numérica. por ejemplo. el color de los ojos. • Lo adecuado de los resultados de la muestra. la edad. por ejemplo. Esta consiste en el conjunto de métodos utilizados para el análisis e interpretación de una muestra de datos para saber algo acerca de una población. por ejemplo. el lugar de nacimiento. Si una característica sobre la cual se concentra el interés puede tomar distintos resultados o valores o tiene diferentes resultados se le llama variable.2.muestra de estos peces ayudaría a inferir sobre cualquier estudio que se haga de esta población. entonces sería innecesario comparar todos los supermercados del país para conocer el índice de variación de precios. • Por el tiempo disponible para el estudio de una población. TIPOS DE VARIABLES.1. 5. Al tomar una muestra se reduce el tiempo de recolección de datos. Si los posibles resultados de una variable pueden expresarse numéricamente. la preferencia de una marca. En este punto ya se puede definir estadística inferencial. el género sexual. los kilómetros recorridos por un auto. 5. a su vez. el saldo de una cuenta. continua o discreta. Con una muestra sería suficiente. las paradas de un autobús. el peso de los estudiantes. Variable Cuantitativa. la cantidad de autos que pasan por una esquina. Hay que ver que una familia puede tener 0. 5.5 hijos ni 3. La clasificación de los tipos de variables se muestra en forma resumida en la figura 2. Es de notar que. Figura 2. la temperatura de un cuerpo. 501. Es decir no hay saltos entre un valor de la presión y su siguiente. su variación es continua. 500. la velocidad de un proyectil. … hijos pero nunca 2. 4. la presión en una llanta que se desinfla puede tomar valores de 500 psi y 450 psi. 3. Diagrama esquemático de las variables discreta y continua.00001.00000001 psi. Variable cuantitativa continua. En la figura 1 se representa esquemáticamente los conceptos de variable discreta y continua. que es lo que caracteriza a una variable de tipo discreta.2. el tiempo de viaje de una ciudad a otra. por ejemplo.2345 hijos. Es decir entre el número 3 de hijos y el número 4 de hijos hay un salto o espacio. Diagrama resumen de los tipos de variables estadísticas. Figura 1. Por ejemplo.01. 500. 500. pero también puede tomar los valores de 510. la presión del aire dentro de una llanta que se desinfla. Es aquella que puede tomar cualquier valor dentro de un intervalo determinado. .2. 2. 1. 000. azul. negro y verde. En esta clase de datos. se tienen 4 lapiceros de distintos colores de tinta: rojo. Son datos que se diferencian jerárquicamente aunque no es posible hacer diferencia en magnitud entre ellos. es decir si se quiere hacer una organización de ellos. el punto 0 tiene el significado de ausencia de la propiedad que se mide y la razón (o cociente) entre dos valores es significativa. es decir. si se pide que se califique el desempeño del profesor de estadística. supongamos que la temperatura en un día en Bucaramanga es de 20 °C. bueno es mejor que regular y regular es mejor que malo. tampoco que la “magnitud” entre bueno y regular es la misma entre bueno y excelente. primero se puede reportar el verde. o en cualquier otro orden. Por ejemplo. Datos de nivel ordinal. Por ejemplo. 6.4. Bueno o Excelente. Los datos pueden ser de cuatro niveles: datos de nivel nominal.3. Sólo es nombramiento de los datos más no hay categorización entre ellos.2. el cociente . No existe escala entre ellos. Estos son datos de nivel de intervalo. Por ejemplo. 6. Los datos pueden clasificarse de acuerdo a los niveles de medición. Se pueden clasificar los lapiceros según su color y no hay un orden entre ellos. significa que es el comienzo de una escala. datos de nivel ordinal. es sólo una valor en una escala determinada. 6. 6. Este es el nivel más alto. Por ejemplo. en este caso la escala Celsius. Son datos que se diferencian en escala y la diferencia entre sus valores tiene una magnitud con un significado. 26 °C y 29 °C. el salario de una persona que trabaja en un banco es de $800. 23 °C. Regular. DATOS ESTADÍSTICOS. los resultados pueden ser: Malo. Son los datos que sólo se pueden contar o clasificar. el cero no representa la ausencia de la propiedad que se mide. existe jerarquía entre los datos. luego el rojo y por último el negro. Datos de nivel de razón. datos de nivel de intervalo y datos de nivel de razón o cociente. la diferencia de temperaturas. pero lo que si no se puede decir es que 2 buenos equivale a 1 excelente.6. Los datos están organizados en escala. El valor de temperatura de 0 °C no significa que no haya temperatura. Se nota que Excelente es mejor que bueno.1. pues la magnitud entre el valor 26 °C y el valor 20 °C tiene un significado. El nivel de medición de un dato determina los cálculos que se pueden realizar para resumir y presentar la información.000 y el de un comerciante es 1’200. Datos de nivel de intervalo. luego el azul. Datos de nivel nominal. 000 = 1. Marcas de cerveza. superior). . significa que no se tiene salario.1'200. Diagrama resumen de los niveles de los datos estadísticos.1. Nivel educativo (primario secundario. EJERCICIOS DE LA UNIDAD.000 1. La clase social (baja. 7.5 veces más que el empleado de bancos. La temperatura de un enfermo en grados Celsius. derecha o centro). Número de empleados de una empresa. entre ellos es de La figura 3 muestra un resumen de los tipos de datos que existen. Años de estudios completados. Clasifique la siguientes variables: • • • • • • • • • • • • Preferencias políticas (izquierda. Figura 3. Note que tener un salario de $0. Tipo de enseñanza (privada o pública). Signo del zodiaco. media o alta). Velocidad en Km/h. La presión de un neumático en Pa 7. El peso en Kg. 7.5 . lo que significa que el comerciante gana 800.2. Clasifique las variables que aparecen en el siguiente cuestionario. 3. 7. Juan tiene 30 dientes. Explique con sus propias palabras la diferencia entre continuo y discreto. ¿De qué trata la estadística descriptiva? 7.12. ¿De qué trata la estadística inferencial? 7. 7.10.9.6. ¿en qué clase de estadística se apoyaría? Explique. 7.8.7. María terminó el bachillerato. María tiene 65 pulsaciones por minuto. 7. ¿Por qué es importante estudiar estadística? .5. Clasifique los datos: • • • • Juan es mecánico. ¿Por qué a veces es necesario tomar muestras en vez de toda la población? 7. Defina en sus propias palabras el concepto de estadística. Si usted quisiera entrar en el mercado con un nuevo producto y quisiera conocer la opinión de la gente acerca de su producto.11. 7.4. Dé un ejemplo de variable cualitativa. Dé un ejemplo de variable cuantitativa continua y uno de variable cuantitativa discreta.• • • • • ¿Cuál es su edad? ¿Cuál es su estado civil? ¿Cuanto tiempo emplea para desplazarse a su trabajo? ¿Cuántos habitantes tiene su municipio de residencia? ¿Está afiliado a la seguridad social? 7. Suponga ahora que quisiera tomar una decisión acerca del mercadeo ¿se apoyaría en el mismo tipo de estadística? ¿por qué? 7. Es un método de clasificación y agrupamiento de datos estadísticos en clases o intervalos. OBJETIVOS ESPECÍFICOS. Elaborar e interpretar una representación de tallo y hoja. Organizar datos en una distribución de frecuencias.1 Definición.3076 es la frecuencia relativa de la primera clase. Aprender a utilizar los métodos más comunes para la organización y presentación de datos que serán la base para un análisis posterior de resultados. Las clases son los intervalos de estatura. la tabla 1 muestra una distribución de frecuencias de las estaturas de una población de jóvenes. de tal manera que se pueda establecer el número o porcentaje de cada clase y así manipularlos en grandes cantidades. 1. tablas y distribuciones de frecuencia. diagramas. 2. Muchas veces se dispone de una cantidad muy grande de datos que para poder analizarlos se hace necesario organizarlos. 2. así 200/650=0. Presentar una distribución de frecuencias en un histograma. diagramas y tablas que sean de fácil entendimiento y manejo. El número o porcentaje de cada clase se le conoce como frecuencia de clase. . En esta unidad se verá las técnicas para construir estas formas de presentación. Por ejemplo. Utilizar adecuadamente gráficas de barras.UNIDAD II ESTADÍSTICA DESCRIPTIVA. DISTRIBUCIONES DE FRECUENCIA. Loas frecuencias relativas se calculan respecto al número total. • • • • • Analizar la conveniencia que tiene un investigador de organizar y presentar datos en cuadros . líneas y círculos. OBJETIVO GENERAL. un polígono de frecuencias y un polígono de frecuencia acumuladas. Tal análisis puede consistir en saber dónde se agrupan la mayor cantidad de dichos datos o cómo varían para poder detectar cualquier tendencia. La organización de datos puede hacerse mediante gráficas. INTRODUCCIÓN. 28 18 26 24 16 18 14 18 13 21 25 17 22 17 20 17 18 19 15 18 12 22 13 19 16 29 15 21 27 27 14 19 31 21 15 18 25 22 18 27 12 19 14 21 20 17 15 18 17 16 20 19 16 13 22 24 13 17 20 15 24 17 21 16 22 21 20 22 26 17 19 13 17 19 30 30 19 24 25 19 22 30 18 14 24 19 26 19 28 19 asistieron a la fiesta del colegio de .1231 1. A cada uno se les preguntó la edad y sus respuestas se anotaron en la tabla 2.4167 0.75 – 2 Total 200 250 120 80 650 0. Ejemplo 1.25 1. Se tomará un ejemplo para explicar los pasos de la elaboración.5 metros.5 1. Cuando se va a construir una distribución de frecuencias hay que definir cuántos intervalos o clases se van a utilizar así como la amplitud de cada uno.76 41. es decir que los datos se concentran en esta clase.25 metros y 1.25 – 1.31 100 Tabla 1. 12 18 22 25 31 21 22 14 21 17 18 12 19 12 19 17 18 16 14 15 13 14 15 20 17 18 17 20 12 21 26 23 25 31 21 15 18 17 18 29 16 20 12 16 22 18 15 20 19 12 13 18 14 15 18 17 14 19 20 16 19 17 16 17 15 15 18 18 13 24 19 13 23 24 17 23 21 15 14 19 17 23 21 18 23 19 15 17 24 15 Tabla 2. Existen ciertos lineamientos flexibles que se pueden seguir. 2.1846 0.3076 0.75 1. Esta distribución muestra que la mayoría de los estudiantes (250) tienen estaturas entre 1.2 Elaboración. En una fiesta de estudiantes de un colegio de bachillerato.5 – 1.67 18. asistieron 180 jóvenes.00 30.Estatura (m) Frecuencia Frecuencia relativa % 1 – 1. Edades de los jóvenes que bachillerato. Distribución de frecuencias para las estaturas de los jóvenes.46 12. menor que 12. Es decir se debe tomar un número de clases que no sea muy grande y que no se muy pequeño. Paso 3. la elección de las clases depende del criterio del investigador. Además que el límite superior de la última clase sea un poco mayor que el valor más grande del conjunto de datos. Paso 2. que para el ejemplo es 31. La información que muestra la tabla 2 está muy desorganizada y el objetivo es ordenarla de tal manera que su análisis sea más fácil. por tanto I = 31 − 12 = 2. Se recomienda que el límite inferior de la primera clase sea un poco menor que el valor más pequeño del conjunto de datos. las clases se refieren a los intervalos de edades. B = 12 y K = 7 . Paso 1. Del número de datos se busca el valor más alto (A) y el valor más bajo (B) y el intervalo se halla por medio de la fórmula: I= A− B K Donde K es el número de clases elegido. La fórmula que a continuación se nombra permite calcular el número de clases: n Si n no es muy grande N ° de int ervalos = K = 1 + 3. Creación de las clases.22 Log en otro caso Pero en general. Se toman 7 clases para el ejemplo. . para el ejemplo. Las clases que se formaron se muestran en la tabla 3. En general para grandes cantidades de datos se requieren más clases que para pequeñas cantidades.Solución. Por lo general se agrupan de 5 a 15 clases. Para el caso. Para el ejemplo. Este 7 valor se redondea al entero superior. Se debe tomar el intervalo igual para todas las clases. sin embargo hay ocasiones en que se pueden tomar amplitudes de clases desiguales para evitar clases vacías o casi vacías.375 . Demasiadas clases o muy pocas pueden no revelar la forma básica del conjunto de datos. Determinar el número de clases. así que I = 3 . A = 31. Determinar la amplitud de clase o intervalo de clase. excepto el 17. para ser más estrictos. Paso 4. Conteo manual de los estudiantes que pertenecen a cada clase en particular para el ejemplo 1. por ejemplo. en la clase 11 – 14. el 14 pertenece ala clase 14 – 17 y en la clase 23 – 26. Contar el número de elementos de cada clase. en términos matemáticos. El límite superior de cada clase corresponde al intervalo siguiente.Clases Edades (Años) 11 – 14 14 – 17 17 – 20 20 – 23 23 – 26 26 – 29 29 – 32 Total Tabla 3. por ejemplo hay 17 alumnos que tienen edades entre 11 y 14 años. el 26 pertenece a la clase 26 – 29. Edades 11 – 14 14 – 17 17 – 20 20 – 23 23 – 26 26 – 29 29 – 32 Total frecuencia ///// ///// ///// // = 17 ///// ///// ///// ///// ///// ///// ///// = 35 ///// ///// ///// ///// ///// ///// ///// ///// ///// ///// ///// ///// / ///// ///// ///// ///// ///// ///// // = 61 = 32 = 18 ///// //// = 9 ///// /// = 8 180 ///// ///// ///// /// Tabla 4. la clase 14 – 17 sería el intervalo [14.17 ) donde entran todos los valores desde el 14 hasta el 17. . Hay que recordar que el número de observaciones de cada clase se le llama frecuencia de clase. Clases formadas para el ejemplo 1.SI de la hoja de cálculo Excel. El conteo se puede hacer manual como se muestra en la tabla 4 o utilizando la función CONTAR. es decir. cada clase sería un intervalo semiabierto a la derecha. luego 17 es la frecuencia de la clase 11 – 14. Las frecuencias asociadas a cada clase se simbolizan f i y las frecuencias relativas hi . 5 15.5 30. su 23 + 26 = 24.0000 9. f i ≥ 0 . 17 – 20 . es decir (9. Al analizar la distribución también se puede responder a las preguntas: • ¿Cuántos estudiantes tienen entre 20 y 23 años? Se observa la distribución y la clase 20 – 23.5 27.5 18.78 + 10. La marca de clase se simboliza xi donde i es el número de la clase correspondiente.78% de los jóvenes que asistieron a la fiesta tenían entre 20 y 23 años. También conocida como marca de clase. Se calcula sumando el límite inferior al límite superior de una clase y se divide esta suma por 2. 14 – 17.0444 1.5 150.1000 0.00)% = 90. se ubica a la mitad entre los límites inferiores de dos clase consecutivas.1944 0. es decir. así si se toma la clase 23 – 26.0500 0. Las .• Punto medio de clase.5 .44 100.89 + 17.1778 0.55% 2. De acuerdo a la distribución de frecuencias construidas se puede enunciar.00 5.44 19.44 33.5 17 35 61 32 18 9 8 180 0. Distribución de frecuencias. La frecuencia ( el número de jóvenes) en esta clase es de 32. por ejemplo que un 17.00 4.00 Tabla 5. Propiedades de las distribuciones de frecuencia. marcas de clase y frecuencias relativas del ejemplo 1.44 + 19. Edades xi fi hi % 11 – 14 14 – 17 17 – 20 20 – 23 23 – 26 26 – 29 29 – 32 Total 12.0944 0. distribuciones de frecuencia cumplen las siguientes propiedades: • Las frecuencias de clase son enteros no negativos. luego si se suma los porcentajes de cada una de estas clases se obtiene el porcentaje total de los que tiene menos de 26 años. 20 – 23 y 23 – 26.3389 0.5 24. marca de clase es 2 La distribución de frecuencias para el ejemplo 1 se muestra en la tabla 5.3.89 17.78 10.44 + 33. • ¿Qué porcentaje de los jóvenes tiene menos de 26 años? Se nota que los jóvenes de menos de 26 años están las clases 11 – 14 .5 21. o sea. • La suma de todas las frecuencia relativas es igual a 1. ¿cuántos tienen 18? Y ¿cuántos tienen 19? No se obtendría la respuesta con la distribución de frecuencias. pero si se pregunta ¿cuántos tienen 17 años?. esto es.• Las frecuencias relativas son números no negativos menores que 1. n ∑h i = 1 . si se toma la clase 17 – 20 se puede saber que hay 61 jóvenes que tienen entre 17 y 18 años. 0 ≤ hi ≤ 1 . No se sabe con seguridad cómo se distribuyen los datos dentro de la clase. i =1 • La suma de todas las frecuencias es igual a la totalidad de los datos. El nombre tallo y hoja se refiere a que si se tiene un número. que se puede ver dónde se concentran los datos y si hay valores extremadamente grandes o pequeños. este está compuesto por el tallo que es el primer dígito y la hoja que son los dígitos que le siguen. i =1 3. así por ejemplo. La representación tallo y hoja es una técnica que se utiliza para mostrar información cuantitativa en forma más condensada. entonces se coloca el tallo y se colocan k hojas. Para la distribución de edades del ejemplo 1. En el ejemplo 1. Si en un conjunto de datos un número está repetido k veces. Por ejemplo. si el 14 está 6 veces en un conjunto de datos entonces el tallo es 1 y la hoja es 444444. o sea. Esto constituye una gran ventaja aunque se puede señalar como desventajas: • • No se puede identificar con exactitud cada dato del conjunto. la representación de tallo y hoja se muestra en la tabla 6. n es decir. En esta representación se puede identificar cada valor de la observación. en el número 27 su tallo es 2 y su hoja es 7. REPRESENTACIONES TALLO Y HOJA. . ∑ fi = n . donde n es el número de datos. En una distribución de frecuencias se puede visualizar rápidamente la forma de la distribución. Para tal fin se utilizan diagramas o gráficas. el polígono de frecuencias acumuladas y diagramas circulares. Representación tallo y hoja para el conjunto de datos del ejemplo 1. Es una gráfica hecha con rectángulos donde la base y la altura de cada uno son la clase y la frecuencia correspondiente. El histograma de la distribución del ejemplo 1 se muestra en la figura 4. Dentro de Las ventajas de los histogramas se pueden anotar: . Cada rectángulo se coloca adyacente al inmediatamente anterior a él. Generalmente resulta muy conveniente resaltar información contenida en una tabla de una distribución de frecuencias. Es uno de los diagramas que se utiliza con mayor frecuencia. es decir que la mayoría de las edades se encuentran entre 17 y 20 años. la edad menos presente en la fiesta es 28 y 29 años.Se puede sacar varias conclusiones de esta representación. La edad más presente es 18 años. 52 jóvenes tienen menos de 20 años.1. Al construir una gráfica en el plano cartesiano. respectivamente. REPRESENTACIONES GRÁFICAS DE UNA DISTRIBUCIÓN DE FRECUENCIAS. por ejemplo. se acostumbra ubicar a las clases en el eje de las abcisas (eje X) y las frecuencias en el eje de las ordenadas (eje Y). que representan de una manera adecuada una distribución de frecuencias. Existen diagramas tales como el histograma. Tallo 1 2 3 Hoja 22222222 333333333 4444444444 555555555555555 6666666666 77777777777777777777 888888888888888888888 99999999999999999999 0000000000 111111111111 2222222222 33333 44444444 55555 6666 777 88 99 000 111 Tabla 6. Histograma. entre otros. 4. 4. En él se observa que la concentración de los datos se da en la clase 17 – 20. el polígono de frecuencias. 2 Polígono de frecuencias. Un polígono de frecuencias que utiliza frecuencias relativas de puntos de dato en cada una de las clases. una antes de la primera clase y la otra después de la última. Se añaden dos clases. muestra la proporción del número total de observaciones que se encuentran en esa clase. Este polígono tiene la misma forma que el polígono de frecuencias construido a partir del mismo conjunto de datos. Es similar al histograma. pero con una escala diferente en los valores del eje vertical. de tal manera que este se empiece a construir desde el eje x. • El área de cada rectángulo. en relación con el resto. se conoce como polígono de frecuencias relativas.• Permite visualizar de manera rápida el comportamiento e los datos en la distribución de frecuencias. Figura 4. • Los rectángulos muestran cada clase de la distribución por separado. Histograma de la distribución de frecuencias del ejemplo 1. Se encuentran los puntos medios de estas clases y se ancla el polígono de frecuencias a cero. por tanto sus frecuencias son cero. está formado por segmentos de rectas que une puntos de coordenadas ( xi . 4. en lugar del número real de puntos. En estas dos clases hay cero observaciones. f i ) donde xi es el punto medio de cada clase y f i es la frecuencia de clase i . . pero si se forma una distribución de frecuencias acumuladas se podría construir un polígono de ellas y las respuestas se podrían dar con sólo verlo. Las frecuencias acumuladas se simbolizan Fi . Si se quiere responder las preguntas referentes al ejemplo 1: ¿hasta qué edad llega el 50% de los jóvenes en la fiesta?. Figura 5. Traza con más claridad el perfil del patrón de datos. ¿cuántos estudiantes tienen menos de 26 años?.En la figura 5. 4. . Un polígono alisado mediante el aumento de clases y de puntos de dato se conoce como curva de frecuencias. De las ventajas de los polígonos de frecuencia se puede decir: • • • • Es más sencillo que su correspondiente histograma. Se pueden superponer sobre unos mismos ejes dos o más polígonos de frecuencia para la comparación de sus correspondientes distribuciones de frecuencia.3. Polígono de frecuencias de la distribución de frecuencias del ejemplo 1. las respuestas se pueden obtener con el procedimiento seguido en la sección 2. Se vuelve cada vez más liso y parecido a una curva conforme se aumenta el número de clases y el número de observaciones. se muestra el polígono de frecuencias para el conjunto de datos del ejemplo 1. Distribuciones de frecuencias acumuladas.2 utilizando la distribución de frecuencias. Fi ) . Las frecuencias acumuladas reemplazan a las frecuencias en el polígono de frecuencias. Clases. Las características principales del polígono de frecuencias acumuladas son: • • • El polígono empieza en cero. . La frecuencia acumulada para la clase 11 – 14 es su misma frecuencia por ser la primera. es decir. no acumula porque antes no hay frecuencias. Las demás frecuencias acumuladas se calculan sumando la frecuencia acumulada inmediatamente anterior.La tabla 7 muestra las frecuencias acumuladas para cada clase. Edades 11 14 17 20 23 26 29 – – – – – – – 14 17 20 23 26 29 32 fi Fi 17 35 61 32 18 9 8 17 52 113 145 163 172 180 Tabla 7. La figura 6 muestra el polígono de frecuencias acumuladas para el ejemplo 1. El polígono no cierra. o sea. por ejemplo. van en el eje de las ordenadas (eje Y). Cada punto del polígono tiene coordenadas ( xi . para la clase 17 – 20 su frecuencia acumulada es 61 + 52 = 113 y así sucesivamente. una clase antes de la primera clase y termina en la última clase. frecuencias y frecuencias acumuladas de la distribución de frecuencias del ejemplo 1. para la clase 14 – 17 su frecuencia acumulada es 17+35 = 52. donde xi es la marca de clase. Para responder a las preguntas que se hicieron al principio de esta sección hay que seguir las flechas en el polígono de frecuencias acumuladas como se indica en la figura 7. . Polígono de frecuencias acumuladas para la distribución de frecuencias del ejemplo 1. Figura 7. Polígono de frecuencias acumuladas para la distribución de frecuencias del ejemplo 1 para obtener las frecuencias acumuladas.Figura 6. Para completar el total falta el 35% que corresponde a n º = 3.6*35 = 126º . es decir. 35% y 40%.Siguiendo la dirección de la flecha que va desde el eje de las frecuencias acumuladas hasta el eje de las clases se puede establecer que la mitad (90).6 * 25 = 90º . de los jóvenes tiene menos de 17 años. .6* 40 = 144º que se mide a partir del porcentaje anterior. La suma de todos los ángulos es 90º+144º+126º=360º. medidos a partir del ángulo del porcentaje anterior. Se divide un círculo en tantas porciones como clases existan. el ángulo es n º = 3. Diagrama circular que representa los porcentajes 25%. La figura 8 muestra las distribuciones de los porcentajes en el círculo.6 x . de modo que a cada clase le corresponde un arco de círculo proporcional a su frecuencia absoluta o relativa. 4. el 50%. si la frecuencia es el 25%. Si se sigue la flecha que va desde el eje de las clases hasta el eje de las frecuencias acumuladas se puede dar respuesta a la pregunta ¿cuántos jóvenes tiene menos de 23 años? La respuesta es aproximadamente 150. así por ejemplo. entonces el ángulo en el círculo es n º = 3. Si ahora se tiene un nuevo porcentaje. x% es el porcentaje dado y n º es el ángulo que le corresponde dicho porcentaje y que se debe trazar en el círculo. Diagramas circulares. También llamados tortas.4. por ejemplo del 40%. El arco de cada porción se calcula usando la regla de tres: 360 º → 100% 360 x% y que al simplificar se nº →x% 100% obtiene n º = 3. de donde se tiene n º = Figura 8. 5. EJERCICIOS DE LA UNIDAD. 5.1. El número de vacunas que se suministran a una determinada población se muestra en la siguiente tabla: Vacuna Miles BCG 45 SABIN 100 DPT 70 SARAMPIÓN 40 TOTAL 255 Construya un diagrama circular con los datos de la tabla. 5.2. Las calificaciones obtenidas en la prueba de una asignatura son las que se muestran en la siguiente tabla 3.9 4.7 3.2 3.6 3.1 3.3 3.7 4.2 4.0 4.3 5.0 4.0 4.5 3.8 3.8 4.8 3.5 3.6 3.5 4.8 Construya una distribución de frecuencias con un histograma, un polígono de frecuencias y un polígono de frecuencias. 5.3. En el siguiente conjunto de datos, se proporcionan los pesos (redondeados a libras) de niños nacidos en cierto intervalo de tiempo: 4, 8, 4, 6, 8, 6, 7, 7, 7, 8, 10, 9, 7, 6, 10, 8, 5, 9, 6, 3, 7, 6, 4, 7, 6, 9, 7, 4, 7, 6, 8, 8, 9, 11, 8, 7, 10, 8, 5, 7, 7, 6, 5, 10, 8, 9, 7, 5, 6, 5. • • • • • Construir una distribución de frecuencia de estos pesos. Encontrar las frecuencias relativas. Encontrar las frecuencias acumuladas. Encontrar las frecuencias relativas acumuladas. Dibujar un histograma con los datos. 5.4. Se les preguntó a un grupo de 35 personas sus estaturas, las respuestas se encuentran consignadas en la siguiente tabla: 152 163 154 164 166 154 170 163 162 168 168 172 170 160 161 158 165 165 151 161 157 160 155 158 158 170 169 168 155 156 162 162 166 168 160 • Construya una distribución de frecuencias. • • • • • Elabore Elabore Elabore Elabore Elabore un polígono de frecuencias. un diagrama circular. un histograma. un polígono de frecuencias acumuladas. una representación tallo y hoja. 5.5. Los datos señalan el tiempo (en horas) que demora un cierto tipo de lámpara incandescente. 20,25,24,26,30,35,32,31,18,15,23,25,26,24,21,23,29,35,18,23,24,16, 18,19,20,20,20,25,26,22,32,31,30,30,30,30,30,25,22,24,26,21,26,25,2 32,21,15,14,13,14,16,17,19,19,19,18,18,15,14,20,20,22,23,26,24,25, 20. • Construya un diagrama de frecuencias con los datos. • Construya un polígono de frecuencias acumulada. • ¿Dónde se concentran los datos? • Construya una representación tallo y hoja, ¿cuál es el dato que más se repite? UNIDAD III MEDIDAS DE TENDENCIA CENTRAL Y MEDIDAS DE DISPERSIÓN. OBJETIVO GENERAL. Calcular tendencia central y de dispersión. adecuadamente las medidas de OBJETIVOS ESPECÍFICOS. • Calcular la media aritmética, la media ponderada, la mediana, la moda y la media geométrica para datos dispersos y datos agrupados en una distribución de frecuencias. • Conocer y explicar las ventajas y desventajas de cada una de las medidas de tendencia central. • Interpretar las medidas de tendencia central y de dispersión para analizar los datos estadísticos. • Calcular las medidas de dispersión tales como la varianza, la desviación estándar y el coeficiente de dispersión en datos dispersos y datos agrupados. 1. INTRODUCCIÓN. Al tener un conjunto de datos es posible describirlos de dos maneras: la primera como se hizo en la segunda unidad, es decir, por medio de una distribución de frecuencias, una representación tallo y hoja, un histograma, un polígono de frecuencias, entre otros. La segunda forma, como se hará en esta unidad, es describirlos mediante un único valor que sea representativo de todos los datos. A este valor se le conoce como medida de tendencia central. Se hace necesario saber que tan dispersos están todos los datos respecto a esa medida de tendencia central, es por eso que además se estudia en esta unidad las medidas de dispersión. 2. MEDIA ARITMÉTICA. También llamada promedio aritmético. Si se suman cada uno de los valores de una variable x y se divide el resultado por el número de valores sumados, se obtiene la media aritmética o promedio. Cuando se trabaja con poblaciones se calcula la media poblacional y cuando se trabaja con muestras se calcula la media muestral. En las fórmulas para calcular la media se utiliza el símbolo de la sumatoria ∑ que es una forma condensada de expresar una suma. Así la suma n X 1 + X 2 + X 3 + ... + X N , se puede condensar mediante la expresión ∑X i =1 i Es la suma de todos los valores de la población. se calcula . 2. Se calcula mediante la fórmula µ = i =1 n i . Solución.2. Se simboliza por X y es la suma de los valores de una muestra. dividida entre el número total de los mismos. Ejemplo 2. Media poblacional. Una pequeña empresa cuenta con 5 empleados cuyos salarios se muestran en la tabla 8. i =1 De ahora en adelante cuando se hable de media. Calcule la media de los salarios. Empleado Salario ($) 1 500000 2 3 550000 600000 4 5 500000 490000 Tabla 8.1.que se lee : “Sumatoria de todos los X i (equis sub i ) desde que i = 1 6 hasta que i = n. a menos que se indique lo contrario. entonces la media es poblacional. y i =1 4 ∑2 i = 21 + 2 2 + 23 + 2 4 = 30 . dividida entre el número n ∑X total de dichos datos. Se simboliza con la letra griega µ (mu). 5 ___ 2. donde: µ : es la media poblacional. X i : Valor i de la población. n : es el número total de datos de la población. Media muestral. Como se toma toda la población de la empresa. Por ∑ i = 1 + 2 + 3 + 4 + 5 + 6 = 21 ejemplo. luego la media es: 5 ∑X µ= i =1 5 i = 500000 + 550000 + 600000 + 500000 + 490000 = 528000 . Salarios de empleados de una pequeña empresa del ejemplo 2. se hará referencia a la media aritmética. Horas extras laboradas por las enfermeras del Hospital Universitario de Santander para el ejemplo 3. respecto a la media siempre será igual a cero. La media aritmética cumple las siguientes propiedades: • La suma de las desviaciones de cada valor. para el ejemplo 3. en forma simbólica.3. La media muestral. El director de personal del Hospital Universitario de Santander inició un estudio acerca de las horas extras de tiempo de las enfermeras. La desviación es la diferencia (resta) de cada valor respecto a la media.. Seleccionó al azar 10 de ellas durante el mes de febrero y se anotaron las horas extras laboradas. Enfermera Horas extras laboradas 1 13 2 3 13 12 4 5 15 17 6 7 13 15 8 9 10 16 16 17 Tabla 9. i =1 donde M es la media poblacional o muestral. entonces se calcula la media muestral: 10 __ X= ∑X i i =1 10 = 13 + 13 + 12 + 15 + 17 + 13 + 15 + 16 + 16 + 17 = 14. i es decir. Ejemplo 3. Solución. Propiedades de la media aritmética. + (M − X n ) = 0 . se verifica esta propiedad: . 10 2. La tabla 9 muestra los datos.. Como es una muestra de la población de todas las enfermeras del hospital. (M − X 1 ) + (M − X 2 ) + .7 . Esta propiedad. se n expresa: ∑ (M − X ) = 0 . o cualquier otra n medida basada en una muestra se le conoce como dato estadístico.n __ mediante la fórmula X = ∑X i i =1 . 5) 3 + 3.7 − 16) + (14.000 + 800.9 + 3) + (1.95 2 + 2. µ= • Si a cada dato se le suma un número constante. Así. por ejemplo.7 − 15) + (14. entonces la media es ese valor.95 + 3) = 5.5.9 * 1.05 * 3 Una desventaja de la media es que ella toma en cuenta todos los valore de una muestra o población.075 = 2. una persona tiene un salario mensual de $800. si en el ejemplo de las estaturas se multiplica cada dato por 1. 2. las edades de un grupo de 5 personas son 20.7 − 16 ) + (14.05 m .5) + (2.5) + (1. entonces la media del ingreso al año será $800. Si ahora se le suma a cada 5 dato el valor constante 3.9 y 1.1 * 1.000 12 • Si a cada dato se le suma un número constante.05 = 2. 23. por lo tanto la media no sería muy representativa del conjunto de datos.000.7 − 12) + (14.3 * 1.95 * 1.000 + 800.7 − 17 ) = 0 • Si todos los valores obtenidos son iguales a un valor constante k. entonces se tiene (2 * 1.000. 1. Por ejemplo.000 + 800.9 + 1.3 + 3) + (1. La media para este conjunto de datos es 20 + 33 + 23 + 19 + 85 µ= = 36 años que no es un valor representativo del 5 conjunto de datos. 33.000 + 800.000 + 800.05 + 3 5 • Si cada dato se multiplica por una constante.45 + 2.000 + 800.7 − 13) + (14. .7 − 13) + (14. las estaturas de los jugadores de un equipo de baloncesto son 2. es posible que encontrarse con valores muy grandes o muy pequeños comparados con los demás. entonces la media será la media de los datos más la constante.7 − 15) + (14.000 + 800. 2.000 = 800.7 − 17 ) + (14.5) + (2.95 su media es µ = = 2.(14.7 − 13) + (14. pues es mayor que la mayoría de todos ellos.15 + 3.000 + 800.1. 19 y 85 años. por ejemplo.000 + 800.1 + 2.925 µ= = 5 5 = 3. entonces la media será la media de los datos más la constante.000 + 800.1 + 3) + (2.5) + (1. se ve que 85 años es un valor muy grande comparado con los demás. se obtiene µ= (2 + 3) + (2.3 + 1.85 + 2.000 + 800. así: 800. entonces el valor de la media queda multiplicado por ese mismo valor.3. se .1. La mediana es el valor que corresponde al punto medio de los datos después de ordenarlos de menor a mayor o viceversa de tal manera que el 50% de dichos datos son mayores que ella y el otro 50% menores. Solución. Ejemplo 4.8. MEDIANA. 8 reciben $30000 al día y 12 reciben $35000 al día. $30000 o $35000 por día. donde f i es la frecuencia con que se repite el dato. se tienen los siguientes datos: 1.25. i i =1 también llamado peso y n es el número de datos.6. MEDIA PONDERADA. Es un caso especial de la media aritmética.7 10 + 8 + 12 30 i i =1 4. Una vez que los datos estén organizados en orden creciente o decreciente.7.7. Se aplica cuando hay observaciones con un mismo valor. Se calcula mediante la n ∑x f i i __ fórmula: X p = i =1 n ∑f . entonces es conveniente utilizar una medida más representativa llamada mediana. 10 reciben el pago de $20000 al día. Una empresa contratista paga a sus empleados $20000. Hay 30 empleados. la mediana se puede calcular de dos formas: • Si el número de datos es impar.4. Al organizarlos de mayor a menor. entonces la mediana estará a la mitad de los datos. Calcule el promedio ponderado.2. Si en un conjunto de valores se observan que la tendencia de los datos está sesgada (inclinada) hacia los valores altos o hacia los bajos.3.7.6. Por ejemplo. 3 __ ∑x f Xp = i =1 3 i i ∑f = 20000 * 10 + 30000 * 8 + 35000 * 12 200000 + 240000 + 420000 = = $28666. Para cuando el número de datos es pequeño ( n ≤ 30 ). lo cual puede ocurrir si los datos se han agrupado en una distribución de frecuencias. 9. Es posible también que un conjunto de datos tenga dos modas (bimodal) y en ese caso la moda no sería representativa. razones. El dato central es 6.6.3.2.6. es decir. e intervalo y ordinal.3. MODA.6.8.1.5. aunque se puede utilizar en cualquier nivel de datos.13. Propiedades de la mediana. en vez de 25 estuviera 330000. La media geométrica es menor que la media .7. MEDIA GEOMÉTRICA.3.2.10. 4.7. Por ejemplo dados los datos 2.6.2.5. Puede calcularse para datos de nivel de razón.7.1. Se utiliza para encontrar el promedio de porcentajes.1. En el siguiente grupo de datos.9.4.3.5.11.4. Los datos centrales son 6 y 9 y su media es 7.3.7. Después de organizar los datos.7. El dato que más se repite es 3.18. La media no es afectada por los valores extremos.6.7. Las propiedades más importantes de la mediana son: • • • La mediana es única.3. la mediana sigue siendo 6. es decir.6.16. Ejemplo 5. índices o tasas de crecimiento.6.8.4.5.25.1.4. 6.13. si en el conjunto de datos 1. Es el valor e la observación que aparece con más frecuencia.16 y 18.5.2. sólo existe una mediana para un conjunto de datos. que es la media del conjunto de datos.10. La moda tiene la desventaja de que muchos conjuntos de datos no tienen valor modal porque ningún dato aparece más de una vez. 5.8.5 que es la mediana del conjunto de datos.3.tiene: 25. • Si el número de datos es par.5.7. la media será la media de los dos datos centrales. ¿Cuál es la moda o valor modal? 2. La mediana no se ve afectada por datos muy pequeños o muy grandes.7.9.4. al organizarlos se tiene: 2. por tanto la moda de este conjunto de datos es 3.11. La moda es muy útil para describir datos de nivel nominal y ordinal. Solución. se obtiene el mismo aumento. La media geométrica de un conjunto de n datos es la raíz enésima del producto de los valores. es posible encontrar el promedio de crecimiento porcentual con solo conocer el valor al principio y al final. Se calcula mediante la fórmula MG = n X 1 X 2 X 3 . Aumentos a porcentajes constantes del sueldo.924 604164.924 664121.000 y que va a recibir aumentos en tres meses consecutivos discriminados así: 5% para el primer mes. es posible hallar el incremento porcentual de forma constante en cada ..1 = 1. si se sabe que una variable creció porcentualmente a un ritmo no constante. Ejemplo 6. Es decir. Aumento porcentual promedio en un período determinado.30 54544. Si se desea aumentar en forma constante el sueldo en esos tres meses..30 9.125. La tabla 11 ilustra estos aumentos: Sueldo ($) MG (%) Nuevo sueldo ($) Aumento($) 500000. X n . Claramente el sueldo al final de todos los aumentos es $664.15 * 1. Aumento en porcentajes del sueldo del trabajador. Esto indica que el promedio de los aumentos debe ser de 9.05 * 1.00 49620.30 604164.924 549620. En el ejemplo 6 se verá como se puede aplicar la media geométrica.00 9.924%.00 9. que si se aumenta a este promedio en forma constante. La tabla 10 muestra los aumentos por mes del sueldo del trabajador: Sueldo ($) 500000 525000 577500 % Nuevo sueldo ($) Aumento($) 5 525000 25000 10 577500 52500 15 664125 86625 TOTAL 164125 Tabla 10. si se quiere aumentos constantes entonces debe calcularse la media Geométrica: MG = 3 X 1 X 2 X 3 = 3 1. Si una población o un determinado capital crece en n períodos determinados.26 TOTAL 164121. Supongamos que un trabajador tiene un sueldo de $500.56 59957. Cada uno de estos valores debe ser positivo.56 Tabla 11. ¿cuál sería el porcentaje para obtener el mismo aumento total? ¿Cuál será el sueldo para el cuarto mes? Solución.09924 . 6.aritmética.1. o sea. 10% para el segundo mes y 15% para el tercer mes.00 549620. Valor al inicio de los períodos Ejemplo 7.6% por año. GASTOS (MILLONES) 25 35 45 55 65 – – – – – 35 45 55 65 75 NÚMERO DE EMPRESAS Fi xi 5 10 21 16 8 5 15 36 52 60 30 40 50 60 70 . Entonces 120520 MG = 20 − 1 = 0.086 . Ejemplo 8. es decir. MEDIDAS DE TENDENCIA CENTRAL PARA DATOS AGRUPADOS. Esto significa que es como si la producción 23000 estuviera aumentando a razón constante de 8. para n su cálculo se emplea la fórmula __ ∑fx X= i =1 n i i ∑f __ . 7. f i es la frecuencia de clase y n es el número total de clases. xi es la marca de clase. 7.1. Media.período. ¿cuál fue la tasa de incremento porcentual anual promedio constante para el período? Solución. Cuando se tiene una gran cantidad de datos es muy tedioso hallarle sus medidas de tendencia central a menos que ellos se encuentren agrupados en una distribución de frecuencias. Este incremento porcentual constante se calcula por la fórmula Valor al final de los períodos MG = n −1 . donde X es la media i i =1 aritmética. Se considera que las observaciones en cada clase están representadas por la marca de clase (punto medio de cada clase). La producción de camiones de una fábrica aumentó de 23000 unidades en 1978 a 120520 unidades en 1998. n es 20 años. Los gastos publicitarios de 60 empresas colombianas se presentan en la distribución de frecuencias como se muestra en la tabla 12. Aquí el valor al final del período es 120520 en 1998 y el valor al principio del período es 23000 en 1978. que la mediana debe estar en la clase que contenga el dato 30. Fi Es la frecuencia acumulada de las clases que están antes de la clase que contiene la mediana. Mediana. Solución. Como hay 60 datos. Según la fórmula para la media de datos agrupados. Al ver en la frecuencia acumulada en la tabla 12 se nota que hay 15 empresas que gastaron menos de 45 millones y 36 que gastaron menos de 55 millones. es decir. se tiene: 5 __ ∑fx X= i =1 5 i i ∑f = 5*30 + 10* 40 + 21*50 + 16*60 + 8*70 = 57. Figura 9. Gastos en millones de pesos en publicidad de 60 empresas colombianas.33 60 i i =1 7. Los elementos de la fórmula para la mediana son: . n Es el número total de frecuencias. entonces hay 30 datos por encima y 30 datos por debajo de la mediana. f CLASE Es la frecuencia de la clase que contiene la mediana.Tabla 12. Sólo se puede hacer una estimación de ella. I Es la amplitud del intervalo o clase que contiene la mediana. De acuerdo al ejemplo 8 la mediana debe ser el valor que divide el número de datos en dos partes iguales de tal forma que el 50% de ellos esté por encima y el otro 50% por debajo.2. Para datos agrupados no es posible encontrar la mediana exacta pues los datos no son identificables. el dato 30 se encuentra en la clase 45 – 55 millones. o sea. Para estimar la mediana se utiliza la n − Fi 2 I donde: fórmula Med = L + f CLASE L Es el límite inferior de la clase que contiene la mediana. La figura 9 ilustra la situación planteada. Ubicación del dato mitad en la clase 35 – 45 para el ejemplo 8. 5 y 2. f CLASE = 21 e I = 10 . La media. la clase que contiene el mayor número de frecuencias es 45 – 55 y su punto medio es 50.5 metros ¿usted lo cruzaría con toda confianza? Muy seguramente si decide o no. entonces la desviación media es 5. Por ejemplo si la media de un conjunto de datos es 5.8 = 0. 8. Desviación media. . n = 60 .2 m. la mediana y la moda sólo localiza el centro de los datos.L = 45 . qué tan dispersas están las medidas de las profundidades respecto al promedio. No es significativo saber cuál es la medida de tendencia central de un conjunto de datos si no se sabe que tan apartados están los datos de esa medida. o sea.6. entonces la amplitud de variación es Av = 9 − 2 = 7 . MEDIDAS DE DISPERSIÓN. tomar una decisión con sólo saber una medida de tendencia central es arriesgado. Para el ejemplo 8. i =1 n __ donde X es la media. En conclusión se necesitaría saber cómo varían las profundidades respecto al promedio. digamos que como máximo 0. 8. pero no dice nada acerca de cómo están dispuestos respecto a la medida de tendencia central. La desviación de un dato respecto a la media es la diferencia entre estos valores. por ejemplo si los datos son 2. la decisión ahora de cruzar o no el río tiene mayor respaldo. Fi = 15 . Pero si en el aviso se anuncia que las profundidades del río a lo ancho no están muy alejadas del promedio.7.3. sería muy apresurado de su parte.1.3. 8.8. 21 7. La moda se aproxima al punto medio de la clase que contenga el mayor número de frecuencias de clase. Luego la mediana es 60 − 15 Med = 45 + 2 *10 = 52. Es la diferencia entre el valor más grande y el valor más pequeño de un conjunto de datos.8. si usted va a cruzar un río y ve un aviso que dice que la profundidad promedio es de 1.3 y si de este conjunto se toma a 5. Es decir. La fórmula n __ ∑ X−x i para calcular la desviación media es Dm = xi es el dato i y n es el número de datos.14 . Es el promedio de los valores absolutos de las desviaciones con respecto a la media aritmética.5 .3 − 5. Moda. por tanto ese es el valor de la moda.9.2. Amplitud o intervalo de variación. Por ejemplo. El valor absoluto asegura que las diferencias entre la media y cada dato sea positiva. que para el caso es poblacional: 300 + 310 + 305 + 300 + 308 µ= = 304.5. Varianza. 305. El peso de 5 cajas de llenas de cereales.5 − 6 ) + ( 7.6 Luego la desviación media es 5 5 ∑ 304.6 − 300 + 304. 8. entonces la varianza poblacional es 6 ∑ ( 7.5 − 8 ) + ( 7.5 − 8) + ( 7.5 − 7 ) + ( 7.5 − x ) i 2 σ = i =1 6 2 2 2 2 2 2 ( 7. Ejemplo 10.912 6 Es decir que la media de todas las desviaciones cuadradas es 0. La varianza es la media aritmética de las desviaciones cuadradas. Se cuenta con un grupo de 6 niños cuyas edades son: 7. La media de la población es 7.6 − 300 + 304.6 − x i Dm = = i =1 = 5 304.5 − 7 ) + ( 7. X es la media muestral. 310. 300 y 308 gramos. 7 y 9 años. La varianza puede ser poblacional.6 − 310 + 304.4 = 3. que se simboliza por la letra griega sigma al cuadrado ( σ 2 ). o puede ser muestral.68. Antes se debe calcular la media. Otra forma de evitar que las desviaciones respecto a la media aritmética sean negativas es elevarlas al cuadrado.3. simbolizada por la letra ese al cuadrado n ∑ ( µ − xi ) ( s 2 ). = 2 .68 5 Esto significa que la media de todas las desviaciones respecto a la media de los datos es 3. Las fórmulas para cada caso son: σ 2 = i =1 n 2 __ ∑ X − xi y s 2 = i =1 n −1 n 2 __ donde µ es la media poblacional. escogidas al azar. Solución. 6. según el caso. Ejemplo 9.5 = 0.912.5 − 9 ) = 6 5.6 − 305 + 304.6 − 308 5 18. 8. es de 300. 8. xi es el dato i y n es el número total de datos de la muestra o población. ¿Cuál es la varianza de esta población? Solución. Determine la desviación media. entonces la varianza muestral es: 5 ∑ ( 640000 − x ) 2 i s2 = i =1 5 −1 2 2 ( 640000 − 500000 ) + ( 640000 − 800000 ) 2 2 2 + ( 640000 − 700000 ) + ( 640000 − 650000 ) + ( 640000 − 550000 ) = 4 = 61000000000 = 15250000000 4 8. También puede ser poblacional ( σ ) o muestral ( s ). $550000. Ventas (Miles de pesos) Número de empresas 100 – 120 5 120 – 140 7 140 – 160 9 160 – 180 16 180 – 200 10 200 – 220 3 . Amplitud de variación. Es la raíz positiva de la varianza.1.5. $700000. por ejemplo. Se toma una muestra de 5 personas de una empresa y se pregunta por sus salarios.4 Desviación estándar. la desviación estándar muestral es s = 15250000000 = 123490. $800000.89 . Es posible encontrar las medidas de dispersión para datos agrupados en una distribución de frecuencias. Sus respuestas fueron: $500000.Ejemplo 11. La media de la muestra es $640000. donde se muestra las ventas de 50 empresas.5 MEDIDAS DE DISPERSIÓN PARA DATOS AGRUPADOS. 8.955 y para el ejemplo 11. si se tiene una distribución de frecuencias como la que se muestra en la tabla 13. $650000. n 2 n 8. Para el ejemplo 10 la desviación σ = i =1 y s = i =1 n n −1 estándar poblacional es σ = 0. Las fórmulas respectivas son: 2 __ µ − x ( ) ∑ ∑ X − xi i .912 = 0. ¿Cuál es la varianza para esta muestra? Solución. Es la diferencia entre el límite inferior de la clase más baja y el límite superior de la clase más alta. Distribución de frecuencias de las ventas de 50 empresas. Cálculo de los miembros de la fórmula de la desviación estándar para datos agrupados. La amplitud de variación es Av = 220 − 100 = 110 8.TOTAL 50 Tabla 12. Al reemplazar los valores.5. Desviación estándar.2. Ventas 100 120 140 160 180 200 – – – – – – 120 140 160 180 200 220 fi xi xi2 f i xi2 f i xi 5 7 9 16 10 3 110 130 150 170 190 210 12100 16900 22500 28900 36100 44100 60500 118300 202500 462400 361000 132300 550 910 1350 2720 1900 630 6 ∑f TOTAL 6 ∑ 1 f i = 50 - - 6 ∑f i =1 i xi = 8060 i =1 i xi2 = 1337000 2 6 ∑ f i xi = 64963600 i =1 Tabla 13. La fórmula de la desviación estándar para datos agrupados en una distribución de frecuencias es: n ∑ i =1 n ∑ f i xi f i xi2 − i =1 n ∑ fi 2 i =1 s= n ∑f i −1 i =1 Donde s es la desviación estándar muestral. f i es la frecuencia de clase y n es el número de clases. Para el ejemplo anterior los cálculos de cada miembro de la fórmula se realizan en la tabla 13. xi es la marca de clase. para mayor comodidad. se obtiene: . Es decir cada una de estas medidas separa un cierto porcentaje de datos a la derecha o a la izquierda.b) deciles. DECILES. pero la dispersión se nota cuando se habla que un porcentaje de los datos está por encima de una de estas medidas. el decil D7 separa el 70% del 30% restante a la derecha y que el centil 33 separa el 33% de los datos de 67% restante a la derecha. como lo hace la media. Según el esquema de la figura 10 se puede ver por ejemplo que el cuartil Q1 separa el 25% del 75% restante a la derecha.6. Se podría pensar que los deciles cuartiles y centiles no son medidas de dispersión porque sólo dividen el conjunto de datos en partes iguales. así los deciles los dividen en 10 partes iguales. . CUARTILES Y CENTILES. La figura 10 esquematiza la posición de estas medidas. 15 y 16 muestran los porcentajes que separan cada una de estas medidas de dispersión. c) centiles. Las tablas 14.74 50 − 1 49 1337000 − = i =1 8. 6 ∑ fi xi 6 fi xi2 − i =1 n ∑ i =1 ∑ fi s= i =1 6 ∑f i −1 2 64963600 1337000 − 1299272 50 = = 27. Son medidas de dispersión que dividen los datos en partes iguales. Figura 10. los cuartiles en 4 partes iguales y los centiles en 100 partes iguales. Esquematización de las posiciones de a) cuartiles . .Cuartil Porcentaje menor Porcentaje mayor Q1 Q2 25% 50% 75% 50% Q3 75% 25% Tabla 16. También el decil D5 y el centil C50 son equivalentes a la mediana. . Decil Porcentaje menor Porcentaje mayor D1 D2 10% 20% 90% 80% D3 30% 70% D4 40% 60% D5 D6 50% 60% 50% 40% D7 D8 70% 80% 30% 20% D9 90% 10% Tabla 17. Porcentajes que separan los deciles de un conjunto de datos. 98% 93% . Centil Porcentaje menor Porcentaje mayor C1 C2 1% 2% 99% 98% C3 3% 97% C4 4% 96% C5 C6 5% 6% 95% 94% D7 . Porcentajes que separan los centiles de un conjunto de datos. 2% C99 99% 1% Tabla 18. . C98 7% . Porcentajes que separan los cuartiles de un conjunto de datos. . . Es de notar que el cuartil Q2 es equivalente a la mediana porque separa el 50% de los datos. . . a 0.6 la distancia entre los valores de la posición 18 y la posición 19.6*4=43.25. primer cuartil. Contando los datos organizados.75 veces la distancia entre ellos. El procedimiento para conocerla se describe en el ejemplo 12. y el centil 67 del conjunto de datos: 34 13 41 20 47 26 27 31 34 35 62 35 36 37 38 41 45 47 50 51 53 13 54 56 67 82 13 41 34 47. Por ejemplo si se quiere situar el tercer cuartil. Para ubicar el primer cuartil hay que pasar a 0. entonces P = 75 ya que este cuartil separa el 75% de los datos del restante 25% que queda mayor (ver tabla 16). El número total de datos es n = 30 . es decir que el sexto decil está en la 100 posición 18 más 0. La distancia entre 31 y 34 es 3.25.75*3=2. Ubicación del sexto decil. Ubicación del primer cuartil. • .25=33. Ejemplo 12.75 . la posición 18 le corresponde al valor 41 y la posición 19 al valor 45. Determine los valores correspondientes al sexto decil.6 = 18. un decil o un centil se utiliza la fórmula P L = ( n + 1) .6 . entonces 60 L25 = ( 30 + 1) = 31* 0. Esto es. La primera posición corresponde a 13 y contando siete a la derecha se encuentra el dato 31.Para ubicar un cuartil. Note que la fórmula da la ubicación de la medida más no da la medida en sí. n = 30 y P = 25 . La distancia entre 41 y 45 es 4. luego el primer cuartil es 31+2. decil o centil que se quiere ubicar y toma el valor del porcentaje menor que la medida separa. Lo primero que se hace es organizar los datos de menor a mayor: 13 13 13 20 26 27 31 34 34 34 35 35 36 37 38 41 41 41 45 47 47 47 50 51 53 54 56 62 67 82. El primer cuartil se encuentra entonces entre el dato 31 y 34. Solución.25 = 7.75. donde n es el total de observaciones y P puede ser el 100 cuartil. entonces 25 L25 = ( 30 + 1) = 31*0.75 a la derecha. por lo que 0. • No necesariamente la medida que se encuentra debe pertenecer al conjunto de datos. esto significa que el primer cuartil está en 100 la posición 7. se localiza la posición 7 y se desplaza 0.75 de la distancia entre estos valores. luego el sexto decil es 41+0. n = 30 y P = 60 .4. INTERPRETACIÓN Y USOS DE LA DESVIACIÓN ESTÁNDAR. es claro que la distancia entre estos valores es cero. • Si alguna de estas medidas da un resultado entero. En al posición 20 está 47 y en la posición 21 también está 47.7.77=47. Polígono de frecuencias con 7 clases.Ubicación del centil 67.67 = 20. Si se aumenta el número de clases a 14. se obtendrá un polígono como se muestra en la figura 12. Es decir cuando dos datos consecutivos son iguales. o sea que el centil 67 está en la posición 100 20. entonces 67 L25 = ( 30 + 1) = 31* 0. como se muestra en la figura 11 Figura 11.77. Si se tiene un polígono de frecuencias con 7 clases. la medida es el valor repetido. significa que ella está ubicada en un dato exacto que pertenece al conjunto. . luego el centil 67 es 47+0*0.77 . n = 30 y P = 67 . 8. Polígono de frecuencias con infinitas clases. entonces el polígono de frecuencia se convierte en una curva continua. como se muestra en la figura 13. Si el polígono se doblara por la mitad. Dentro de los polígonos de frecuencia de curva suave se destaca el de la distribución de frecuencia tipo campana o también llamada distribución simétrica. En una distribución de este tipo la moda. Polígono de frecuencias con 14 clases. Si el número de clases crece hasta el infinito. ambas parteas coincidirían. Figura 13.Figura 12. Se nota que al aumentar el número de frecuencias. lo cual significa que la distribución tiene la misma forma en ambos lados del eje central. la . el polígono tiende a ser una curva suave. Cuando una distribución de frecuencias de curva suave no es distribuida simétricamente.mediana y la media están en el eje de simetría. media y mediana. distribuciones con simetría positiva y negativa así como también las posiciones de las medidas de tendencia central moda. La asimetría puede se positiva o negativa. Desde el punto de vista gráfico una distribución con simetría positiva. Distribución de frecuencias con simetría positiva y ubicación de las medidas de tendencia central. Las figuras 15 y 16 muestran. Una asimetría negativa significa que la mayoría de los datos están hacia el lado izquierdo. Distribución de frecuencias simétrica o de campana. está inclinada hacia la derecha y una distribución con simetría negativa está inclinada a la izquierda. Figura 15. Moda=Media=Mediana Figura 14. La figura 14 muestra una distribución de frecuencias simétrica. . se dice que el conjunto de datos es asimétrico o sesgado. respectivamente. Una asimetría positiva significa que la mayoría de los datos están a la derecha de la línea central. la desviación estándar es de 20. entonces los datos se encuentran muy dispersos respecto a la media.1.7. Distribución de frecuencias con simetría negativa y ubicación de las medidas de tendencia central. Por tanto al aplicar la fórmula del teorema de Chebyshev. El diagrama de la figura 17 muestra que el número de desviaciones estándar que hay entre los valores 200 y 400 es de 10. Aquí. 8. ¿al menos qué porcentaje de los datos se encuentra entre 200 y 400? Solución. entonces se dice que los datos no están muy dispersos respecto a la media y si la desviación es relativamente grande. se tiene que el porcentaje mínimo . Ejemplo 13. El teorema de Chebyshev permite calcular la proporción mínima de los valores que se encuentran en un mínimo de desviaciones estándar. Teorema de Chebyshev. Esta regla se aplica sin importar el tipo o forma de la distribución. De acuerdo al teorema de Chebyshev.Figura 16. este es el valor de k . La media de un conjunto de observaciones muestrales es de 300. la desviación estándar es s = 20 . Cuando en una distribución de frecuencias o en conjunto de datos la desviación estándar es pequeña. Este teorema se enuncia: Para un conjunto cualquiera de observaciones (muestra o población) la proporción mínima de los valores que se encuentran dentro de k 1 desviaciones estándar desde la media es por lo menos 1 − 2 donde k es k un número real fijo mayor que 1. de datos que están entre estos valores es 1 − 1 1 1 = 1− 2 = 1− = 0. • Aproximadamente el 68% de las observaciones están entre más o menos una desviación estándar desde la media. Esquema de la posición de la media y el número de desviaciones estándar que hay entre los datos 200 y 400. Regla empírica. • Aproximadamente el 95% de las observaciones están entre más o menos dos desviaciones estándar desde la media.99 . • Casi todas las observaciones (99. 8.5 centímetros. El teorema de Chebyshev se aplica a cualquier tipo de distribución de frecuencias. Utilizando la regla empírica indique: • Aproximadamente. Ejemplo 14. el porcentaje de datos y la desviación estándar. Distribución de frecuencias de tipo campana con las relaciones entre la media. ¿entre qué datos está el 68% de los tamaños? .2. Una muestra de tamaños de pollos de un galpón sigue aproximadamente una distribución de frecuencias de tipo campana. La media de dichos tamaños es de 20 centímetros y la desviación estándar de 1.7.7%) se encuentran entre más o menos tres desviaciones estándar desde la media. Figura 17. Pero para distribuciones de frecuencia tipo campana existe la regla empírica que da mucha más precisión. La figura 18 ilustra esta regla. es 2 k 10 100 decir el99%. Esta regla empírica dice: En una distribución de frecuencias simétrica tipo campana. Figura 18. es decir el cociente entre X la desviación estándar y la media aritmética. ¿entre qué datos está la totalidad de los tamaños? Solución.5 y 20 + 1. es decir entre 20 − 3*1.7%) está entre X − 3s y X + 3s . sino entonces el que tenga mayor coeficiente de variación estará más disperso que el otro conjunto. si en un conjunto hay edades y en el otro hay salarios? A fin de realizar una comparación significativa de las distribuciones de edades y salarios. La medida que permite hacerlo se llama coeficiente de s variación CV y se define como CV = __ *100% . es decir entre 20 − 2*1.5 = 21. . Por ejemplo.• Aproximadamente. __ __ X − 1s y X + 1s . Se utiliza para comparar las medidas de dispersión de dos conjuntos de datos que: • Tengan unidades diferentes.5 = 18. entonces los datos están igualmente dispersos. ¿Cómo se podrá saber que conjunto de datos está más disperso. Si los coeficientes son iguales. DISPERSIÓN RELATIVA. ¿entre qué datos está el 95% de los tamaños? • Aproximadamente.5 = 15.5 . si se tiene que la media de las edades de un grupo de personas es de 40 años con una desviación estándar de 5 años.5 = 17 y 20 + 2 *1.8.5 = 23 .5 y 20 + 3*1.5 . pero los valores medios están muy distantes. 8. __ __ • Casi la totalidad de los datos (99. por otro lado se cuenta con una muestra de salarios de una empresa cuya media es $500000 con una desviación estándar de $150000.5 = 24. • Tengan las mismas unidades. es decir entre __ __ • El 95% de los datos está entre X − 2 s y X + 2 s . Se calcula el coeficiente de variación en los dos conjuntos de datos y se comparan. • El 68% de los datos está entre 20 − 1. es necesario convertir estas medidas a términos relativos. con un nuevo medicamento. Una empresa automovilística ha realizado un control de potencia sobre los 1000 motores diesel que se han fabricado a lo largo del mes de noviembre del año 2004 obteniendo la siguiente tabla: Potencia en CV Frecuencias 0 – 50 50 . CV = __ *100% = *100% = 12. durante 5 días a un grupo de pacientes. 40 X s 150000 • Para el conjunto de salarios.Para el ejemplo propuesto. Moda. En un centro hospitalario se ha tratado. el porcentaje de pacientes que sienten mejoría con el medicamento en todos los días del tratamiento.5% . 9. 9.1. Todos ellos padecen de dolor de cabeza crónico. indicar cuál sería el que mejor representaría los datos. Media geométrica. CV = __ *100% = *100% = 30% 500000 X Luego el conjunto de salarios se encuentra más disperso respecto a su media que el conjunto de edades. y Mediana). EJERCICIOS DE LA UNIDAD. 9.2. • ¿Por qué no se calcula el coeficiente de variación para ver la representatividad de la media? ¿Habría que hallarlo?. Se realiza un estudio sobre el número de días que un paciente siente mejoría con el anterior medicamento obteniendo la tabla: Valores xi Frecuencias fi 0 1 2 3 4 5 100 250 300 500 450 2000 • Realizando el gráfico adecuado y hallando los promedios (Media aritmética. los coeficientes de variación son: s 5 • Para el conjunto de edades. (Conteste razonadamente y con el mayor detalle posible) • Calcule también. • En la especificación técnica del motor se indica que tiene una potencia mínima de 55 CV. Este estudio aporta la siguiente tabla: Intervalos Frecuencias 0–5 5 – 10 10 – 20 20 . Para el ejercicio anterior los motores con menos de 55 CV se apartan de los demás y se estudia el número de piezas defectuosa que han motivado la pérdida global de potencia. Calcule la moda.70 200 400 300 Más de 70 50 • Represente gráficamente el histograma de frecuencias.50 – 60 60 . obteniéndose la siguiente tabla: • • • Valores xi Frecuencias fi 1 2 3 4 40 30 20 10 ¿La media geométrica y la media aritmética guardan alguna relación de orden? Calcule estás medias y compruébelo.50 50 – 100 100000 110000 160000 100000 30000 . • Calcule la potencia mediana de los motores. Hallar el porcentaje de motores con una potencia mayor que está (Nota: Realizarlo por Cuartiles) • Estudiar la representatividad de la media aritmética. 9. Represente gráficamente los distribución de frecuencias de la tabla. Se ha realizado una estadística en un centro comercial sobre los gastos (en miles de pesos) que una familia tiene cuando realiza sus compras un día cualquiera de la semana. ¿Sería representativa? 9.3.65 65 .4. se tendría que estudiar su procedencia antes de continuar el estudio? • Halle los ingresos que en ese día tuvo el centro comercial y el gasto medio.40 • • • • Determine Determine Determine Determine Número de jugadores 9 30 25 15 5 2 la desviación estándar. los deciles D3 y D7. . o bien.500 pesos.5. ¿Qué significado tiene? • Estudie la representatividad del gasto medio.35 35 . ¿Es representativa? ¿ Por qué? 9. Hallar el número de regalos que realiza el centro comercial. • Si a todas las familias que gastan más de 40. así como el porcentaje de clientes que se benefician de ellos.30 30 . modal y mediano de cada familia.000 pesos. A la pregunta realizada a jugadores de ajedrez sobre el número de horas que deben prepararse antes de un torneo se obtuvo la siguiente distribución de frecuencias: Horas de preparación 10 – 15 15 – 20 20 – 25 25 . se les obsequia una bolsa de deporte o una cafetera. los cuartiles Q1 y Q2. los centiles C35 y C21. (Nota: utilizar percentiles ) • Halle el primer cuartil. mediana y moda.• ¿Cuál es el motivo por el que los datos se presentan en intervalos? • ¿Son coherentes los datos de la tabla. ambas valoradas en 2. Es claro que la toma de decisiones implica una cierta incertidumbre. La palabra aleatorio proviene del vocablo alea. empírico y subjetivo. • Describir los diferentes enfoques de la probabilidad: clásico. INTRODUCCIÓN. el cual significa suerte o azar. permutación. • Aplicar de manera correcta el teorema de Bayes. resultado. • Diferenciar los conceptos de probabilidad conjunta y probabilidad condicional. La atención se fija ahora en la estadística inferencial. Esta rama de la estadística se encarga de obtener conclusiones de una población a partir de una muestra. OBJETIVOS ESPECÍFICOS. Es por ello que la teoría de las probabilidades constituye la base fundamental para la estadística inferencial. suceso o acontecimiento significan lo mismo y más adelante se definirá. cómo organizar los datos de una muestra o población y que tanto estaban dispersos respecto a una medida de tendencia central. Esta se ocupa del estudio de la posibilidad de que algo ocurra en el futuro. La palabra evento. OBJETIVO GENERAL. combinación. • Calcular probabilidades en problemas típicos. Un fenómeno aleatorio es aquél cuyo resultado está fuera de control y que depende del azar. no se sabe si la decisión es la correcta. • Saber construir un diagrama de árbol como ayuda para l cálculo e las probabilidades. • Aplicar correctamente las técnicas de conteo. es decir. • Definir el concepto de probabilidad. • Interpretar en forma correcta los términos: espacio muestral. experimento. es decir. pero si se puede saber la probabilidad que resulte confiable tal decisión. 1.UNIDAD IV PROBABILIDADES. Aplicar los conceptos de probabilidad en la estadística inferencial. evento o suceso. . En las unidades precedentes se trató sobre la estadística descriptiva. La teoría de probabilidad es una teoría muy intricada y desarrollada para describir los sucesos aleatorios. Qué tanta incertidumbre se tiene respecto a un fenómeno constituye la probabilidad de ocurrencia de un evento. La intersección es otro evento: E4= E1 ∩ E2: la pelota impacta en el travesaño y marca gol.2. está fuera de control. Los experimentos aleatorios cumplen las siguientes características: • Se puede repetir las veces que el experimentador requiera. Otro experimento puede ser: el jugador de fútbol X ejecuta un tiro penal. DEFINICIONES PREVIAS.1. La unión de estos eventos es un evento: E3= E1 ∪ E2: la pelota impacta en el travesaño o marca gol. Es un proceso que conduce a que ocurra una y sólo una de varias observaciones posibles. o sea. En el experimento “se lanza un dado” se pueden tener los siguientes eventos: E1: que se obtenga un número par. depende del azar. . Para el jugador que ejecuta el penal. otro puede ser: E2: la pelota impacta en el travesaño. un evento puede ser: E1: marca el gol. es decir está sujeto a repetición. Se puede definir como el conjunto de uno o más resultados de un experimento. 2. • Se observa en él un patrón de regularidad que se hace más evidente a medida que aumentan las repeticiones. Evento. las observaciones posibles son “que anote el gol” y “que erre el gol”. E3: que se obtenga un número par mayor que 2. Para poder adelantarse al concepto de probabilidad se hace necesario definir algunos conceptos importantes: 2. Un evento está relacionado con el azar. E3: que se obtenga un número impar. • Su resultado es incierto. su ocurrencia depende exclusivamente de este. Experimento. es casi siempre una actividad imaginaria. El experimento relativo a la probabilidad no es algo que se hace en el laboratorio. Lanzar una moneda al aire es un experimento y las observaciones posibles son “que salga cara” y “que salga sello”. E2: que se obtenga un 2. • Se puede anticipar la totalidad de los resultados posibles. es por esto que algunas veces se le conoce como evento aleatorio. es decir.2. en el ejemplo del lanzamiento del dado.1. Estos eventos derivados de los cuatro primitivos hacen parte. Los elementos del espacio muestral son eventos. En el ejemplo del párrafo anterior E1 y E3 son mutuamente excluyentes. La forma en que se defina un espacio muestral de un experimento dependerá del problema que se enfrente. aparte de estos cuatro eventos uniones o intersecciones de ellos. E 2} . son eventos que no pueden ocurrir simultáneamente. Son eventos en que la ocurrencia de uno implica la no ocurrencia de los otros. en forma tácita. 2. por ejemplo: E5= E1 ∪ E4: que el bebé sea de sexo masculino o que sea moreno. Es decir que se pueden utilizar diferentes espacios muestrales para un experimento. si el experimento consiste en el nacimiento de un bebé. si en el experimento del nacimiento del bebé. E 2. E 4} .2. sólo nos interesa saber si es de sexo masculino o de sexo femenino. El espacio muestral para este experimento es S1 = { E1. E 3. Eventos mutuamente excluyentes. E4: que el bebé sea moreno. E6= E2 ∩ E3: que el bebé sea de sexo femenino y que sea rubio. . es decir. pero E1 y E2 no lo son. Por ejemplo.3.Y se pueden describir una infinidad de eventos. Es un conjunto universal que enmarca todas las posibles ocurrencias de un experimento aleatorio. del espacio muestral S y no se describen explícitamente sólo por comodidad. En este ejemplo el espacio muestral contiene. E3: que el bebé sea rubio. Espacio muestral. cuatro eventos podrían ser: E1: que el bebé sea de sexo masculino. entonces se utilizaría el espacio muestral S2 = { E1. E1 y E2 pueden suceder al tiempo. así por ejemplo. es decir. se puede obtener un 2 y este es un número par. Generalmente el espacio muestral se denota por la letra S . ya que con un dado no se puede obtener un número par y simultáneamente un número impar. Los eventos E1 y E3 no pueden ocurrir simultáneamente. 2. Es posible que dos eventos sucedan al tiempo. E2: que el bebé sea de sexo femenino. Si la probabilidad es 0. la probabilidad de que suceda es 1. si es 1. por tanto la probabilidad de que suceda es 0. se acostumbra a considerar la probabilidad de un evento como un número.7% . entonces el evento es imposible. o . 4. ¿cuál es la probabilidad de que una persona muera? Como es un evento seguro. La figura 19 muestra un diagrama que esquematiza los puntos de vista de la probabilidad. entonces 0 ≤ P ≤ 1 . 0. Este número puede ser calculado de acuerdo con la proporción de casos favorables o de veces que ocurrió un evento en un tiempo determinado. Si se denota la probabilidad de un evento con la letra P .1. Puntos de vista de la probabilidad. tal como 0. Y ¿cuál es la probabilidad de que un hombre salga embarazado? Hasta lo que va del desarrollo de la ciencia parece que esto es imposible.40 o 0. De igual manera se puede expresar en 3 5 10 porcentaje así como 15% . que a su vez puede ser clásico o empírico. 4. Una probabilidad se puede expresar como una fracción decimal. entonces el evento es seguro. Por ejemplo.134. Figura 19. Probabilidad objetiva. DEFINICIÓN DE PROBABILIDAD DE UN EVENTO.23. El análisis de las probabilidades se puede hacer desde distintos puntos de vista: desde el punto de vista objetivo. De manera intuitiva.3. . La probabilidad es un número entre cero y uno. También se puede expresar como un número 2 1 3 racional tal como . 82% o 23. PUNTOS DE VISTA DE LA PROBABILIDAD. y desde el punto de vista subjetivo. inclusive que describe la posibilidad relativa de que ocurra un evento. La probabilidad es un concepto abstracto que se usa para describir el grado de incertidumbre de un evento. ¿Cuál es la probabilidad de que enceste el próximo tiro?. Ejemplo 13. Según el espacio muestral hay 6 resultados posibles y hay 2 resultados 2 1 favorables al evento ( 4 y 6). Se lanza un dado. por ejemplo. Número total de observaciones Ejemplo 14. no se puede saber en qué lanzamiento sucederá el evento. No se puede garantizar lo que sucederá en un momento específico. Luego. Experimento: Lanzar un tiro. 6 3 Si se escribiera esta probabilidad en términos decimales sería P ( E ) = 0.1.33% . Un jugador de baloncesto ha ejecutado 15 tiros.333 y en términos porcentuales.5. puede que sea en el primer lanzamiento o en el cuarto. de las cuales ha encestado 10 veces. pero lo que si se puede decir es que cuanto más repeticiones se hagan. Se basa en la consideración de que todos los resultados de un experimento son igualmente posibles. La fórmula par calcular este tipo de probabilidad es: Número de veces en que ocurrió el evento en el pasado . 6} . 4. donde P ( E ) es la probabilidad Número de resultados posibles de que ocurra el evento E. El evento es E: “que se obtenga un número par mayor o igual a 4” El espacio muestral es: S = {1.2. P ( E ) = = .3. Evento E2: que no enceste.4. Este número se puede interpretar como: de cada 100 veces que realice el experimento. 2. Se basa en las frecuencias relativas de eventos que han sucedido en un tiempo pasado determinado.1. . 4. P ( E ) = 33. Probabilidad empírica. aproximadamente el 33% de esas veces se obtendrá un número par mayor o igual a 4. La fórmula para el cálculo de esta probabilidad es: Número de resultados a favor del evento P( E ) = . Se calcula observando el número de veces en que el evento ocurrió en un tiempo determinado.1 Probabilidad Clásica. ¿cuál es la probabilidad de que se obtenga un número par mayor o igual a 4? El experimento es: “se lanza un dado”. ¿cuál es la probabilidad de que no enceste? P( E ) = Solución. Evento E1: que enceste. la proporción de aciertos estará más cercana del 33%. Si E1 y E2 son eventos (no importa si son o no mutuamente excluyentes) entonces la probabilidad de que ocurra E1 o E2 está dada por la fórmula: P ( E1 ∪ E 2) = P ( E1) + P ( E 2) − P ( E1 ∩ E 2) . Si los eventos fueran mutuamente excluyentes. 15 15 Note que los eventos E1 y E2 son mutuamente excluyentes y la suma de sus probabilidades es 1. E 2} . 4. El evento E1 ocurrió 10 veces en el pasado y el evento E2 ocurrió 5 veces.8. el deportista tiene una efectividad del 67%. pues es un valor que se asigna de acuerdo a lo que se piensa. Se utilizan los símbolos de unión ( ∪ ) e intersección ( ∩ ) porque los eventos son conjuntos. Por todo lo anterior no existe una fórmula para calcular la probabilidad subjetiva.33 . es decir. Según el espacio muestral hay 2 resultados posibles. 5. O dicho de otro modo. podría ser. El número total de observaciones es 15. Este es un valor que es asignado por un aficionado poco optimista. . intuición u otras subjetividades. La unión se refiere a la disyunción (o) y la intersección a la conjunción (y).67 y P ( E 2) = = 0. Estas probabilidades se pueden interpretar como evaluaciones personales o subjetivas. Muy seguramente este es un valor asignado por un buen estudiante que además es optimista. 5. Se asignan de acuerdo a cualquier información que se disponga con base en suposiciones razonadas. REGLAS DE PROBABILIDAD. Regla de la adición. entonces no pueden suceder al mismo tiempo.Espacio muestral: S = { E1. Las reglas de la probabilidad son fórmulas que se aplican a eventos que son y no son mutuamente excluyentes. Por tanto: 10 5 P ( E1) = = 0.1.2. Las probabilidades calculadas se interpretan: En los lanzamientos del jugador el 67% de las veces encesta y el 33% de las veces falla. no podría ocurrir E1 y E2. Ejemplos de este tipo de probabilidad son: • La probabilidad de que la selección colombiana de fútbol pase al mundial de Alemania 2006 es 0.3. Probabilidad subjetiva.0 es 0. por tanto la probabilidad P ( E1 ∩ E 2) = 0 y la fórmula de la adición quedaría P ( E1 ∪ E 2) = P ( E1) + P ( E 2) . • La probabilidad de que la nota definitiva de la materia Estadística sea 5. Los porcentajes asignados a las intersecciones de cada evento. Si se asignan los eventos: E1: Viaja a Santamarta.La regla de la adición se puede escribir para tres eventos. • E1 ∩ E2 ∩ E3: A Santamarta. • E1 ∩ E3: A Santamarta y Barranquilla viaja el 35%. • E2: Sólo a Cartagena viaja el 45%. • E3: Sólo a Barranquilla viaja el 5%. ¿Cuál es la probabilidad de que un vacacionista visite al menos una de estas ciudades? Solución. Porcentaje de los viajeros del interior que visitan las ciudades de Cartagena. así: P ( E1 ∪ E 2 ∪ E 3) = P ( E1) + P ( E 2) + P ( E 3) − P ( E1 ∩ E 2) − P ( E1 ∩ E 3) − P ( E 2 ∩ E 3) − P ( E1 ∩ E 2 ∩ E 3) Ejemplo 15. según la gráfica de la figura 20. 50% van a Santamarta. Figura 20. . Cartagena y Barranquilla viaja el 0%. Un estudio en el país reveló que las personas del interior que hacen turismo el 45% van Cartagena. E2: Viaja a Cartagena. E3: Viaja a Barranquilla. Barranquilla y Santamarta. 40% viajan a Barranquilla y el 35% van a Barranquilla y Santamarta. • E2 ∩ E3: A Cartagena y Barranquilla viaja el 0%. son: • E1 ∩ E2: A Santamarta y Cartagena viaja el 0%. La gráfica de la figura 20 ilustra la situación de este ejemplo. • E1: Sólo a Santamarta viaja el 15%. Se simbolizan P ( A / B ) y se leen: ”la probabilidad de que se dé el evento A dado que B ocurrió.. Suponga que el teclado sólo tiene 27 teclas correspondientes a cada letra del abecedario y que el simio sólo oprime una tecla a la vez.. E 3 . Al aplicar la regla de la adición para tres eventos.P ( En) Para dos eventos dependientes se enuncia: P ( E1 ∩ E 2) = P ( E1 / E 2). ∩ En) = P ( E1). 5... E3: Que escriba R.P ( E 3 / E 2. en algunas ocasiones la aparición de un evento puede influir o no en la aparición de otro.. . Cuando la aparición de un evento influye en la probabilidad del otro.. es decir. en caso contrario se dice que los eventos son independientes. se dice que los dos eventos son dependientes..05 − 0 − 0.. E 2.. A veces la probabilidad de un evento determinado depende de que otro evento se halla producido o no con anterioridad. Es decir. Regla de la Multiplicación. o bien que el otro se haga más o menos probable.45 + 0.3 Es decir que de cada 100 personas.. ∩ En) = P( En / En − 1.…. E 3. 30 visitan por lo menos una de estas ciudades. tenemos: P ( E1 ∪ E 2 ∪ E 3) = P ( E1) + P ( E 2) + P ( E 3) − P ( E1 ∩ E 2) − P ( E1 ∩ E 3) − P ( E 2 ∩ E 3) − P ( E1 ∩ E 2 ∩ E 3) = 0. Las probabilidades de eventos dependientes se les conoce como probabilidades condicionadas. Al generalizar para n eventos dependientes: P ( E1 ∩ E 2 ∩ E 3 ∩ .Se pregunta por la probabilidad de visitar al menos una de estas ciudades. P ( E1 ∪ E 2 ∪ E 3) .P ( E 2)..P ( E 3).15 + 0. Hay 6 evento los cuales son: E1: Que escriba G.P ( E 2) .2. Y en general para n eventos independientes P ( E1 ∩ E 2 ∩ E 3 ∩ ....P ( E 2) . E2: Que escriba O. E1).. E4: Que escriba I. La regla de la multiplicación para dos eventos independientes se enuncia: P ( E1 ∩ E 2) = P ( E1). E1) P ( E 2 / E1) P ( E1) El primer miembro de la derecha se lee: “la probabilidad de que ocurra el evento En .35 − 0 − 0 = 0. dado que ocurrieron En − 1 . Un gorila sentado frente a un computador escribe una palabra de 6 letras. E 2 y E1 ” Ejemplo 16. ¿Cuál es la probabilidad de que el gorila escriba GORILA? Solución.. P ( E 3 / E1. . E 3. 5. . es decir que no ocurra E1.P (E1). . 36 La probabilidad del evento E1 es: P ( E1) = = 0. E 2.P ( E 6 / E 5. De 45 estudiantes que asisten a una clase. E6: Que escriba A. así el evento “que escriba O” está afectado por el evento “que escriba G” para poder escribir correctamente. E 3. E 2). E 2.8=0. 27 27 27 27 27 27 27 Como se ve es una probabilidad muy pequeña. E 3) P ( E 5 / E 4. Ejemplo 17. Estos eventos son dependientes. E1) 1 Donde P ( E1) = .E5: Que escriba L. Entonces 1 1 1 1 1 1 1 P ( E1 ∩ E 2 ∩ E 3 ∩ E 4 ∩ E 5 ∩ E 6) = . Los eventos que intervienen son: E1: El estudiante llega tarde. Y todas las 27 probabilidades en la fórmula tienen el mismo valor. que según la regla de la regla de la multiplicación para eventos dependientes se tiene: P ( E1 ∩ E 2 ∩ E 3 ∩ E 4 ∩ E 5 ∩ E 6) = P ( E1). E 2. 36 llegan tarde. Regla del complemento. es decir puede digitar 1 de 27 teclas. La probabilidad que se pregunta es P ( E1 ∩ E 2 ∩ E 3 ∩ E 4 ∩ E 5 ∩ E 6) . P (E1) + P (~ E1) = 1 y despejando se tiene: P (E1) = 1 . porque la probabilidad de que ocurra uno influye en la de los demás.P (~ E1) o también P (~ E1) = 1 .P ( E 2 / E1). Si P (E1) es la probabilidad del evento E1 y P (~ E1) es el complemento de E1. ~ E1: El estudiante no llega tarde (llega temprano).3.P ( E 4 / E1. E1). E 4. Por tanto no es tan probable que un gorila escriba gorila frente a un computador. Por la regla del 45 complemento se obtiene que la probabilidad de un estudiante llegue temprano es P (~E1)=1-P(E1)=1-0. . = 6 = 2. ¿Cuál es la probabilidad de que un estudiante llegue temprano? Solución.59 * 10 − 9 .8 . casi cero. La regla del complemento se utiliza para determinar la probabilidad de que ocurra un evento restando del número 1 la probabilidad de que un evento no ocurra.2 . Para responder a estas preguntas se construye el diagrama de árbol de la figura 23. Cn .. An .. Evento A y segmento que representa su probabilidad...... A2 . B3 . Bn que se realizan después de ocurrir A1 . ¿Cuál es la probabilidad de sacar una balota negra? Solución. Se lanza una moneda al aire.09 .. Figura 21. Ejemplo 18.6. por lo que la suma de las probabilidades en cada rama tendrá que ser igual a uno. La urna A1 contiene 10 balotas negras y 5 blancas.. C3 . cada rama parte de un vértice que representa un evento aleatorio diferente y la probabilidad de cada evento diferente se anota sobre la rama que precede a cada evento de la manera en que se indica en la figura 21. Un árbol es un gráfico que está constituido por vértices y ramas. así de manera sucesiva pueden ocurrir eventos después de cualquiera de ellos. luego para el 1 1 2 1 1 4 1 1 2 1 1 5 1 1 1 5 caso se tiene: P = * * + * * + * * + * * = + + + = 0. A3 . la urna A2 contiene 8 balotas negras y 6 blancas. C2 . Si cae sello se saca una balota de una urna A3 o A4. DIAGRAMAS DE ÁRBOL. En el esquema que se presenta en la figura 22 se observa que la ramas principales empiezan en el espacio muestral S y terminan en diferentes eventos que son: A1 .. La siguiente rama termina en eventos distintos. B1 . se saca una balota de una urna A1 o A2 . Si se obtiene cara. 2 2 3 2 2 7 2 2 9 2 2 14 6 7 18 56 .. la urna A3 contiene 7 balotas negras y 2 blancas y la urna A4 contiene 9 balotas negras y 5 blancas. Después del evento An ocurren los eventos C1 . También se observa que cada evento forma un universo para los eventos siguientes.. Cálculo de la probabilidad de sacar una balota negra: Se escogen todas las ramas que conducen a la balota negra y se suman . B2 . Es un instrumento útil dentro de las probabilidades condicionales pues permiten analizar la problemática de los eventos cuando estos ocurren uno después del otro. Figura 22. Diagrama de árbol correspondiente al ejemplo 18. Diagrama de árbol con un espacio muestral S. Figura 23. n ramas secundarias. n ramas principales por cada rama principal n. . Figura 24.….…. La figura 25 ilustra esta regla. ∪ En = S y además Ei ∩ Ej ≠ φ .E3. en términos matemáticos si E1 ∪ E 2 ∪ E 3 ∪ . entonces para cualquier otro suceso B se cumple que P ( B ) = P ( B / E1) P ( E1) + P ( B / E 2) P ( E 2) + P ( B / E 3) P ( E 3) + .. P ( Ei ) ≠ 0. La regla de la probabilidad total establece que si un conjunto de eventos Ei forman una partición del espacio muestral S y si la probabilidad de cada uno de estos eventos es diferente de ceros..E3. .En y el evento cualquiera B. es decir. compuesta por los eventos E1... Partición del espacio muestral S.7. Figura 25.E2. para todo Ei . compuesta por los eventos E1. La figura 24 esquematiza una partición. Se llama partición a un conjunto de sucesos Ei mutuamente excluyentes de tal manera que la unión de todos ellos sea el espacio muestral S.En. + P ( B / En) P ( En) .E2. Partición del espacio muestral S. REGLA DE LA PROBABILIDAD TOTAL. La distribución de los estudiantes por carrera es: Economía 28%. La figura 26 muestra los eventos correspondientes para este ejemplo. B = B ∩ S .. es decir.. Figura 26.. Derecho. Ejemplo 19. + P ( B / En) P ( En) que es la fórmula de la probabilidad total. Derecho 20%. S = E1 ∪ E 2 ∪ E 3 ∪ . por consiguiente de la regla de la adición se tiene: P( B) = P(B ∩ E1) + P(B ∩ E 2 ) + P(B ∩ E 3) + ...Demostración: El evento B es la intersección de él con el espacio muestral.. entonces los eventos B ∩ Ei también lo son.. pero el espacio muestral S es la unión de todos los evento mutuamente excluyentes Ei . luego P( B) = P((B ∩ E1) ∪ (B ∩ E 2) ∪ (B ∩ E 3) ∪ . Según un estudio acerca de las deserciones se descubrió que el porcentaje de estudiantes que finalizan sus estudios son.. ¿cuál es la probabilidad de que un estudiante elegido al azar termine sus estudios? Solución. o sea.. Los eventos son: . Como los eventos Ei son mutuamente excluyentes. ∪ (B ∩ En ) . Si se supone que el reglamento de la institución no permite que un estudiante curse dos carreras simultáneamente. Eventos mutuamente excluyentes para el ejemplo 19. ∪ En . ∪ En ) = (B ∩ E1) ∪ (B ∩ E 2) ∪ (B ∩ E 3) ∪ .. ∪ (B ∩ En )) . + P(B ∩ En ) y al aplicar la regla de la multiplicación a cada miembro de la derecha se obtiene P ( B ) = P ( B / E1) P ( E1) + P ( B / E 2) P ( E 2) + P ( B / E 3) P ( E 3) + . por tanto el evento B se puede escribir en términos de los eventos Ei así: B = B ∩ (E1 ∪ E 2 ∪ E 3 ∪ . En una institución de educación se ofrecen cuatro carreras: Economía. Sistemas e Idiomas. en Derecho el 72%.. Sistemas 30% e Idiomas 22%. en Sistemas el 90% y en Idiomas el 40%. respectivamente: en Economía el 85%.. El Teorema de BAYES se aplica en forma inversa al teorema de la probabilidad total. se sabe de antemano que se dio el evento “se cometió un fraude” y se pregunta por los eventos “lo cometió A”. El profesor tuvo que salir y encargó a otra persona a que vigilara el desarrollo del examen. Como se vio en la sección 7.28 . el teorema de la probabilidad total permite conocer la probabilidad de un evento a partir de las probabilidades de otros sucesos. se tiene: P ( B ) = P ( B / E1) P ( E1) + P ( B / E 2) P ( E 2) + P ( B / E 3) P ( E 3) + P ( B / E 4) P ( E 4) donde: P ( B / E1) = 0. Por ejemplo.40 * 0. Cuando el profesor regresa.90 .20 .72 * 0. E4: Estudiar Idiomas.90 * 0.E1: Estudiar Economía. Según la regla de la probabilidad total.28 + 0. Si los eventos Ei constituyen una partición del espacio muestral S y B es un evento tal que su probabilidad no es cero. El teorema de Bayes permite calcular la probabilidad de que suceda un evento sabiendo de antemano que otro evento ocurrió. E3: Estudiar Sistemas.20 + 0. P ( E1) = 0.22 = 0. “lo cometió B” o “lo cometió C”.74 .72 .85 .22 .40 . E2: Estudiar Derecho.30 + 0. TEOREMA DE BAYES. P ( B / E 4) = 0. entonces la probabilidad del evento Ei dado el evento B viene dado por la fórmula: . B y C cometan fraude en un examen. B: Finalizar estudios. P ( B / E 2) = 0. P ( E 3) = 0. Entonces la probabilidad de que un estudiante elegido al azar termine sus estudios es: P ( B ) = 0.85 * 0. P ( E 2) = 0. Como se nota. el vigilante le dice que hubo un examen con fraude. si se conocen las probabilidades de que los estudiantes A.30 y P ( E 4) = 0. 8. ¿Cuál es la probabilidad de que el fraude lo haya cometido el estudiante A? ¿que lo haya cometido el estudiante B? o ¿qué lo haya cometido el estudiante D?. P ( B / E 3) = 0. + P ( En) P ( B / En) P ( Ei ) P ( B / Ei ) mejor P ( Ei / B ) = n . Las probabilidades de que haya accidentes de carros son: • • • Si llueve. se obtiene: P ( Ei ) P ( B / Ei ) P ( E1) P ( B / E1) + P ( E 2) P ( B / E 2) + P ( E 3) P ( B / E 3) + . ahora como la intersección de conjuntos es P( B) P ( B ∩ Ei ) conmutativa. ∑ P( Ei) P( B / Ei) P ( Ei / B ) = o i =1 Ejemplo 20.P ( B ) . Que habrá día soleado: con probabilidad del 50%. Si está soleado. i =1 Demostración: Según la regla de la multiplicación para dos eventos dependientes Ei y B se tiene que P ( Ei ∩ B ) = P ( Ei / B ). la probabilidad es del 30%.P ( Ei / B ) = P ( Ei ) P ( B / Ei ) P ( E1) P ( B / E1) + P ( E 2) P ( B / E 2) + P ( E 3) P ( B / E 3) + . la probabilidad es del 10%. Si está nublado. + P ( En) P ( B / En) donde el denominador es la probabilidad total del evento B. Que habrá día nublado sin lluvia: con probabilidad del 10%. Esta fórmula se puede escribir en forma más compacta. se tiene P ( Ei / B ) = y al aplicar de nuevo la regla P( B) de la multiplicación al numerador y el teorema de la probabilidad total al denominador .. • • • Lloverá: con probabilidad del 40%. Las posibilidades que se informaron son: Solución. .. Al despejar se obtiene que P ( Ei ∩ B ) P ( Ei / B ) = . así: P ( Ei / B ) = P ( Ei ) P ( B / Ei ) n ∑ P( Ei) P( B / Ei) .. la probabilidad es del 3%.. Según un informe del IDEAM sobre las condiciones ambientales del fin de semana en Bucaramanga. E3: Estaba nublado sin lluvia.03 + 0. Si el número de resultados posibles de un experimento es relativamente pequeño. . E2: Estaba soleado. pero por no estar en la ciudad no se supo qué condiciones climáticas había. P ( E 2) = 0. Sean E1y E2 dos eventos mutuamente excluyentes.Se ha dado la noticia de que ocurrió un accidente el sábado. individuos o eventos. P ( E 3) = 0. es decir. resulta fácil contarlos.1 * 0. Principio aditivo de conteo. Si E1 ocurre de m maneras distintas y E2 ocurre de n maneras distintas. P ( B / E 2) = 0.1 de donde se obtiene P ( E1 / B ) = 0.1. 9.5 * 0. por ejemplo al lanzar una moneda al aire hay dos posibilidades y contar hasta dos resulta muy trivial.5.03 y P ( B / E 3) = 0. PRINCIPIOS DE CONTEO. Pero si por ejemplo se quiere contar el número de placas para carros que hay proyectadas en Colombia resultaría muy tedioso. P ( B / E1) = 0. Por tanto si se tuviese técnicas para contar de manera más fácil.82 P ( E1 / B ) = 9.1. B: Hubo un accidente. Esencialmente existen tres fórmulas que permiten facilitar el procedimiento de conteo de grandes cantidades de objetos. el trabajo sería más provechoso. P ( E1 / B ) .4 * 0. ¿Cuál es la probabilidad de que ese sábado haya llovido? Los eventos son: E1: Estaba lloviendo. entonces el número de maneras en que pueden ocurrir ambas es n + m.4. Se pregunta por la probabilidad de que haya llovido dado que hubo un accidente.1 Al aplicar la fórmula del teorema de Bayes se obtiene: P ( E1) P ( B / E1) 0.3 + 0.4 * 0. Todas las demás probabilidades son: P ( E1) = 0.3 = P ( E1) P ( B / E1) + P ( E 2) P ( B / E 2) + P ( E 3) P ( B / E 3) 0.3. v. Si se quiere ir de la ciudad A a la ciudad B existen los caminos r. y t y hay 4 formas para ir de B a C mediante los caminos u. un segundo evento puede ocurrir de m maneras. Principio multiplicativo de conteo. A este principio también se le denomina principio fundamental de conteo. 4 maneras de prepararla en salsa y 2 maneras de prepararla en sopa. entonces hay 3*4=12 maneras para ir de A a C. ya que si la prepara cocida.El ejemplo que ilustra este principio se esquematiza en la figura 27. t. w y x. es decir. El ejemplo que ilustra este principio se muestra en la figura 28. entonces el número de maneras en que ambos. Las formas de preparar la langosta son mutuamente excluyentes. Figura 28. 8 maneras de prepararla al ajillo. Figura 27. hay 5 maneras de ir de A a B. Si un evento E1 puede ocurrir de n maneras e. E1 y E2. independientemente. . que no se pueden recorrer simultáneamente. s. 9. u y v. Caminos posibles para ir de A a C. Caminos posibles para ir de la ciudad A a la ciudad B.2. Ejemplo 21. s. no la prepara al ajillo y así sucesivamente. Si hay tres formas para ir de A a B mediante los caminos r. Él cuenta con varias maneras de prepararla: 3 maneras de prepararla cocida. De acuerdo con el principio aditivo se tienen 3+8+4+2=17 maneras de preparar la langosta. Un chef de un distinguido restaurante quiere preparar una langosta. pueden ocurrir es mn. ¿De cuántas maneras puede el chef preparar su langosta? Solución. 15. Helado manzana. Helado uva.Los caminos en forma explícita son: Aru. Helado 6. Un niño en una fiesta de cumpleaños puede escoger entre tres helados: vainilla. Helado 3. Arv. Helado 8. Atv. Helado 14. de vainilla. de vainilla. Solución. Asv. galleta de chocolate gaseosa sabor a naranja. galleta de leche y gaseosa sabor a uva. de vainilla. galleta de chocolate gaseosa sabor a naranja. de fresa. galleta de leche y gaseosa sabor a manzana. de fresa. Ejemplo 22. Helado 11. Helado 10. de fresa. naranja y manzana. 17. Helado 7. Helado 13. entonces de acuerdo al principio multiplicativo. galleta de leche y gaseosa sabor a uva. Helado naranja. Asx. Atu. galleta de chocolate gaseosa sabor a . de vainilla. puede escoger entre dos tipos de galletas: de leche y de chocolate y además puede escoger entre tres sabores de gaseosa: uva. Arw. 16. Asw. Como un niño no puede tomar más de un helado. Helado naranja. suponiendo que come helado y galleta y toma gaseosa. un niño puede comer de 3x2x3=18 formas de merienda. galleta de chocolate y gaseosa sabor a de ron con pasas. de vainilla. galleta de chocolate y gaseosa sabor a uva. galleta de chocolate y gaseosa sabor a uva. 18. galleta de leche y gaseosa sabor a de ron con pasas. de ron con pasas. de fresa. Helado 9. Helado 4. galleta de chocolate gaseosa sabor a manzana. de fresa. de ron con pasas. Arx. En forma explícita. Helado 2. De cuántas maneras puede un niño escoger su merienda en la fiesta. galleta de leche y gaseosa sabor a manzana. galleta de leche y gaseosa sabor a de ron con pasas. estas formas son: 1. de fresa. Helado 12. galleta de chocolate gaseosa sabor a manzana. galleta o gaseosa. Atw y Atx. galleta de leche y gaseosa sabor a uva. Asu. galleta de leche y gaseosa sabor a naranja. de vainilla. galleta de chocolate gaseosa sabor a de ron con pasas. fresa y ron con pasas. Helado 5. Helado manzana. Se nota entonces que el principio multiplicativo facilita el conteo. galleta de leche y gaseosa sabor a naranja. SAEB. (4 − 4)! 0! 1 4! 4! Permutaciones con grupos de tres letras: 4 P3 = = = 4!= 24 . ESBA. La fórmula para calcular el número de permutaciones que se obtienen al n! escoger r elementos de un conjunto de n elementos es: n Pr = (n − r )! donde el símbolo n Pr se lee “n permutado r”. Por ejemplo. ASEB. B. BSE. BSEA. Si se aplica la fórmula para el ejemplo en consideración. La forma matemática del factorial es n != 1 * 2 * 3 * . 3!= 1 * 2 * 3 = 6 y 4!= 1 * 2 * 3 * 4 = 24 . EBAS y EBSA. se pueden formar las permutaciones: SABE. Note que AABB no es una permutación ya que no se permiten repeticiones. EASB. Note que n != 1 * 2 * 3 * . Si en lugar de tomar todos los elementos del conjunto se hubieran tomado grupos de tres para permutarlos. se tiene: • • • 4! 4! 4! = = = 4!= 24 . ABES. entonces también salen 24 permutaciones: ABE. AES.3. SBE. BAE. ASB. ASBE. E. BEA. Por ejemplo si tomamos las letras S. BESA. ABSE. ESA. El factorial de n se simboliza n ! . (4 − 2)! 2! 2! Permutaciones con las cuatro letras: 4 P4 = . * (n − 1) * n = (n − 1)!*n 9. B y E. SBA. SB. es decir 0!= 1 .. BAS. Existen muchas nomenclaturas diferentes para simbolizar las permutaciones como son: P (n. EAB. AEB. ASE. SEA. SAE. Si se toman grupos de dos elementos del conjunto para permutarlos se formarían 12 permutaciones: AS. Para todo entero no negativo n. su factorial es el producto de todos los enteros entre 1 y n. BS. AB. ABS. Permutaciones. (4 − 3)! 1! 4! 4! 2!*3 * 4 Permutaciones con grupos de dos letras: 4 P2 = = = = 12!.. SEAB. r ) . BA. A. EBA. AE. SEB. Se define el factorial de cero como uno. EBS. ESAB. BAES. * (n − 1) * n . AEBS. EA. SBAE. EAS. EBSA. ESB. SEBA. SAB. BES. BEAS. Pnr (n) r . Si se tomara un solo elemento del conjunto entonces se formarían cuatro permutaciones: S.Antes de definir las permutaciones y combinaciones se hace necesario definir el factorial de un entero no negativo. SBEA. BE. BSAE.. • Factorial de un entero no negativo.. EB. SE y ES. A. Una permutación de un conjunto de objetos es un arreglo en un orden definido y sin repetición de todos o parte de ellos. EABS. SA. Onr entre otras. AESB. BASE. BSA. B y E. Según al fórmula de la permutación. por tanto se puede considerar que hay cinco elementos: 4 carros y un conjunto de 3. Ejemplo 22. SE. . SAE.4. A. SB y EB. el grupo de los tres carros también puede permutar y se sigue cumpliendo la condición de que van juntos. entonces r = n y las permutaciones que se obtendrían son n ! . De nuevo. AB. Unos turistas viajan de vacaciones en una caravana de siete carros. Las combinaciones que se pueden hacer con grupos de 1 letra son 4: S. se obtienen 24x6=144 arreglos de carros en la caravana. A. Se requiere que tres de esos carros específicos siempre vayan juntos en fila. se pueden obtener 3! =6 permutaciones. Figura 29. pues esta es esencialmente igual a BASE y a SEBA pues el orden no es importante. Las combinaciones que se pueden hacer con grupos de 2 letras son 6: AS. AE. ¿Cuántos arreglos de carros son posibles en la caravana? Solución. Por ejemplo con las letras S. el número de permutaciones que se pueden obtener con estos cuatro elementos es 4! =24. Combinaciones. Las combinaciones que se pueden hacer con grupos de 3 letras es 4: SAB. La figura 29 ilustra la situación. pues el orden si era importante. 9. Los arreglos de n elementos donde se toman grupos de r elementos en los cuales el orden no es importante se les llama combinaciones. según la fórmula de las permutaciones. (4 − 1)! 3! 3! Se nota que si se toman todos los elementos para permutarlos. Ahora. ESB y EAB. Caso contrario ocurría en las permutaciones ya que la permutación SABE y BASE eran diferentes. B y E sólo se puede hacer una combinación con los cuatro elementos: SABE. Se considera que los tres carros forman un elemento. Carros que viajan en caravana turística. Ahora de acuerdo con el principio multiplicativo.• Permutaciones con grupos de una letra: 4 P1 = 4! 4! 3!*4 = = = 4. Se trata de combinaciones. 30! 30! 24!*25 * 26 * 27 * 28 * 29 * 30 = = = 593775 formas de sacar 6!(30 − 6)! 6!*24! 1 * 2 * 3 * 4 * 5 * 6 * 24! grupos de 6 cervezas. r ) . 30 cervezas. . ¿Cuál es la probabilidad de que se saquen 6 cervezas. Se deben contar los resultados favorables. Las notaciones más usuales para las combinaciones son: . Suponga que una persona saca 15 botellas. donde el símbolo n Cr se lee “ n combinado r !(n − r )! n r”. r Cnr . es decir. Ejemplo 23. el sicólogo de recursos humanos quiere seleccionar grupos de 5 de un total de 12 aspirantes. 40 • C3 = 4 de 20 gaseosas. Suponga que en un refrigerador hay 20 gaseosas. Para una entrevista de trabajo. ¿Cuántos grupos diferentes puede formar? Solución. 25 botellas con agua y 40 jugos. entre otras. y se pueden sacar: • 6 de 30 cervezas. 3 jugos. 40! 40! 37 !*38 * 39 * 40 = = = 9880 formas de sacar grupos de 3 3!(40 − 3)! 3!*37 ! 1 * 2 * 3 * 37 ! jugos. 12 C5 = 5!(12 − 5)! 5!*7! 5!*7 ! 1* 2 * 3 * 4 * 5 Ejemplo 24. Al aplicar la fórmula de la combinación se obtiene 12! 12! 7!*8 * 9 * 10 * 11 * 12 8 * 9 * 10 * 11 * 12 = = = = 4 * 9 * 2 * 11 = 792 . 4 gaseosas y 2 botellas de agua? Solución. C (n.La fórmula para el cálculo de las combinaciones de r elementos de un n! grupo de n es n Cr = . es decir. es decir. 30 • C6 = 3 de 40 jugos. Claramente se está preguntando por combinaciones pues no se requiere orden de llamado. En una bolsa hay 50 bolas numeradas del 1 al 50.. 15!(115 − 15)! 15!*100! 15!*100! Entonces los casos favorables son:593775+9880+4845+300=608800.1. 10. EJERCICIOS DE LA UNIDAD. Halle la probabilidad de que la suma de los puntos de las caras visibles de un dado que se lanza al azar sea múltiplo de 5. 608800 Por tanto la probabilidad es P = = 2. es decir. 10. b) p(A). c) Sea verde.4. Calcula la probabilidad de que: a) haya al menos una cara.39 * 10 probabilidad extremadamente pequeña. tal que p(A) = 3/8.39 * 1018 . • 25! 25! 23!*24 * 25 = = = 300 formas de sacar grupos de 2 2!(25 − 2)! 2!*23! 1 * 2 * 23! botellas de agua. Determina la probabilidad de que: a) Sea roja. e) Sea roja o verde. Se pide: a) p(A B).20! 20! 16!*17 * 18 * 19 * 20 = = = 4845 formas de sacar grupos 4!(20 − 4)! 4!*16! 1 * 2 * 3 * 4 * 16! de 4 gaseosas. g) Sea roja. d) No sea roja.. no es tan probable que se saquen las botellas como se indica.5 * 10−13 que es una 18 2. Sean A y B dos sucesos aleatorios de un espacio muestral. 10. c) hayan caras o cruces. p(B) = 1/2 y p(A B) = 1/4. 10. 25 C2 = Los casos totales resultan de sacar 15 botellas de 115 que hay en el refrigerador. f) No sea verde. luego los casos totales también es una combinación: 115 C15 = 115! 115! 100!*101 * 102 * 103 * . Se extrae una bola al azar. Se lanzan tres monedas al aire.3. 5 amarillas y 7 verdes. 10. 20 C4 = 2 de 25 botellas de agua. b) hayan al menos dos caras. 10. b) Sea amarilla. Una urna contiene 8 bolas rojas. c) p(B). * 115 = = = 2.2. Es decir.5. a) ¿Cuál es la probabilidad de sacar una bola cuyo número sea múltiplo de 2? b) ¿Y múltiplo de 5? . verde o amarilla. 6.10.7. el 45%. El 60% de los habitantes de una ciudad lee el periódico A. Pasados 30 años hallar: a) Probabilidad de que vivan ambos b) Probabilidad de que sólo viva la mujer c) Probabilidad de que sólo viva el hombre d) Probabilidad de que no viva ninguno de los dos. Calcúlese la probabilidad de que la persona que falte sea: a) hombre. h) persona pelirroja.8. ¿Cuál es la probabilidad de que se moje si sale a la calle sin paraguas? 10. e) hombre moreno o mujer rubia. 10.10. Un día sólo asisten 44. f) hombre rubio o mujer morena. 10. c) hombre rubio. d) mujer morena. el B y el 20% ambos. en Bucaramanga hay una probabilidad 0. En una clase hay 10 alumnas rubias.11. 20 morenas. 5 alumnos rubios y 10 morenos. . 10.6 de que llueva o haga frío y 0.9. a) Halla la probabilidad de que ambas sean rojas. La probabilidad de que un hombre viva dentro de 30 años es de 1/5 y la probabilidad de que su mujer viva transcurridos 30 años es 3/7. 0. Se tiene una urna compuesta por 20 bolas rojas y 15 blancas. b) Halla la probabilidad de que una sea roja y la otra blanca. Según el IDEAM. Se extraen con reemplazo dos bolas al azar. g) hombre o mujer. ¿Qué porcentaje no lee ninguno? 10. b) mujer.1 de que llueva y haga frío. Halle la probabilidad de que al lanzar tres dados se obtenga una suma inferior a 17.4 de que haga frío. DEFINICIÓN. Calcular la varianza. Diferenciar entre distribución de probabilidad discreta y distribución de probabilidad continua.NB. entonces el espacio muestral es: S = {BB. o primero una esfera negra seguida de una negra o blanca. OBJETIVO GENERAL. Para una mejor comprensión de este concepto véase el ejemplo 25. • • • • • 1. pues ayudan mucho en las inferencias y en la toma de decisiones en condiciones de incertidumbre 2. BN . Comprender el concepto de distribución importancia en la estadística inferencial. Ejemplo 25. Definir distribución de probabilidad y variable aleatoria. Dado que se puede sacar una esfera blanca seguida de una negra o una blanca. Una distribución de probabilidad hace referencia a toda una gama de probabilidades de los eventos de en un experimento y muestra que tan probable es un evento futuro. Identificar las distribuciones de probabilidad más comunes. de probabilidad y su OBJETIVOS ESPECÍFICOS. la desviación estándar y la media en una distribución e probabilidad. una distribución que describe cómo se espera que varíen las probabilidades para experimento dado. Se seleccionan al azar dos esferas de una caja donde hay 5 blancas y tres negras ¿Cuál es la distribución de probabilidades de este experimento? Solución. Una distribución de probabilidad es un modelo matemático que organiza los eventos posibles de un experimento y que le asocia su probabilidad correspondiente.UNIDAD V DISTRIBUCIONES DE PROBABILIDAD. relacionado con dicho experimento. Se puede concebir como una distribución teórica de frecuencias. es decir. Aplicar la distribución normal. Los eventos son: . INTRODUCCIÓN. Las distribuciones de frecuencia son modelos de gran utilidad. NN } . Las probabilidades Evento son: P ( E1) = Probabilidad Número de blancas Números de negras 5 2 0 14 15 E2 1 1 56 15 1 1 E3 56 3 E4 0 2 28 Tabla 19. 8 7 56 14 8 7 56 3 5 15 3 2 6 3 P ( E 3) = * = y P ( E 4) = * = = . 5 4 20 5 5 3 15 * = = . E3: Sacar una esfera negra y luego una blanca (NB). Distribución de probabilidades para el ejemplo 25. E2: Sacar una esfera blanca y luego una negra (BN).E1: Sacar una esfera blanca y luego una blanca (BB). Figura 30. Las probabilidades de cada evento se calculan con la ayuda del diagrama de árbol de la figura 30. Al resumir estas probabilidades 8 7 56 8 7 56 28 con sus eventos se obtiene una distribución de probabilidades como se muestra en la tabla 19. Diagrama de árbol para las probabilidades de sacar dos esferas en el ejemplo 25. E1 . E4: Sacar una esfera negra y luego una negra (NN). P ( E 2) = * = . a cada resultado posible de un experimento. que es en sí una distribución de probabilidades. X = 2. Diagrama de Venn para la variable aleatoria que cuenta el número de esferas negras en el ejemplo 25. definir el evento “que salga esfera negra”.Es de notar que la suma de las probabilidades de una distribución de frecuencias es igual a 1. Los eventos de un experimento aleatorio se pueden contar. Evento Probabilidad X 5 0 14 15 BN 1 56 15 NB 1 56 3 NN 2 28 Tabla 20. hay cero esferas negras. Note que la variable aleatoria es una función que asocia un número real. X = 1. 3. BB . hay dos esferas negras. El diagrama de Venn para esta variable aleatoria se puede observar en la figura 31. hay una esfera negra. VARIABLE ALEATORIA. perfectamente definido. Se puede definir una función que cuente los resultados de los eventos posibles de un experimento. es decir. entonces se utiliza la variable aleatoria X así: X = 0. Distribución de probabilidades y variable aleatoria que cuenta las esferas negras en el ejemplo 25. La tabla 19 se puede rescribir para la variable aleatoria en mención para así obtener la tabla 20. Si en el ejemplo 25 se quisiera contar el número de esferas negras. Figura31. Son discretas cuando sólo pueden tomar valores específicos separados. . Las variables aleatorias continuas son las que pueden tomar un valor de una cantidad infinitamente grande de valores.2. Por esta razón es que a las distribuciones de probabilidad se les conoce como funciones de densidad de probabilidad (fdp). Las variables aleatorias pueden ser discretas o continuas. entonces se obtiene una distribución de probabilidad discreta y cuando la variable aleatoria es continua se obtiene una distribución de probabilidad continua. de la primera unidad. 28 De lo anterior se puede deducir que las probabilidades son funciones de las variables aleatorias. por ejemplo. la gráfica de la función de densidad de probabilidad. Esta gráfica se muestra en la figura 32. la probabilidad de que la 3 variable aleatoria X tenga un valor de 2. así P ( X = 2) = . La figura 32 es un ejemplo de una distribución de probabilidad discreta. Para el ejemplo 25 se puede obtener la gráfica de la distribución de frecuencias en función de la variable aleatoria que cuenta las esferas negras. Figura 32. por ejemplo la variable que cuenta el número de caras que se obtienen cuando se lanzan tres monedas al aire. Los conceptos de discreto y continuo se explicaron en el apartado 5. Gráfica de la distribución de probabilidades o función de densidad de probabilidad de la variable aleatoria que cuenta el número de esferas negras en el ejemplo 25. Cuando la variable aleatoria es discreta. Una fdp asocia a cada valor de una variable aleatoria una probabilidad.De la tabla 20 se puede calcular. es decir. La gráfica de esta función se muestra en la figura 33. Hay muchos problemas en que es de interés conocer la probabilidad de que el valor de una variable aleatoria sea menor o igual a un número real a . la distribución geométrica. F ( X ) = P ( X ≤ a ) = ∑ P ( X ) . Existen varios tipos especiales de esta clase de distribuciones tales como la distribución binomial. A esta función se le conoce como función de distribución acumulativa o simplemente función de distribución de la variable aleatoria X. Como se mencionó en un párrafo arriba. Función de distribución acumulativa. Se puede escribir. la probabilidad de que la variable aleatoria X tome valores menores o iguales que a como la función F tal que F ( X ) = P ( X ≤ a ) . por consiguiente.1. DISTRIBUCIÓN DE PROBABILIDAD DISCRETA. Matemáticamente esta función se define por: n Si X es una variable aleatoria discreta. 4. entre otras. X P(X) F(X) 5 5 14 14 35 15 1 56 56 50 15 1 56 56 3 56 2 =1 28 56 Tabla 21. Para el ejemplo 25 la tabla 21 muestra los valores de la función distribución acumulativa de la variable aleatoria X que cuenta el número de esferas negras. función de distribución de la variable aleatoria X que cuenta el número de esferas negras del ejemplo 25.4. la distribución de probabilidad discreta nace de una variable aleatoria discreta. es decir i<a la función de distribución acumulativa es la suma de todas las probabilidades que están por debajo de la probabilidad de que la variable aleatoria tome el valor de a . 0 . la distribución de Poisson. 2. donde x P ( X ) es la probabilidad de que la variable aleatoria X tome un valor entre x real.9 . Media. Es un valor típico que representa a la distribución de probabilidad. Gráfica de la función de distribución de la variable aleatoria X que cuenta el número de esferas negras del ejemplo 25. • La Media. Algunas veces se habla del valor esperado de una variable aleatoria E ( X ) en vez de la media de la distribución. En el caso de las distribuciones de probabilidad la varianza σ 2 se calcula mediante la 2 fórmula σ 2 = ∑ ( X − µ ) P ( X ) . ≈ 0. Como se ha visto en unidades anteriores la Varianza es una medida que muestra la dispersión de los datos. entonces se mira en la gráfica y se suman las probabilidades correspondientes a los valores de la variable aleatoria 50 menor que dos.Figura 33. • La Varianza. en las distribuciones de probabilidad se pueden calcular la media. la desviación estándar y la varianza como medidas de dispersión. Se simboliza por µ y viene dada por: µ = ∑ X P ( X ) . 4. Si se quisiera calcular la probabilidad de que el número de esferas negras sea menor que dos. puesto que en ese valor ya está sumada (acumulada) la probabilidad de X = 0.Es de notar que se toma la 56 probabilidad para X = 1 en la gráfica 33. como una medida de tendencia central. es decir. varianza y desviación estándar de una distribución de probabilidades discreta. Los significados son idénticos. Al igual que en las distribuciones de frecuencias. [ x ] . 42 -16. X (%) P( X ) X −µ ( X − µ )2 40 20 18 15 10 3 0. Es la raíz cuadrada de la varianza. lo que le garantiza una ganancia fija del 15% o hacer un plan de inversión cuya ganancia anual puede considerarse como una variable aleatoria cuyos valores dependen de las condiciones económicas que prevalezcan. Ganancia (%) 40 20 18 15 10 3 Probabilidad 0. se simboliza por σ y viene dada por la fórmula σ = ∑ [( X − µ ) P( X )] .42% de la inversión.5357 10.7057 3.5166 11. tal como aparecen en la tabla 22.42 -9. la ganancia esperada será del 19.0164 19. Un inversionista dispone de 1000 millones de pesos par invertirlos en un año. Cálculo sistematizado de la varianza del ejemplo 26.35 + 15 * 0.18 + 10 * 0.04 = 19. .6164 ( X − µ )2 P ( X ) 63.35 0. Para el cálculo de la desviación estándar y varianza se utiliza.13 + 3 * 0.13 0.58 -1. La media de esta distribución es: µ = 40 * 0.7847 2 σ = 90.42 423. Para la segunda opción se sabe que de acuerdo a un análisis estadístico se pudo determinar los posibles valores de la ganancia y sus probabilidades.0505 0.35 0.15 + 18 * 0.5364 88.18 0.5364 0.42 -4. Solución.42%.5305 0.15 0. Calcule el valor esperado. Él está indeciso y tiene dos opciones: invertir en la bolsa de valores. Ganancias con sus respectivas probabilidades para el segundo plan de inversión. sistemáticamente.04 Tabla 22.04 20. Este valor indica que si se toma la segunda opción se esperaría ganar el 19.15 + 20 * 0. esto es.1237 Tabla 23. la tabla 23.18 0.3364 2. la varianza y la desviación estándar.42% .15 0.• La desviación estándar.15 0.58 0.15 0. 2 x Ejemplo 26.7364 269.13 0. 5. Por ejemplo.Luego la varianza es σ 2 = 90. x n x es el número de éxitos. . • La variable aleatoria debe contar sólo el número de éxitos en una cantidad finita de ensayos. n es el número de cada ensayo y es la x combinatoria ya definida.3. Al lanzar el dado puede salir cara o sello pero no los dos a la vez.49=9.42-9. 0. La distribución de probabilidad o la función de probabilidad (función de densidad de probabilidad) para una distribución binomial viene dada por n n− x P ( X ) = p x (1 − p ) . si en el primer lanzamiento de la moneda se obtiene cara. Una distribución de probabilidades binomial se da cuando la variable aleatoria es binomial. ¿Qué decisión tomaría usted? 4. La distribución binomial. 0. al volver a lanzar la moneda (segundo ensayo) la probabilidad de que se obtuviera cara es también 0.42% con una variación del 9. Por ejemplo al lanzar por primera vez la moneda (primer ensayo) la probabilidad de que se obtuviera cara es de 0.5 y así para todos los lanzamientos que se hagan (finitos) la probabilidad permanece constante (0. • Los resultados del experimento deben ser mutuamente excluyentes. Generalmente los resultados se clasifican como “éxito” o “fracaso”. Si toma la primera opción obtendrá una ganancia fija del 15%. Para que una distribución de probabilidad sea binomial se debe cumplir: • Debe haber dos resultados posibles en cada ensayo de un experimento.1237 y la desviación estándar σ = 9. • La probabilidad de éxito de un ensayo a otro permanece constante. los resultados posibles son obtener cara u obtener sello. por tanto estos resultados son mutuamente excluyentes. Por ejemplo si se lanza la moneda 3 veces. pero si toma el segundo plan se esperaría obtener una ganancia del 19.92%. donde p es la probabilidad de éxito en cada ensayo. entonces la variable aleatoria tiene los valores: 1. Esto significa que la ganancia más pequeña que se puede tener es de 19. Esta es un tipo de distribución de probabilidad. el evento es “que se obtenga cara” y en el primer lanzamiento se obtuvo y en los otros dos no. este resultado no incide en el lanzamiento de la moneda por segunda vez.49%. Por ejemplo al lanzar una moneda.49%.5) • Los ensayos deben ser independientes. es decir la ocurrencia de un resultado de un ensayo no afecta al próximo ensayo. 914 = 0. por lo que es relativamente sencillo calcular las probabilidades en esta distribución sin necesidad de aplicar la fórmula. La desviación estándar viene dada por σ = np(1 − p) . porque la probabilidad siempre es la misma (por cada 200 piezas que se fabrican salen 20 defectuosas). . Desviación estándar de una distribución de probabilidad binomial. Note que el éxito se refiere al resultado por el cuál se indaga. Media de una distribución de probabilidad binomial.3. Encuentre la probabilidad de que al examinar 17 piezas salgan 3 defectuosas. Es claro que este problema corresponde a una distribución binomial.1 y x = 3.13 (1 − 0. Solución. 20 son defectuosas. Una máquina fabrica una determinada pieza y se sabe que de cada 200 piezas que produce. La probabilidad de éxito: p . La media viene dada por µ = np .1) = 680 * 0. Los elementos de la fórmula para el cálculo e la probabilidad son: 20 n = 17 . entonces el éxito sería no defectuosa y el fracaso defectuosa. una pieza no puede ser defectuosa y no defectuosa a la vez y hay dos posibles resultados: éxito para la pieza defectuosa y fracaso para la pieza no defectuosa.1. Uso de tablas en la distribución binomial. En la tabla 24 se muestra un fragmento de dicha tabla. La distribución binomial se encuentra tabulada.3. Ejemplo 27.2. Por tanto 200 17 17 − 3 P (3) = 0. Si la pregunta hubiese sido en el sentido de la probabilidad de que haya una pieza no defectuosa. El número de éxitos: x . Para usar las tablas de distribución binomial se hace necesario conocer: • • • El número de veces que se realiza el experimento: n . 4.4.3.3. 3 Este resultado se habría podido obtener mediante el uso de la tabla para la distribución binomial acumulada. p= = 0 . 4.1555 . donde n es el número de ensayos y p es la probabilidad de éxito de cada ensayo. que se encuentra en el anexo.001 * 0. x = 3 y la probabilidad de 0.7618 para x = 2. se obtiene 0. Si la pregunta hubiese sido ¿cuál es la probabilidad de que al tomar 17 piezas salgan tres o menos piezas defectuosas? La respuesta podría conseguirse mediante la fórmula o mediante la tabla 24. Al hacer la diferencia entre esta probabilidad y la probabilidad anterior 0.1) = 136 * 0.917 = 0.Tabla 24.10 (1 − 0. por tanto la probabilidad 3 sería: . En algunos libros vienen tablas de distribuciones de probabilidades no acumuladas.001 * 0.1 se obtiene la probabilidad acumulada de 0. Note que al tomar el valor de n = 17.916 = 0.11 (1 − 0. Así: P ( X ≤ 3) = P (0) + P (1) + P (2) + P (3) .2800 2 17 17 − 3 P (3) = 0.914 = 0.1667 0 17 17 −1 P (1) = 0.1 * 0.9174-0.1) = 1 * 1 * 0.13 (1 − 0.1) = 17 * 0.12 (1 − 0.01 * 0.1) = 680 * 0.915 = 0.7618 = 0.9174.3150 1 17 17 − 2 P (2) = 0.1556 que es la probabilidad obtenida por la fórmula. Tabla de distribuciones de probabilidad binomial acumuladas para n =17 varios valores de p. donde: 17 17 P (0) = 0. luego los valores calculados por la fórmula se leen directamente sin necesidad de hacer diferencias.1555 . 1667 + 0.2800 + 0. Figura 34. La gráfica de la distribución binomial acumulada se muestra en la figura 35. que es el valor que se puede leer directamente de la tabla 24. .1555 Tabla 25.P ( X ≤ 3) = P (0) + P (1) + P (2) + P (3) = 0. La diferencia está en que no se tuvieron en cuenta todos los decimales al momento del cálculo. La distribución para estas tres probabilidades se muestra en la tabla 25 cuya gráfica se muestra en la figura 34.3150 0.3150 + 0.1667 0. Gráfica de la distribución binomial del ejemplo 27 para un número de piezas defectuosas entre cero y tres. Distribución de probabilidad binomial para el ejemplo 27 para un número de piezas defectuosas entre cero y tres.9172 . Número de piezas defectuosas Probabilidad 0 1 2 3 0.1555 = 0.2800 0. el número de aviones que aterrizan en un aeropuerto por día. el número de bacteria pon centímetro cuadrado en un cultivo. Es obvio que los número no enteros no representan número de piezas. . La desviación estándar es σ = 17 * 0. el número de embarcaciones que llega a un puerto por día. 3.7+1. La media para esta distribución es µ = 17 * 0. entre otros. 0. La característica de la distribución de probabilidades de Poisson es que la variable aleatoria asume sólo valores enteros no negativos. Por ejemplo. 1. … Este tipo de distribución se emplea para describir procesos donde los éxitos buscados son expresados por unidad de área.1) = 1. se espera encontrar 1.23 piezas.1 = 1.93 piezas y el mínimo de 1. hora o minuto.Figura 35. 2.7 defectuosas. La distribución de Poisson. mes o año. tiempo. es decir que de 17 piezas que se tomen al azar. Gráfica de la distribución binomial acumulada del ejemplo 27 para un número de piezas defectuosas entre cero y tres. unidad.47. es decir. 4.23=2.4.23=0. día. hora. pero la información es valiosa al momento de evaluar el procedimiento.1(1 − 0.7 .7-1. es decir que el máximo de piezas defectuosas que puede obtener en 17 piezas es de 1. el número de defectos en una tela por metro cuadrado. el número de llamadas que se reciben en un conmutador por minuto. • La probabilidad de que un resultado muy sencillo ocurra en un intervalo de tiempo muy corto o en una región pequeña es proporcional a la longitud del intervalo de tiempo o al tamaño de la región. se nota que el número de defectos que hay en una región no afecta al número e defectos que hay en otra región. . La figura 37 muestra que la probabilidad de encontrar un defecto en una región ha disminuido. de tal manera que cada subregión sea ahora más pequeña será menos probable encontrar defectos en cada una de ellas. al tomar el ejemplo anterior. si se subdivide la tabla en un mayor número de cuadrados. en la tercera hay 2 defectos y en la tercera no hay defectos. Figura 36. si se toma una tabla de 1metro por un metro donde hay 5 defectos luego se subdivide la tabla en cuatro regiones de tal manera que en la primera región hay 2 defectos. Los defectos que hay en una subregión no interfieren en los que hay en otra subregión. en la segunda hay 2 defectos.Un experimento de Poisson sugiere del proceso de Poisson y tiene las siguientes propiedades: • El número de resultados que ocurren en un intervalo de tiempo o región específicos es independiente de el número que ocurre en cualquier otro intervalo disjunto de tiempo o región del espacio disjunto. Figura 37. Note que la probabilidad de que una subregión tenga defectos es relativamente grande. Por ejemplo. Es decir. La probabilidad de encontrar un defecto en cada subregión disminuyó respecto a cuando se tenían sólo cuatro subregiones. La figura 36 ilustra esta situación. Al igual que en la distribución binomial.4. La distribución de probabilidad o la función de probabilidad para una distribución de Poisson viene dada por: x ( np ) e − np P( X ) = . e es la constante de euler 2.71828 y x es el número de éxitos. Desviación estándar de una distribución de probabilidad de Poisson.4. 4. La distribución de Poisson es la misma que la binomial pero aplicable más a valores grandes. Para usar las tablas de distribución de Poisson se hace necesario conocer: • La media de la distribución µ . El número de accidentes que ocurren en un determinado cruce de cuatro vías en Bucaramanga es de 6 accidentes por mes.1. La desviación estándar está dada por σ = np . donde n es el número total de ensayos. • El número de éxitos: x . 2. Si se sigue aumentando el número de subregiones se encontrará que habrá muchas más de ellas que no tienen defectos que las que si tienen.3. por tanto: . es decir la probabilidad de que hayas regiones con defectos es muy pequeña. 4.2.4. La media es de µ = 6 accidentes por mes. La media viene dada por µ = np . que a su vez se obtiene por el conocimiento del número de veces que se realiza el experimento n y la probabilidad de éxito p . existen tablas que facilitan el cálculo de la probabilidad en las distribuciones de Poisson. Ejemplo 28. Uso de tablas en la distribución de Poisson.• La probabilidad de que más de un resultado ocurra en un intervalo de tiempo tan corto o en esa región tan pequeña es despreciable. ¿Cuál es la probabilidad de que no haya. p es la x! probabilidad de éxitos.3 accidentes en un mes dado? Aquí el éxito se refiere a que no haya accidentes. 4. Media de una distribución de probabilidad de Poisson. que haya 1. se obtiene el valor 0.089 es la probabilidad de que ocurran tres 3! 6 accidentes. de manera similar a como se hizo en la tabal de la distribución binomial acumulada. Así: . 61 e −6 6e −6 P (1) = = = 0.045 es la probabilidad de que ocurran dos 2! 2 accidentes. Esta tabla se encuentra en el anexo.1 y 6. Para encontrar las demás probabilidades hay que restar la probabilidad inmediatamente anterior. se puede obtener el mismo resultado. Tabla 26. Distribución acumulada de Poisson para éxitos entre 0 y 16 y medias entre 1. P (3) = Al usar la tabla de Poisson acumulada como se muestra en la tabla 26.• • • • 6 0 e −6 e −6 = = 0. es decir para que ocurra accidente.o.002 que es aproximado al calculado. P ( 0) = 63 e −6 216e −6 = = 0. 1! 1 6 2 e −6 36e −6 P ( 2) = = = 0.015 es la probabilidad de que ocurra un accidente.0025 es la probabilidad de que no ocurra 0! 1 accidentes. Si se lee la probabilidad para x = 0. 017 − 0.015 .0150 0.P (1) = 0.0890 Tabla 25. P (2) = 0. entonces su valor sería: P ( X ≤ 2) = P (0) + P (1) + P (2) = 0.0025 + 0.0450 0.045 = 0.0625 .002 = 0. Distribución de probabilidad de Poisson para el ejemplo 28 para un número de accidentes cero y tres.151 − 0. Gráfica de la distribución de Poisson para el ejemplo 28. La gráfica de la distribución de Poisson acumulada se muestra en la figura 39. La distribución para estas cuatro probabilidades se muestra en la tabla 27 y su gráfica se muestra en la figura 38. .015 + 0.045 y P (3) = 0. Figura 38.00225 0.062 − 0. Número de accidentes Probabilidad 0 1 2 3 0.062 = 0. que es el valor que puede leerse directamente de la tabla. Si la pregunta fuera ¿cuál es la probabilidad de que ocurran dos o menos accidentes.017 = 0.089 . entre otras. a es decir. la distribución Ji – cuadrado. la distribución gama. Las gráficas de las distribuciones acumuladas tiene un comportamiento similar. La diferencia entre las gráficas de las distribuciones binomial y de Poisson es que la primera es simétrica mientras que la segunda es sesgada a la derecha. Gráfica de la distribución de Poisson acumulada para el ejemplo 28.Figura 39. la distribución t de student. La probabilidad de que una variable aleatoria continua tome un valor a x = a es P(a ) = ∫ f ( x)dx = 0 . la distribución normal. 5. Una función f definida para un conjunto de valores se le conoce como función de densidad de probabilidad para una variable continua X si b P ( a ≤ X ≤ b) = ∫ f ( x)dx para cualesquiera constantes a y b . Es decir que a para calcular la probabilidad de que el valor de la variable aleatoria continua esté entre x = a y x = b se debe encontrar el área debajo de la curva definida mediante la función de densidad de probabilidad entre esos valores. Las distribuciones de probabilidad continua más conocidas están: la distribución exponencial. DISTRIBUCIÓN DE PROBABILIDAD CONTINUA. Una distribución de probabilidad continua está sujeta a una variable aleatoria continua. cuando se trabaja con variables . se deben cumplir las dos condiciones siguientes: • f debe ser positiva o cero para cualquier valor de la variable aleatoria continua. La media o el valor esperado se calcula por la fórmula • ∞ ∫ x f ( x)dx .1. −∞ 5. la varianza y la desviación estándar.2. Para hablar de las distribuciones de probabilidad acumulada para el caso continuo se hace necesario definir la función de distribución acumulativa o función de distribución. Media. Por lo anterior. µ= −∞ • La ∞ σ2 = Varianza.aleatorias continuas no tiene sentido preguntar por la probabilidad en un valor particular si no por la probabilidad en un intervalo de valores. ∞ ) . es decir la función de distribución acumulativa −∞ es el área bajo la curva de la función de densidad de probabilidad f entre menos infinito y el valor a . Esto es ∫ f ( x)dx = 1 . es decir. • El área debajo de la gráfica de la función f entre menos infinito y el ∞ infinito. 5. Esto significa que la gráfica de la función de densidad de probabilidad debe estar por encima del eje horizontal (eje de las abcisas). Para que una función f sea considerada una función de densidad de probabilidad. σ2 se calcula mediante la fórmula . En las distribuciones de probabilidad continuas también se puede calcular la media. para el caso continuo tienen mayor importancia hablar la distribución de probabilidad acumulada y no de la distribución de probabilidades en si. Función de distribución acumulativa. varianza y desviación estándar de una distribución de probabilidades continua. La Media. debe ser igual a 1. f ( x) ≥ 0 para todo x ∈ (− ∞. La función de distribución de una variable continua X viene dada por a F ( X ) = P( X ≤ a) = ∫ f (t )dt . 2 ∫ (x − µ ) −∞ f ( x)dx . 2865 + 0. Grafique esta función de densidad de probabilidad. Lim t Por tanto la función definida es una buena función de densidad de probabilidad. Solución. −∞ Ejemplo 29. • La probabilidad de que la batería dure entre 30 y 50 horas es x 3 50 − x 50 − −5 1 − P (30 ≤ x ≤ 50) = ∫ e 40 dx = − e 40 = − e 4 − e 4 = −0. f ( x) = 40 e 0 si x < 0 Demuestre que esta función es una buena función de densidad de probabilidad. • Se nota que la función es positiva para todos los x ≥ 0 . Es la raíz cuadrada de la varianza. Determine la probabilidad de que la vida útil de una batería elegida al azar • Esté entre 30 y 50 horas. Para x < 0 la función es cero. • A lo más 15 horas. la función de densidad de probabilidad de que x horas sea la vida útil de una batería elegida al azar viene dada por: 1 − 40x si x ≥ 0 . Luego se cumple la primera condición.La desviación estándar. se • ∞ ∫ (x − µ ) 2 simboliza por σ y viene dada por la fórmula σ = f ( x)dx . pues está definida en este intervalo mediante una función exponencial. Para cierto tipo de baterías. Luego esa función será positiva o cero para todos los valores de x .4724 = 0. • Sea por lo menos 60 horas.1859 30 40 30 • La probabilidad de que la duración de la batería sea de por lo menos 60 horas es . x − ∞ 0 ∞ ∞ ∞ 1 40 e dx • ∫ f ( x)dx = ∫ f ( x)dx + ∫ f ( x)dx = 0 + ∫ f ( x)dx = ∫ 40 −∞ −∞ 0 0 0 x Lim − 40x t Lim − 40t 1 − 40 e − 1 = 1 = e dx = − e = − 0 t → ∞ ∫0 40 t → ∞ t → ∞ Luego se cumple la segunda condición. Note que esta es la gráfica de la función de densidad de probabilidad y no de la distribución de probabilidades acumulativas.313 . la mediana y la moda de la distribución son iguales y están localizadas en el centro.3. .687 − 1) = 0. La media. Cada área que se calcule debajo de la curva entre dos valores de la variable aleatoria de la figura 39 representa la probabilidad acumulada en ese intervalo. La variable aleatoria continua con distribución normal es una de las distribuciones más importantes en el campo de la estadística. ∞ x 1 − P (60 ≤ x) = ∫ e 40 dx = 60 40 Figura 40. Para mayor simplicidad se le llamará distribución normal y a la función de densidad de probabilidad se le llamará curva normal.223 Lim t →∞ t →∞ 60 • La probabilidad de que la duración de la batería sea a lo más 15 horas es x 15 − x 15 − 15 1 − P ( x ≤ 15) = ∫ e 40 dx = − e 40 = − e 40 − e 0 = −(0. • La distribución normal es simétrica respecto a su media. La distribución normal. Función de densidad de probabilidad continua para el ejemplo 29. por tanto el área debajo de la curva que está a la derecha de la media es igual a la que está a la izquierda. en las distribuciones continuas tiene mayor sentido hablar de las distribuciones acumulativas. 0 40 0 La gráfica de función de densidad de probabilidad se muestra en la figura 40. pues como se ha dicho.3 − 40x t − 40t − − e = − Lim e − e 2 = −(0 − 0. Debería llamarse distribución acumulativa normal.223) = 0. 5. Las características de la distribución normal son: • La curva normal es en forma de campana y presenta un pico en el centro de la distribución. En esta figura se muestra que la distancia entre el eje de simetría (media) y el punto de inflexión de la curva normal es una desviación estándar. Curva normal de una distribución normal. pero en cualquier caso tendrá las mismas condiciones de simetría. distribuciones normales con igual media estándar σ diferentes. Las figuras 42 y 43 muestran estas posibilidades. La gráfica típica de una distribución normal se muestra en la figura 41. con la media desviación estándar σ µ y una . La función de densidad de probabilidad (curva normal) viene f ( x) = dada por − 1 e 2π σ ( x − µ )2 2σ 2 Figura 41.• La curva normal decrece uniformemente en ambas direcciones a partir del valor central. Figura 42. µ pero con desviaciones . Es asintótica respecto al eje horizontal. Las terminaciones de la curva a ambos lados de la media se les llama colas. Dependiendo de los valores que tome la media µ y la desviación estándar σ la gráfica será más alargada o achatada. 95 del área total. El área debajo de la curva comprendida entre µ − σ y µ + σ es aproximadamente igual a 0. Porcentaje del área comprendida entre µ − 2σ y µ +σ . Los únicos parámetros necesarios para dibujar el gráfico de la distribución normal son µ y σ . Las figuras 44 y 45 ilustran las áreas descritas. Porcentaje del área comprendida entre µ −σ Figura 45.Figura 43. distribuciones normales desviaciones estándar iguales. entre µ − 2σ y µ + 2σ es aproximadamente igual a 0. con medias diferentes pero con El área total debajo de la curva es igual a 1.68 del área total. Con estos dos parámetros se puede . y µ + 2σ . Figura 44. Para resolver el problema se define la distribución normal estándar que es la más sencilla. 2π 5. Para calcular la probabilidad de que la variable aleatoria normal se encuentre en un intervalo hay que encontrar el área debajo de la curva normal en dicho intervalo. La gráfica de esta curva se denomina campana de Gauss y se puede observar en la figura 46. Figura 46. P ( Z ≤ a ) es el área encerrada bajo la curva normal desde menos infinito ( − ∞ ) hasta a . 5.3.2. En la figura 47 se muestra esta área sombreada. La función de densidad de probabilidad para la distribución normal x2 estándar queda entonces f ( x) = 1 −2 e . Cuando se encuentra con una población de observaciones que siga una distribución normal.1. El problema radica en que calcular esta área por medio de integrales es muy complicado pues la antiderivada de la función de densidad no se puede expresar en términos de funciones elementales. Esta distribución normal estándar se suele representar por Z y los valores de las áreas entre menos infinito y los distintos valores de Z se encuentran tabulados (ver anexo). . es decir. Para un valor a cualquiera. usada y conocida y es aquella que tiene por media µ = 0 y por desviación estándar σ = 1 . Distribución normal estándar.3. Distribución normal estándar. sea menor o igual a a . Cálculo de probabilidades. la probabilidad de que la distribución Z. sólo hace falta estimar la media y la desviación estándar para tener toda la información necesaria acerca de dicha población.situar la campana (en el punto correspondiente a la media) y cual es su ancho (determinado por la desviación estándar). 3. . Uso de la tabla de la distribución normal estándar. Por ejemplo si se quiere calcular la probabilidad de que Z sea menor que 1.Figura 47. • Se busca la centésima en la fila superior. Porción de la tabla de la distribución normal estándar y explicación del procedimiento para hallar el valor del área para un Z determinado. El área encerrada entre − ∞ y la distribución Z sea menor o igual a a . Tabla 26. Para el ejemplo la centésima es 4. es decir. P ( Z ≤ 1.892512. • Se traza una recta desde la fila hacia abajo y una desde la columna hacia la derecha.24) = 0. a representa la probabilidad de que 5. Para el ejemplo se busca 1. que para el ejemplo es 0.24) ) hay que realizar los siguientes pasos: • Buscar la parte entera y las décimas en la columna de la izquierda.24 ( P ( Z ≤ 1. La tabla 26 muestra una porción de la tabla de la distribución normal estándar y el procedimiento que se sigue.892512 .3. En la intersección se encuentra el valor del área debajo de la curva entre menos infinito y Z. Los valores de las áreas debajo de la curva normal estándar se encuentra tabulados para valores de Z entre cero y cuatro.2. • Si se quiere encontrar la probabilidad de que Z sea mayor o igual a a donde a es positivo. se puede decir que el complemento de Z ≥ a es Z ≤ a . la tabla no serviría. Área que representa la probabilidad de que Z sea mayor que . El complemento de Z ≥ a es Z < a pero como Z = a no influye en la probabilidad. pues esta contiene sólo áreas para valores menores o iguales que a . es decir que calcular el área debajo de la curva entre menos infinito y − a es la misma área debajo de la curva entre a y el infinito. a. El problema se soluciona aplicando el principio del complemento para las probabilidades (apartado 5. de la unidad IV).Si se quiere calcular probabilidades para valores mayores que 4 hay que notar que para este valor la probabilidad es 0. que se obtiene mediante el procedimiento descrito. En la figura 49 se puede observar la igualdad de las áreas para Z mayores o iguales a a y para Z menores o iguales a − a Figura 48. La solución a este inconveniente se basa en que la curva normal estándar es simétrica.999968 (prácticamente 1). se resta 1 a la probabilidad de que Z sea menor o igual a a . Luego para calcular la probabilidad de que Z sea mayor o igual a a . Por tanto P ( Z ≤ − a ) = P ( Z ≥ a ) y de acuerdo con lo visto en el caso anterior se obtiene P ( Z ≤ − a ) = 1 − P ( Z ≤ a ) . por tanto P ( Z ≥ a ) = 1 − P ( Z ≤ a ) . la tabla tampoco serviría pues en ella se encuentran sólo valores positivos para Z. La figura 48 muestra la región sombreada correspondiente a la probabilidad de que Z sea mayor que a. por tanto para valores mayores que cuatro se dirá que la probabilidades aproximadamente 1. Cálculo de otras probabilidades.3. • Si se quiere calcular la probabilidad de que Z sea menor o igual que − a siendo a positivo. entonces P( Z ≥ − a) = 1 − (1 − P( Z ≤ a) ) = P( Z ≤ a) . se resta el área correspondiente a la probabilidad P ( Z ≤ a ) del área correspondiente a la probabilidad P ( Z ≤ b) . o sea que de nuevo la simetría es válida. La figura 50 muestra la igualdad de estas áreas. Áreas iguales tanto para Z mayor o igual a o igual a a . − a como para Z menor • Si se requiere calcular la probabilidad de que el valor Z esté entre dos valores a y b . es decir. el área debajo de la curva normal estándar entre − a y el infinito es igual al área debajo de la curva normal estándar entre menos infinito y a .Figura 49. es decir P (a ≤ Z ≤ b) = P ( Z ≤ b) − P ( Z ≤ a ) La figura 51 ilustra esta situación. Ahora como en el segundo caso se dedujo que P ( Z ≤ − a ) = 1 − P ( Z ≤ a ) . − a como para Z mayor • Si a es positivo y se quiere calcular la probabilidad de que Z sea mayor o igual que − a . se puede proseguir así: P ( Z ≥ − a ) = 1 − P ( Z ≤ −a ) por el primer caso. . Figura 51. La probabilidad de que Z esté entre a y b es la diferencia entre las áreas debajo de la curva normal estándar entre menos infinito y b y menos infinito y a . Figura 50. es decir. P (a ≤ Z ≤ b) . Área iguales tanto para Z menor o igual a o igual que a . Si la distribución es normal no estándar entonces de acuerdo a la X −µ Z= relación se puede estudiar mediante una distribución • σ estándar. Este procedimiento se llama tipificación de la variable X. Al valor Z se le llama valor normal estándar. Ejemplo 30. Las estaturas de los 800 estudiantes de un plantel educativo de bachillerato siguen una distribución normal donde la media es de 150 centímetros con una desviación estándar de 10 centímetros. ¿Cuántos estudiantes miden entre 145 y 155 centímetros? Solución. Sea X la distribución de estudiantes tal que X siga una distribución normal con µ = 150 y σ = 10 . Se pide calcular P (145 ≤ X ≤ 155) . Para utilizar las tablas de distribución normal estándar es necesario tipificar, el procedimiento es el siguiente: 145 − µ X − µ 155 − µ P (145 ≤ X ≤ 155) = P (145 − µ ≤ X − µ ≤ 155 − µ ) = P ≤ ≤ σ σ σ 155 − 150 145 − 150 = P ≤Z≤ = P (−0.5 ≤ Z ≤ 0.5) 10 10 Es decir, la probabilidad para que la X esté entre 145 y 155 es exactamente igual a la probabilidad de que el valor normal estándar esté entre –0.5 y 0.5. Según los casos vistos y según la tabla, se tiene que P (−0.5 ≤ Z ≤ 0.5) = P ( Z ≤ 0.5) − P ( Z ≤ −0.5) = P ( Z ≤ 0.5) − P ( Z ≥ 0.5) = P( Z ≤ 0.5) − (1 − P( Z ≤ 0.5) = 2 P ( Z ≤ 0.5) − 1 = 2 * 0.691462 − 1 = 0.383924 . Esto significa que aproximadamente el 38.39% de los estudiantes mide entre 145 y 155 centímetros. Si se preguntara ahora por la probabilidad de que un estudiante al azar mida más de 155 centímetros. Para más de 155 centímetros hay que calcular P ( X ≥ 155) y 155 − 150 X − µ 155 − µ P ( X ≥ 155) = P ≥ = P Z ≥ = P ( Z ≥ 0.5) = 1 − P ( Z ≤ 0.5) y σ 10 σ por tablas se tiene que P ( Z ≤ 0.5) = 0.691462 , por tanto P ( X ≥ 155) = 1 − 0.691462 = 0.308538 . Hasta este punto se ha pedido calcular la probabilidad de que para un cierto valor a , Z ≤ a ; esto es P ( Z ≤ a ) . Ahora si se conoce la probabilidad de que Z ≤ a , por ejemplo, P ( Z ≤ a ) = c para algún valor c , ¿cuál es el valor de a ?. La solución es fácil y se explicará mediante un ejemplo. Si se requiere hallar el valor de a tal que P ( Z ≤ a ) = 0.922196 , sólo se busca dentro de la tabla de la distribución normal este valor y se encuentra en la intersección de la fila 1.4 con la columna 0.02 por tanto a = 1.42 . Es posible que el valor no aparezca directamente en la tabla entonces se puede aproximar de dos formas: • Si la probabilidad está entre dos valores que aparecen en la tabla pero que no está cercana a ninguno de los dos. Por ejemplo, ¿cuál es el valor de a tal que P ( Z ≤ a ) = 0.825 ? Esta probabilidad está entre 0.823814 que corresponde al valor 0.93 y 0.826391 que corresponde al valor 0.94, luego la probabilidad de 0.825 está en la media de 0.93 y 0.93 + 0.94 0.94, o sea a = = 0.935 . 2 • Si la probabilidad está entre dos valores; pero está más cercano a uno de ellos, entonces se toma el valor de el. Por ejemplo, ¿cuál es el valor de a tal que P ( Z ≤ a ) = 0.8530 ? Esta probabilidad está entre 0.850830 que corresponde al valor de 1.04 y 0.853141 que corresponde al valor de 1.05. Como el valor 0.8530 está más cercano a 0.853141, entonces el valor de a es 1.05. • Si la distribución no es normal y se pregunta por el valor de a tal que P ( X ≤ a ) = c , para algún valor de c . Se tipifica la distribución y se sigue el procedimiento descrito. Por ejemplo sea una distribución normal con media µ = 10 y desviación estándar σ = 5 , P ( X ≤ a ) = 0.980774 , entonces a−µ X −µ a−µ P ( X ≤ a ) = P ≤ = P Z ≤ = 0.980774 y por tablas se obtiene σ σ σ a−µ el valor de = 2.07 y al despejar a = 2.07 * σ + µ , por tanto a = 20.35 σ 6. EJERCICIOS DE LA UNIDAD. 6.1. El ingreso medio de un habitante en Colombia es de 4 millones de pesos al año, con una varianza de 0.8. Se supone que se distribuye según una distribución normal. Calcule: Porcentaje de la población con un ingreso inferior a 3 millones de pesos. • Ingreso a partir del cual se sitúa el 10% de la población con mayores ingresos. • Ingresos mínimo y máximo que engloba al 60% de la población con renta media. • 6.2. La vida media de los habitantes de un país es de 65 años, con una varianza de 30. Se hace un estudio en una pequeña ciudad de 100.000 habitantes: • ¿Cuántas personas superarán previsiblemente los 75 años? • ¿Cuántos vivirán menos de 60 años? 6.3. El consumo medio anual de cerveza de los habitantes de Barranquilla de 100 litros, con una varianza de 20. Se supone que se distribuye según una distribución normal. • Si usted presume de buen bebedor, ¿cuántos litros de cerveza tendría que beber al año para pertenecer al 5% de la población que más bebe?. • Si usted bebe 45 litros de cerveza al año y su mujer le califica de borracho ¿qué podría argumentar en su defensa? 6.4. Se han presentado 2.000 aspirantes a una entrevista de ECOPETROL. Dichas entrevistas se calificaron de 0.0 a 10.00 La nota media ha sido un 5,5, con una varianza de 4. Tan sólo hay 100 plazas. Usted ha obtenido un 7,7. ¿Sería oportuno ir organizando una fiesta para celebrar su éxito? • Va a haber una 2ª oportunidad para el 20% de notas más altas que no se hayan clasificados. ¿A partir de que nota se podrá participar en esta nueva oportunidad? • 6.5. Cierto tipo de batería dura un promedio de 2 años, con una desviación estándar de 0,3 años. Suponiendo que la duración de las baterías es una variable normal: a) ¿Qué porcentaje de baterías se espera que duren entre 2 y 4 años? b) Si una batería lleva funcionando 1.8 años. ¿ cuál es la probabilidad de que dure menos de 2.2 años? 6.6. El 90% de los miembros de un club pasan sus vacaciones en la playa. Calcule una aproximación, obtenida utilizando tablas de la normal, de la probabilidad de que, de un grupo de 60 miembros del club, 50 o menos vayan a ir a la playa a pasar sus vacaciones. 6.8.Suponga que la probabilidad de que una pareja tenga un hijo o una hija es igual. Calcular la probabilidad de que una familia con 6 descendientes tenga 2 hijos. 12. Se empaquetan en cajas de 50 tornillos.8413 Calcule: • σ y µ.65 ≤ X ≤ 6.9.7) 6.8078 • P ( Z ≥ a ) = 0.Calcule el valor de a tal que: • P ( Z ≤ a ) = 0.01) • P (−0.5) = 0. Si se responde al azar ¿cuál es el número esperado de respuestas correctas? ¿cuál es la desviación estándar?. Considere éxito = estudiar inglés y fracaso = estudiar francés 6.6141 y X sigue una distribución normal con desviación estándar de σ = 4 y media de µ = 15 . . • La probabilidad de que estudien inglés entre 7 y 10 alumnos. En un examen de 100 preguntas hay 4 opciones de respuesta de las que hay que seleccionar una.96) y P ( Z ≥ −1. 6. • Haya exactamente un tornillo defectuoso. • El número a tal que P ( X > a ) = 0.15.3) y P ( Z ≤ 2. En un proceso de fabricación de tornillo se sabe que el 2% son defectuosos. • P (5. 6.25) . Si se toma una muestra de 15 alumnos de la clase.10.96 ≤ Z ≤ 1. • Más de dos tornillos defectuosos. De una variable normal se sabe que P ( X ≤ 7) = 0. Los alumnos de cierta clase se encuentran en una proporción del 67% que estudian inglés y el resto francés. a la ur na.57) • P ( Z ≤ 0.028 6. >C u_anto vale la media y la des vi aci_on t__pic a?.14. 6.49) y P (−1. Calcule la probabilidad de que en una caja: • No haya un tornillo defectuoso.11.13. Calcular a si P ( X ≤ a ) = 0.32 ≤ Z ≤ 0.6.3 . >C u_al es l a probabilidad de q ue 5 sean bl ancas?.9772 y P ( X ≤ 6. Calcule las siguientes probabilidades: • P ( Z ≥ −0. cada vez . Si repeti mos 10 vec es l a experienci a. • La probabilidad de que los 15 alumnos estudien inglés. calcule: • La probabilidad de que al menos se encuentren tres alumnos de inglés. ESTADÍSTICA PARA ADMINISTRACIÓN Y ECONOMÍA. MÉTODOS ESTADÍSTICOS. VELASCO S. 2a ed. Paul. Dennis. . 11a ed. FREEMAN.. LIND. Madrid: Aguilar. Roque. 1986. MENDENHALL. 2a ed. CARRANZA. 5a ed. 3a ed. Douglas. Robert. 2001. PROBABILIDAD Y APLICACIONES ESTADÍSTICAS. Harold. RIOS. VACKERLY D. INTRODUCCIÓN A LA INFERENCIA ESTADÍSTICA.. Washington: Addison –Wesley Iberoamericana. Sixto. Richard. 1985. 1994. ESTADÍSTICA. y SCHEAFFER. New York: Iberoamericana. William. Bucaramanga: UIS. 1970. William... 1968. 1967. México: Thomson.. New York: Mc Graw Hill. PROBABILIDAD Y ESTADÍSTICA PARA INGENIERÍA Y CIENCIAS. Gabriel.. y WISNIEWSKI M. MARCHAL. 2a ed.. MASON.BIBLIOGRAFÍA MEYER. Álvaro. 1a ed. GARCÍA. México: Alfaomega. México: Trillas. MÉTODOS MATEMÁTICOS DE ESTADÍSTICA. Piotr.. 2005. ESTADÍSTICA MATEMÁTICA CON APLICACIONES. 2a ed. TABLAS .