DISTRIBUCION DE PROBABILIDAD.Variables aleatorias. DEFINICIÓN Una distribución de probabilidad indica toda la gama de valores que pueden representarse como resultado de un experimento si éste se llevase a cabo. Es decir, describe la probabilidad de que un evento se realice en el futuro, constituye una herramienta fundamental para la prospectiva, puesto que se puede diseñar un escenario de acontecimientos futuros considerando las tendencias actuales de diversos fenómenos naturales Toda distribución de probabilidad es generada por una variable (porque puede tomar diferentes valores) aleatoria x (porque el valor tomado es totalmente al azar), y puede ser de dos tipos: 1. Probabilidad de un suceso. 2. Probabilidad condicionada. 3. Variables aleatorias (discretas y continuas). 4. Distribuciones continuas más importantes. 1. Probabilidad de un suceso. Experimentos aleatorios/determinísticos En un experimento aleatorio: - Suceso elemental: cada uno de los resultados posibles. - Espacio muestral (E): conjunto formado por los sucesos elementales. - Suceso: cada subconjunto del espacio muestral. Ejemplo: Sea el experimento “Lanzar un dado”; entonces, E = {1,2,3,4,5,6} E 3 5 1 2 4 6 A=“Obtener un nº menor o igual que 2”; B=“Obtener nº par” Ejemplo: Sea el experimento “Lanzar un dado”; entonces, E = {1,2,3,4,5,6} E 3 5 1 2 A B 4 6 A=“Obtener un nº menor o igual que 2”; B=“Obtener nº par” A ∩ B = “A intersección B” = “se dan A y B a la vez”= {2} A U B = “A unión B” =“se da A ó B ó ambos a la vez” = {1,2,4,6} A = “no A” = “contrario de A” = “no se da A” = {3,4,5,6} Suceso seguro (hay certeza de que se da): E Suceso imposible (hay certeza de que no se da): Ø Se dice que A y B son incompatibles si A ∩ B = Ø (es decir, no pueden darse a la vez); en otro caso, son compatibles. Probabilidad de un suceso: Una probabilidad es una función que asigna a cada suceso A, un nº (su probabilidad, P(A)), de manera que: 1.- 0 ≤ P(A) ≤ 1 2.- P(E)=1 3.- Si A y B son incompatibles, entonces P(A U B) = P(A) + P(B) Ejemplo de probabilidad: Ley de Laplace nº casos favorables P( A) nº casos posibles En el ejemplo anterior, ¿P(A)? ¿P(B)? ¿P(A ∩ B)? Ley de los Grandes Números: “El porcentaje de ocasiones en que se obtiene determinado resultado en un experimento aleatorio tiende a coincidir con su probabilidad teórica a medida que el experimento se repite más y más Veces”. Algunas fórmulas: - P(A U B)=P(A) + P(B) – P(A∩B) - Probab. de la unión de varios sucesos incompatibles: P(A U B U … U C) = P(A) + P(B) + … + P(C) - Probab. del suceso contrario: P( A ) 1 P( A) 2. Probabilidad condicionada. Ejemplo: Se sospecha que existe relación entre la aparición de una cierta enfermedad de la sangre en una comunidad, y la exposición a determinados desechos químicos en un vertedero próximo al lugar de estudio. Para estudiar la existencia o no de relación entre ambos fenómenos, se elige una muestra aleatoria de 620 personas de la comunidad, de las cuáles 300 habían estado expuestas a los desechos, y 320 no lo habían estado. En ambos grupos, se determinó el número de personas que tenían la citada enfermedad. Los resultados se muestran en la siguiente tabla: Tiene la SI NO enfermedad Ha estado expuesto SI 52 248 300 NO 48 272 320 Totales: 100 520 620 a) ¿Cuál es la probabilidad de que, tomado un individuo al azar, haya estado expuesto al peligro? ¿Y de que tenga la enfermedad? b) ¿Cuál es la probabilidad de que tomado un individuo al azar tenga la enfermedad y haya estado expuesto al peligro? c) Sabiendo que un individuo, tomado al azar, ha estado expuesto, ¿cuál es la probabilidad de que tenga la enfermedad? d) A partir del resultado anterior, ¿parece razonable concluir que no hay relación entre ambos fenómenos? Probabilidad condicionada: P( A B) P( A / B) (Probab. de A condicionado B) P( B) P( B A) P( B / A) (Probab. de B condicionado A) P( A) Decimos que A y B son independientes, si P(A/B) = P(A); P(B/A) = P(B) Se cumple: A y B independientes ↔ P(A ∩ B)=P(A) P(B) ¿Qué es una distribución de probabilidad? Las distribuciones de probabilidad están relacionadas con las distribuciones de frecuencias. De hecho, podemos pensar que una distribución de probabilidad es una distribución de frecuencias teórica. Distribución de frecuencias teórica Distribución de probabilidades Describe la forma en que se espera varíen los resultados Ejemplos de distribuciones de probabilidad Suponga que lanzamos una moneda dos veces. los posibles resultados para este experimento de dos lanzamientos. [Cara (head) está representada con una H; cruz (tail), con una T.] Formular una distribución de probabilidad del número de cruces (T) que podrían caer cuando lanzamos la moneda dos veces. Ordenamos los resultados de la 5-1 para enfatizar el número de cruces contenidas en cada resultado. (no representa el resultado real, se trata del resultado teórico Podemos representar gráficamente la distribución de probabilidad de la tabla 5-2. Para ello, colocamos en una gráfica el número de cruces que deberíamos ver en dos lanzamientos contra la probabilidad de que este número se presente. Una candidata política para un puesto en el gobierno local está considerando los votos que puede obtener en las elecciones que se avecinan. Suponga que los votos pueden tomar sólo cuatro valores posibles. Si la estimación de la candidata es como sigue: Diferencia entre distribuciones de frecuencias y distribuciones de probabilidad • Una distribución de frecuencias es un listado de las frecuencias observadas de todos los resultados de un experimento que se presentaron realmente cuando se efectuó éste. • Distribución de probabilidad es un listado de las probabilidades de todos los posibles resultados que podrían obtenerse si el experimento se llevara a cabo. • Las distribuciones de probabilidad pueden basarse en consideraciones teóricas (los lanzamientos de una moneda) • Una estimación subjetiva de la posibilidad de ciertos resultados (la estimación de la candidata) • Las distribuciones de probabilidad se pueden basar también en la experiencia. Tipos de distribuciones de probabilidad Las distribuciones de probabilidad se clasifican como discretas y continuas. La distribución de probabilidad discreta está permitido considerar sólo un número limitado de valores. La distribución de probabilidad continua, por otro lado, la variable que se está considerando puede tomar cualquier valor dentro de un intervalo dado. Basándose en la siguiente gráfica de una distribución de probabilidad, construya una tabla que corresponda a la gráfica. 1. Si analizamos los resultados posibles de lanzar dos dados y calculamos algunas probabilidades asociadas con los diferentes resultados. Construya una tabla y una gráfica de la distribución de probabilidad que represente los resultados (en términos del número total de puntos que salen cara arriba en ambos dados) de este experimento. 2. ¿Cuál de las siguientes afirmaciones con respecto a las distribuciones de probabilidad son correctas? a) Una distribución de probabilidad proporciona información acerca de la frecuencia a largo plazo o esperada de cada uno de los resultados de un experimento. b) La gráfica de una distribución de probabilidad tiene los resultados posibles de un experimento indicados en el eje horizontal. c) Una distribución de probabilidad lista las probabilidades que cada uno de los resultados sea aleatorio. d) Una distribución de probabilidad se construye siempre a partir de un conjunto de frecuencias observadas, tal como sucede en el caso de las distribuciones de frecuencias. e) Una distribución de probabilidad puede basarse en estimaciones subjetivas con respecto a que ciertos resultados sucedan. 3. La presidenta nacional de la Asociación Contra la Distrofia Muscular intenta estimar la cantidad que ofrecerá cada persona que llama durante el teletón anual de esta asociación. Usando los datos recolectados en los últimos 10 años, calculó las siguientes probabilidades de las diferentes cantidades prometidas. Dibuje una gráfica que ilustre esta distribución de probabilidad. Dólares prometidos 25 50 75 100 125 Probabilidad 0.45 0.25 0.15 0.10 0.05 4. Southport Autos ofrece una variedad de opciones de lujo en sus automóviles. Debido al periodo de espera de 6 a 8 semanas de los pedidos, el distribuidor Ben Stoler tiene un inventario de autos con varias opciones. Por el momento, el señor Stoler, que se precia de poder cumplir con las necesidades de sus clientes de inmediato, está preocupado porque hay una escasez de autos con motores V-8 en toda la industria. Stoler ofrece las siguientes combinaciones de lujo: 1. Motor V-8 Quemacocos eléctrico Faros de halógeno 2. Interiores de piel Seguros eléctricos Autoestéreo 3. Faros de halógeno Motor V-8 Interiores de piel 4. Autoestéreo Motor V-8 Seguros eléctricos Stoler piensa que las combinaciones 2, 3 y 4 tienen la misma probabilidad de ser pedidas, pero que la combinación 1 tiene el doble de probabilidades de ser pedida que cualquiera de las otras. a) Cuál es la probabilidad de que un cliente que quiere un automóvil de lujo ordene uno con motor V-8? b) Suponga que dos clientes ordenan autos de lujo. Construya una tabla que muestre la distribución de probabilidad del número de motores V-8 pedidos. 5. Jim Rieck, analista de mercado de la compañía Flatt and Mitney Aircraft, tiene la creencia de que el nuevo avión de combate de la compañía, el Tigerhawk, tiene el 70% de posibilidades de ser escogido para sustituir por completo a los aviones de combate de la Fuerza Aérea de Estados Unidos. Sin embargo, existe una posibilidad entre cinco de que la Fuerza Aérea compre sólo el número necesario de Tigerhawk para sustituir la mitad de sus 5,000 aviones de combate. Por último, existe una posibilidad entre 10 de que la Fuerza Aérea sustituya toda su flotilla de aviones de combate con Tigerhawks y que además compre el número suficiente de éstos para aumentar el número de sus unidades en un 10%. Construya una tabla y trace la distribución de probabilidad de las ventas de Tigerhawks a la Fuerza Aérea. 3. Variables aleatorias. • Una variable es aleatoria si toma diferentes valores como resultado de un experimento aleatorio. • Esta variable aleatoria puede ser discreta o continua. • Si puede tomar sólo un número limitado de valores, entonces es una variable aleatoria discreta. • Si puede tomar cualquier valor dentro de un intervalo dado, entonces se trata de una variable aleatoria continua. Una variable aleatoria es una especie de valor o magnitud que cambia de una ocurrencia a otra sin seguir una secuencia predecible. Por ejemplo: En una clínica para tratamiento del cáncer de mama no se tiene manera de saber con exactitud cuántas mujeres van a ser atendidas en un día cualquiera. De modo que el número de mujeres del día siguiente es una variable aleatoria. Por lo tanto los valores de una variable aleatoria son los valores numéricos correspondientes a cada posible resultado del experimento aleatorio. Si los registros diarios de la clínica indican que los valores de la variable aleatoria van desde 100 hasta 115 mujeres al día, entonces ésta es una variable aleatoria discreta. La tabla proporciona una distribución de frecuencias. La experiencia de los pasados 100 días es un comportamiento típico. Este registro permite asignar una probabilidad a cada número posible de mujeres y encontrar una distribución de probabilidad. La normalización de la distribución de frecuencias observadas (en este caso, dividimos cada valor que aparece en la columna de la derecha de la tabla 5-3 entre 100, el número total de días en que se tomaron los registros). La distribución de probabilidad para la variable aleatoria “número de mujeres examinadas” se presenta de manera gráfica en la figura Distribución de probabilidad para la variable aleatoria discreta “Número de mujeres examinadas al día” La distribución de probabilidad para una variable aleatoria proporciona una probabilidad para cada valor posible y que estas probabilidades deben sumar 1. El valor esperado de una variable aleatoria Suponga que lanza una moneda 10 veces y obtiene siete caras, de la siguiente manera: Si lanza la moneda 20 veces; ella obtiene 15 caras y 5 cruces. De modo que ahora, en total, usted tiene 22 caras y 8 cruces de un total de 30 lanzamientos. ¿Qué esperaba? ¿Algo cercano a 15 caras y 15 cruces (mitad y mitad)? Suponga ahora que una máquina lanza la moneda y obtiene 792 caras y 208 cruces de un total de 1,000 lanzamientos de la misma moneda. Con este resultado, usted podría sospechar que la moneda está alterada, debido a que no se comportó del modo que esperaba. El valor esperado es una idea fundamental en el estudio de las distribuciones de probabilidad. Este concepto ha sido puesto en práctica con bastante regularidad por las compañías aseguradoras. En los últimos 20 años, también ha sido utilizado ampliamente por muchas de las personas que deben tomar decisiones en condiciones de incertidumbre. Para obtener el valor esperado de una variable aleatoria discreta, multiplicamos cada valor que la variable puede tomar por la probabilidad de ocurrencia de ese valor y luego sumamos los productos. El total de la tabla nos indica que el valor esperado de la variable aleatoria discreta “Número de mujeres examinadas al día” es de 108.02 mujeres. ¿Qué significa esto? • Significa que en un periodo largo, el número de mujeres examinadas diariamente deberá tener un promedio de aproximadamente 108.02. Recuerde que un valor esperado de 108.02 no significa que mañana 108.02 mujeres asistan a la clínica. • Podría basar sus decisiones en el valor esperado del número de mujeres examinadas diariamente debido a que éste es un promedio ponderado de los resultados que espera en el futuro. • El valor esperado pesa cada resultado posible con respecto a la frecuencia con que se espera se presente. • En consecuencia, las ocurrencias más comunes tienen asignado un peso mayor que las menos comunes. • Conforme van cambiando las condiciones, la directora podría recalcular el valor esperado de los exámenes diarios y utilizar el nuevo resultado como base para tomar decisiones. • El valor esperado también puede ser obtenido a partir de las estimaciones subjetivas con respecto a la probabilidad de que la variable aleatoria pueda tomar ciertos valores. • En ese caso, el valor esperado no es más que la representación de las convicciones personales acerca del resultado posible. Uso del valor esperado en la toma de decisiones Necesitamos analizar cómo los tomadores de decisiones combinan las probabilidades de que una variable aleatoria asuma ciertos valores con las ganancias o pérdidas monetarias que se dan cuando efectivamente toma estos valores. Problema de vendedor al mayoreo Un vendedor al mayoreo de frutas y legumbres que comercia con frambuesas • Este producto tiene una vida útil muy limitada: • Si no se vende el día que llega, ya no tiene valor. • Una caja de frambuesas cuesta $20 y el vendedor recibe $50 por ella. • Éste no puede especificar el número de cajas que un cliente pedirá en cualquier día dado, pero su análisis de registros pasados ha producido la información que presentamos en la tabla 5-6. El vendedor al mayoreo ha sufrido dos tipos de pérdidas: 1) Pérdidas por obsolescencia, ocasionadas por tener en existencia demasiada fruta en un día y tener que tirarla al siguiente, y 2) Pérdidas de oportunidad, ocasionadas por no tener en existencia el producto al momento en que un cliente lo solicita (los clientes no esperan más allá del día en que solicitan una caja de frambuesas). La tabla 5-7 es una tabla de pérdidas condicionales. • Cada valor en ella está condicionado a un número específico de cajas que se encuentran en existencia y a un número específico de solicitudes. • Los valores que se tienen en la tabla 5-7 incluyen no solamente las pérdidas por la fruta descompuesta, sino también las que se derivan de los ingresos perdidos cuando el vendedor no es capaz de suministrar un pedido. • Cuando el número de cajas en existencia en un día cualquiera es igual al número de cajas solicitadas no ocurre ninguno de estos dos tipos de pérdida. • En tales casos, el vendedor vende todo lo que tiene almacenado y no sufre pérdidas. • Esta situación se indica con el cero en negrita que aparece en la columna correspondiente. Las cifras que se encuentren por encima de un cero cualquiera representan las pérdidas sufridas al tener que tirar la fruta. En este ejemplo, el número de cajas almacenadas es mayor al de cajas solicitadas. Por ejemplo, si el vendedor tiene en existencia 12 cajas, pero recibe solicitud para sólo 10 de ellas, pierde $40 (o $20 por caja no vendida ese mismo día). Los valores que se encuentran debajo de los ceros en negrita representan las pérdidas de oportunidad derivadas de pedidos que no se pueden cumplir. Si, un cierto día, el vendedor tiene en existencia solamente 10 cajas de frambuesas y le solicitan 11, éste sufre una pérdida de oportunidad de $30 por la caja que le faltó ($50 por caja menos $20 de su costo, igual a $30). Cálculo de pérdidas esperadas Las pérdidas condicionales de la tabla 5-8 se tomaron de la primera columna de la tabla 5- 7, para la existencia de 10 cajas de frambuesas. En la cuarta columna de la tabla 5-8 se nos muestra que si se tienen en existencia 10 cajas diarias, a lo largo de un periodo grande, la pérdida promedio o pérdida esperada será de $52.50 por día. No hay garantías de que la pérdida del día siguiente sea exactamente de $52.50. Cálculo de pérdidas esperadas Las tablas de la 5-9 a la 5-11 muestran los cálculos de la pérdida esperada resultante de decidirse por el almacenamiento de 11, 12 y 13 cajas de frambuesas, respectivamente. Cálculo de pérdidas esperadas La acción de alma-cenamiento óptima es aquella que minimiza las pérdidas esperadas. Tener en existencia 12 cajas diariamente constituye esta opción, en cuyo caso las pérdidas esperadas toman el valor mínimo de $17.50. Con la misma facilidad, pudimos haber resuelto este problema tomando un camino alternativo, es decir, maximizando la ganancia esperada ($50 recibidos por caja de fruta, menos $20 del costo de cada caja), en lugar de minimizar la pérdida esperada. En cualquier caso habríamos obtenido la misma respuesta: 12 cajas en existencia. Asumimos que la demanda del producto puede tomar únicamente cuatro valores y que las frambuesas no valen nada al día siguiente. La compañía pretende ofrecer el servicio seis días a la semana (312 días al año) y estima que el costo por automóvil por día será de $2.50. Al término de un año, la compañía espera vender los automóviles y recuperar el 50% del costo original. Sin tomar en cuenta el valor temporal del dinero ni cualquier otro gasto que no sea en efectivo, utilice el método de pérdida esperada para determinar el número óptimo de automóviles que debe comprar la compañía.