84 ❍ CAPÍTULO 5 ALGUNAS DISTRIBUCIONES DISCRETAS ÚTILES

June 9, 2018 | Author: Oscar Portillo | Category: Documents


Comments



Description

184



CAPÍTULO 5 ALGUNAS DISTRIBUCIONES DISCRETAS ÚTILES

5.1

INTRODUCCIÓN Se pueden hallar ejemplos de variables aleatorias discretas en numerosas situaciones cotidianas y en casi todas las disciplinas académicas. No obstante, hay tres distribuciones discretas de probabilidad que sirven como modelos para un gran número de estas aplicaciones. En este capítulo estudiamos las distribuciones de probabilidad binomiales, de Poisson e hipergeométrica y discutimos su utilidad en diferentes situaciones físicas.

5.2

LA DISTRIBUCIÓN BINOMIAL DE PROBABILIDAD El experimento de lanzar al aire una moneda es un ejemplo sencillo de una importante variable aleatoria discreta llamada variable aleatoria binomial. Muchos experimentos prácticos resultan en datos similares a que salgan cara o cruz al tirar la moneda. Por ejemplo, considere las encuestas políticas que se emplean para predecir las preferencias de los votantes en elecciones. Cada votante entrevistado se puede comparar a una moneda porque el votante puede estar a favor de nuestro candidato (una “cara”) o no (una “cruz”). Casi siempre, la proporción de votantes que están a favor de nuestro candidato no es igual a 1/2, es decir, la moneda no es imparcial. De hecho, la encuesta está diseñada exactamente para determinar la proporción de votantes que están a favor de nuestro candidato. Veamos aquí algunas otras situaciones semejantes al experimento de lanzar al aire una moneda: • Un sociólogo está interesado en la proporción de maestros de escuelas elementales que sean hombres. • Una comerciante en bebidas gaseosas está interesada en la proporción de quienes toman refresco de cola y que prefieren la marca de ella. • Un genetista está interesado en la proporción de la población que posee un gen vinculado a la enfermedad de Alzheimer. Cada persona muestreada es análoga a lanzar al aire una moneda, pero la probabilidad de una “cara” no es necesariamente igual a 1/2. Aun cuando estas situaciones tienen diferentes objetivos prácticos, todas exhiben las características comunes del experimento binomial. Definición

Un experimento binomial es el que tiene estas cinco características:

1. El experimento consiste en n intentos idénticos. 2. Cada intento resulta en uno de dos resultados. Por falta de un mejor nombre, el resultado uno se llama éxito, S, y el otro se llama fracaso, F. 3. La probabilidad de éxito en un solo intento es igual a p y es igual de un intento a otro. La probabilidad de fracaso es igual a (1  p)  q. 4. Los intentos son independientes. 5. Estamos interesados en x, el número de éxitos observado durante los n intentos, para x  0, 1, 2, …, n. EJEMPL O

5.1

Suponga que hay alrededor de un millón de adultos en un condado y una proporción desconocida p están a favor de limitar el periodo de función de políticos. Se escogerá una muestra de mil adultos en forma tal que cada uno del millón de adultos tenga igual probabilidad de ser seleccionado y a cada uno se le pregunta si él o ella está a favor de limitar el periodo. (El objetivo final de esta encuesta es estimar la proporción desconocida p, un problema que veremos en el capítulo 8.) ¿Este experimento es binomial?

www.FreeLibros.me Probabilidad_Mendenhall_05.indd 184

5/14/10 8:34:03 AM

5.2 LA DISTRIBUCIÓN BINOMIAL DE PROBABILIDAD

Solución



185

¿El experimento tiene las cinco características binomiales?

1. Un “intento” es la selección de un solo adulto de entre el millón de adultos del condado. Esta muestra consta de n  1000 intentos idénticos. 2. Como cada adulto estará a favor o no estará a favor de limitar el periodo, hay dos resultados que representan los “éxitos” y “fracasos” del experimento binomial.† 3. La probabilidad de éxito, p, es la probabilidad de que un adulto esté a favor del límite del periodo. ¿Esta probabilidad sigue igual para cada uno de los adultos de la muestra? Para todos los fines prácticos, la respuesta es sí. Por ejemplo, si 500 mil adultos de la población están a favor de limitar el periodo, entonces la probabilidad de un “éxito” cuando se escoja al primer adulto es 500 000/1 000 000  1/2. Cuando se escoja al segundo adulto, la probabilidad p cambia ligeramente, dependiendo de la primera selección. Esto es, habrá 499 999 o 500 000 éxitos que queden entre los 999 999 adultos. En cualquiera de estos casos, p es todavía más o menos igual a 1/2. 4. La independencia de los intentos está garantizada debido al grupo grande de adultos del que se toma la muestra. La probabilidad de que un adulto esté a favor de limitar el periodo no cambia, dependiendo de las respuestas de las personas previamente escogidas. 5. La variable aleatoria x es el número de adultos de la muestra que estén a favor de limitar el periodo. Debido a que el estudio satisface las cinco características razonablemente bien, para todos los fines prácticos se puede ver como un experimento binomial.

EJEMP LO

5.2

Un paciente llena una receta para un régimen de 10 días de dos píldoras diarias. Sin que lo sepan el farmacéutico ni el paciente, las 20 pastillas están formadas por 18 píldoras del medicamento prescrito y dos píldoras que son el equivalente genérico del medicamento prescrito. El paciente selecciona dos píldoras al azar para la dosis del primer día. Si verificamos la selección y registramos el número de píldoras que son genéricas, ¿es éste un experimento binomial? De nuevo, verifique el procedimiento de muestro para las características de un experimento binomial.

Solución

1. Un “intento” es la selección de una píldora de entre las 20 de la receta. Este experimento consta de n  2 intentos. 2. Cada intento resulta en uno de dos resultados. O bien la píldora es genérica (llame “éxito” a esto) o no lo es (un “fracaso”). 3. Como las píldoras de una botella de receta se pueden considerar “mezcladas” al azar, la probabilidad incondicional de sacar una píldora genérica en un intento determinado sería 2/20. 4. La condición de independencia entre intentos no está satisfecha, porque la probabilidad de sacar una píldora genérica en el segundo intento depende del primer intento. Por ejemplo, si la primera píldora sacada es genérica entonces hay sólo una píldora genérica en las restantes 19. Por tanto, P(genérica en intento 2genérica en intento 1)  1/19 †

Aun cuando es tradicional que los dos posibles resultados de un intento se denominen “éxito” y “fracaso”, podrían haberse llamado “cara” y “cruz”, “rojo” y “blanco” o cualquier otro par de palabras. En consecuencia, el resultado llamado “éxito” no necesita ser visto como éxito en el uso ordinario de la palabra.

www.FreeLibros.me Probabilidad_Mendenhall_05.indd 185

5/14/10 8:34:03 AM

186



CAPÍTULO 5 ALGUNAS DISTRIBUCIONES DISCRETAS ÚTILES

Si la primera selección no resulta en una píldora genérica, entonces hay todavía dos píldoras genéricas en las restantes 19, y la probabilidad de un “éxito” (una píldora genérica) cambia a P(genérica en el intento 2no genérica en el intento 1)  2/19 Por tanto, los intentos son dependientes y el muestreo no representa un experimento binomial. Considere la diferencia entre estos dos ejemplos. Cuando la muestra (los n intentos idénticos) vinieron de una población grande, la probabilidad de éxito p siguió siendo más o menos la misma de un intento a otro. Cuando el tamaño poblacional N era pequeño, la probabilidad de éxito p cambió en forma considerable de un intento a otro, y el experimento no fue binomial. REGLA PRÁCTICA Si el tamaño muestral es grande con respecto al tamaño poblacional, en particular si n/N  .05, entonces el experimento resultante no es binomial. En el capítulo 4, tiramos al aire dos monedas justas y construimos la distribución de probabilidad para x, el número de caras, un experimento binomial con n  2 y p  .5. La distribución binomial general de probabilidad se construye en la misma forma, pero el procedimiento se complica cuando n se hace grande. Afortunadamente, las probabilidades p(x) siguen un modelo general. Esto nos permite usar una sola fórmula para hallar p(x) para cualquier valor dado de x. LA DISTRIBUCIÓN BINOMIAL DE PROBABILIDAD Un experimento binomial consta de n intentos idénticos con probabilidad p de éxito en cada intento. La probabilidad de k éxitos en n intentos es n! p kq nk P(x  k)  C nk p kq nk  _________ k!(n  k)! para valores de k  0, 1, 2, …, n. El símbolo C nk es igual a, n! _________ k!(n  k)! donde n!  n(n  1)(n  2)    (2)(1) y 0!  1. Las fórmulas generales para m, s2 y s dadas en el capítulo 4 se pueden usar para obtener las siguientes fórmulas más sencillas para la media y desviación estándar binomiales. MEDIA Y DESVIACIÓN ESTÁNDAR PARA LA VARIABLE ALEATORIA BINOMIAL La variable aleatoria x, el número de éxitos en n intentos, tiene una distribución de probabilidad con este centro y dispersión: Media: Varianza: Desviación estándar:

m  np s2  npq ____ s  npq

www.FreeLibros.me Probabilidad_Mendenhall_05.indd 186

5/14/10 8:34:03 AM

220



CAPÍTULO 6 LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD

DISTRIBUCIONES DE PROBABILIDAD PARA VARIABLES ALEATORIAS CONTINUAS

6.1

Cuando una variable aleatoria x es discreta, se puede asignar una probabilidad positiva a cada uno de los valores que x pueda tomar y obtener la distribución de probabilidad para x. La suma de todas las probabilidades asociada con los diferentes valores de x es 1, pero no todos los experimentos resultan en variables aleatorias que sean discretas. Las variables aleatorias continuas, por ejemplo estaturas y pesos, lapso de vida útil de un producto en particular o un error experimental de laboratorio, pueden tomar los infinitamente numerosos valores correspondientes a puntos en un intervalo de una recta. Si se trata de asignar una probabilidad positiva a cada uno de estos numerosos valores, las probabilidades ya no sumarán 1, como es el caso con variables aleatorias discretas. Por tanto, se debe usar un método diferente para generar la distribución de probabilidad para una variable aleatoria continua. Supongamos que usted tiene un conjunto de mediciones en una variable aleatoria continua y que crea un histograma de frecuencia relativa para describir la distribución de las mismas. Para un pequeño número de mediciones, se puede usar un pequeño número de clases; entonces, a medida que se recolecten más y más mediciones, se pueden usar más clases y reducir el ancho de clase. El perfil del histograma cambiará ligeramente, casi todo el tiempo haciéndose cada vez más irregular, como se muestra en la figura 6.1. Cuando el número de mediciones se hace muy grande y los anchos de clase se hacen muy angostos, el histograma de frecuencia relativa aparece cada vez más como la curva suave que aparece en la figura 6.1d). Esta curva suave describe la distribución de probabilidad de la variable aleatoria continua.

x

Frecuencia relativa

a)

Frecuencia relativa



c)

b)

x

Frecuencia relativa

Histogramas de frecuencia relativa para tamaños muestrales cada vez más crecientes

Frecuencia relativa

FIGURA 6.1

x

d)

x

www.FreeLibros.me Probabilidad_Mendenhall_06.indd 220

5/14/10 8:18:15 AM

6.1 DISTRIBUCIONES DE PROBABILIDAD PARA VARIABLES ALEATORIAS CONTINUAS



221

¿Cómo se puede crear un modelo para esta distribución de probabilidad? Una variable aleatoria continua puede tomar cualquiera de un número infinito de valores de la recta real, en forma semejante al número infinito de granos de arena en una playa. La distribución de probabilidad es creada al distribuir una unidad de probabilidad a lo largo de la recta, igual que como se puede distribuir un puñado de arena. La probabilidad, es decir granos de arena o de mediciones, se apilarán en ciertos lugares y el resultado es la distribución de probabilidad mostrado en la figura 6.2. La profundidad o densidad de la probabilidad, que varía con x, puede ser descrita por una fórmula matemática f(x), llamada distribución de probabilidad o función de densidad de probabilidad para la variable aleatoria x. F I G U R A 6.2

La distribución de probabilidad f (x ); P (a  x  b ) es igual al área sombreada bajo la curva



f(x)

P(a < x < b)

a

MI CONSEJO

Para variables aleatorias continuas, área  probabilidad.

b

x

Varias propiedades importantes de distribuciones continuas de probabilidad son comparables a sus similares discretas. Así como la suma de probabilidades discretas (o la suma de las frecuencias relativas) es igual a 1 y la probabilidad de que x caiga en cierto intervalo puede hallarse al sumar las probabilidades en ese intervalo, las distribuciones de probabilidad tienen las características que se detallan a continuación. • El área bajo una distribución continua de probabilidad es igual a 1. • La probabilidad de que x caiga en un intervalo particular, por ejemplo de a a b, es igual al área bajo la curva entre los dos puntos a y b. Ésta es el área sombreada de la figura 6.2.

MI CONSEJO

El área bajo la curva es igual a 1.

También hay una diferencia importante entre variables aleatorias discretas y continuas. Considere la probabilidad de que x sea igual a algún valor en particular, por ejemplo a. Como no hay área arriba de un solo punto, por ejemplo x  a, en la distribución de probabilidad para una variable aleatoria continua, nuestra definición implica que la probabilidad es 0. • P(x  a)  0 para variables aleatorias continuas. • Esto implica que P(x  a)  P(x  a) y P(x  a)  P(x  a). • Esto no es cierto en general para variables aleatorias discretas. ¿Cómo se escoge el modelo, es decir, la distribución de probabilidad f(x) apropiada para un experimento dado? Existen muchos tipos de curvas continuas para modelar. Algunas son de forma de montículo, como la de la figura 6.1d), pero otras no lo son. En general, trate de escoger un modelo que satisfaga estos criterios: • Se ajusta al cuerpo de datos acumulado. • Permite hacer las mejores inferencias posibles usando los datos.

www.FreeLibros.me Probabilidad_Mendenhall_06.indd 221

5/14/10 8:18:15 AM

222



CAPÍTULO 6 LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD

EJEMPLO

La variable aleatoria uniforme se emplea para modelar el comportamiento de una variable aleatoria continua cuyos valores estén uniforme o exactamente distribuidos en un intervalo dado. Por ejemplo, es probable que el error x introducido al redondear una observación a la pulgada más cercana tenga una distribución uniforme en el intervalo de .5 a .5. La función de densidad de probabilidad f(x) sería “plana” como se muestra en la figura 6.3. La altura del rectángulo está fija en 1, de modo que el área total bajo la distribución de probabilidad es 1.

6.1

FIGURA 6.3

Una distribución uniforme de probabilidad

● 1.50

f(x)

1.25

1.00

0.75

0.50 0.5

0.2

0.0 x

0.2

0.5

¿Cuál es la probabilidad de que el error de redondeo sea menor a .2 en magnitud? Esta probabilidad corresponde al área bajo la distribución entre x  .2 y x  .2. Como la altura del rectángulo es 1,

Solución

P(.2  x  .2)  [.2  (.2)]  1  .4

EJEMPLO

La variable aleatoria exponencial se utiliza para modelar variables aleatorias continuas tales como tiempos de espera o vidas útiles asociadas con componentes electrónicos. Por ejemplo, el tiempo de espera en una caja de pago de un supermercado tiene una distribución exponencial con un tiempo de espera promedio de 5 minutos. La función de densidad de probabilidad f(x)  .2e.2x se ilustra en la figura 6.4. Para hallar áreas bajo esta curva, se puede usar el hecho de que P(x  a)  e.2a para a  0. ¿Cuál es la probabilidad de que usted tenga que esperar 10 minutos o más en la caja de pago del supermercado?

6.2

Solución La probabilidad a calcular es el área sombreada en la figura 6.4. Use la fórmula general para P(x  a) para hallar

P(x  10)  e.2(10)  .135 FIGURA 6.4

Una distribución de probabilidad exponencial

● 0.20

f(x)

0.15

0.10

0.05

0.00 0

5

10

15

20

x

www.FreeLibros.me Probabilidad_Mendenhall_06.indd 222

5/14/10 8:18:15 AM

6.2 LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD



223

Su modelo puede no siempre ajustar perfectamente la situación experimental, pero debe tratar de escoger un modelo que mejor se ajuste al histograma de frecuencia relativa poblacional. Cuanto mejor se aproxime el modelo a la realidad, mejores serán las inferencias. Por fortuna, muchas variables aleatorias continuas tienen distribuciones de frecuencia de forma de montículo, por ejemplo los datos de la figura 6.1d). La distribución normal de probabilidad da un buen modelo para describir este tipo de datos.

LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD

6.2

Las distribuciones de probabilidad continua pueden tomar varias formas, pero un gran número de variables aleatorias observadas en la naturaleza poseen una distribución de frecuencia que tiene más o menos la forma de montículo, o bien, como diría un estadístico, es aproximadamente una distribución normal de probabilidad. La fórmula que genera esta distribución se muestra a continuación.

DISTRIBUCIÓN NORMAL DE PROBABILIDAD 1___ e(xm) /(2s ) f (x)  ______ s兹2p 2

2

  x 

Los símbolos e y p son constantes matemáticas dadas en forma aproximada por 2.7183 y 3.1416, respectivamente; m y s (s  0) son parámetros que representan la media poblacional y desviación estándar, respectivamente. La gráfica de una distribución normal de probabilidad con media m y desviación estándar s se muestran en la figura 6.5. La media m localiza el centro de la distribución, y la distribución es simétrica alrededor de su media m. Como el área total bajo la distribución normal de probabilidad es igual a 1, la simetría implica que el área a la derecha de m es .5 y el área a la izquierda de m es también .5. La forma de la distribución está determinada por s, la desviación estándar de la población. Como se puede ver en la figura 6.6, valores grandes de s reducen la altura de la curva y aumentan la dispersión; valores pequeños de s aumentan la altura de la curva y reducen la dispersión. La figura 6.6 muestra tres distribuciones normales de probabilidad con diferentes medias y desviaciones estándar. Nótense las diferencias en forma y ubicación.

F I G U R A 6.5

Distribución normal de probabilidad



f(x)

El área a la izquierda de la media es igual a .5

μ– σ

El área a la derecha de la media es igual a .5

μ

μ+ σ

x

www.FreeLibros.me Probabilidad_Mendenhall_06.indd 223

5/14/10 8:18:15 AM

224



CAPÍTULO 6 LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD

FIGURA 6.6

Distribuciones normales de probabilidad con valores de m y s que difieren



f(x)

x

MI APPLET El applet Java llamada Visualizing Normal Curves (Visualizar Curvas Normales) da una imagen visual de la distribución normal para valores de m entre 10 y 8 y para valores de s entre .5 y 1.8. La curva azul oscuro es la normal estándar z con media 0 y desviación estándar 1. Se puede usar este applet para comparar su forma con la forma de otras curvas normales (la curva roja en su monitor, azul claro en la figura 6.7) al mover los cursores para cambiar la media y desviación estándar. ¿Qué ocurre cuando se cambia la media? ¿Y cuando se cambia la desviación estándar? FIGURA 6.7

Applet Visualizing Normal Curves (Visualizar Curvas Normales)



Raras veces se encuentra una variable con valores que sean infinitamente pequeños ( ) o infinitamente grandes ( ). Aun así, muchas variables aleatorias positivas (por ejemplo estaturas, pesos y tiempos) tienen distribuciones que son bien aproximadas por una distribución normal. De acuerdo con la Regla empírica, casi todos los valores de una variable aleatoria normal se encuentran en el intervalo m 3s. Mientras los valores dentro de tres desviaciones estándar de la media sean positivos, la distribución normal da un buen modelo para describir los datos.

www.FreeLibros.me Probabilidad_Mendenhall_06.indd 224

5/14/10 8:18:15 AM

6.3 ÁREAS TABULADAS DE LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD



225

ÁREAS TABULADAS DE LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD

6.3

Para hallar la probabilidad de que una variable aleatoria normal x se encuentre en el intervalo de a a b, necesitamos hallar el área bajo la curva normal entre los puntos a y b (véase la figura 6.2). No obstante (véase la figura 6.6), hay un número infinitamente grande de distribuciones normales, uno para cada media y desviación estándar diferentes. Una tabla separada de áreas para cada una de estas curvas es obviamente impráctica; en cambio, usamos un procedimiento de estandarización que nos permite usar la misma tabla para todas las distribuciones normales.

La variable aleatoria normal estándar Una variable aleatoria normal x está estandarizada al expresar su valor como el número de desviaciones estándar (s) que se encuentran a la izquierda o derecha de su media m. Éste es realmente sólo un cambio en las unidades de medida que usamos, como si estuviéramos midiendo en pulgadas en lugar de pies. La variable aleatoria normal estandarizada, z, se define como z

xm s

MI CONSEJO

o bien, lo que es equivalente,

El área bajo la curva z es igual a 1.

x  m zs De la fórmula para z, podemos sacar estas conclusiones: • Cuando x es menor que la media m, el valor de z es negativo. • Cuando x es mayor que la media m, el valor de z es positivo. • Cuando x  m, el valor de z  0. La distribución de probabilidad para z, ilustrada en la figura 6.8, se denomina distribución normal estandarizada porque su media es 0 y su desviación estándar es 1. Los valores de z del lado izquierdo de la curva son negativos, en tanto que los del lado derecho son positivos. El área bajo la curva normal estándar a la izquierda de un valor especificado de z, por ejemplo z0, es la probabilidad P(z  z0). Esta área acumulativa está registrada en la tabla 3 del apéndice I y se muestra como el área sombreada en la figura 6.8. Una versión abreviada de la tabla 3 se da en la tabla 6.1. Observe que la tabla contiene valores positivos y negativos de z. La columna izquierda de la tabla da el valor de z correcto al décimo lugar; el segundo lugar decimal para z, correspondiente a las centenas, se da en el renglón superior.

F I G U R A 6.8

Distribución normal estandarizada



f(z)

(–)

0

z0

(+)

z

www.FreeLibros.me Probabilidad_Mendenhall_06.indd 225

5/14/10 8:18:15 AM

7.2 PLANES MUESTRALES Y DISEÑOS EXPERIMENTALES



255

INTRODUCCIÓN

7.1

En los tres capítulos previos, usted ha aprendido mucho acerca de distribuciones de probabilidad, por ejemplo las distribuciones binomiales y normales. La forma de la distribución normal está determinada por su media m y su desviación estándar s, mientras que la forma de la distribución binomial está determinada por p. Estas medidas numéricas descriptivas, llamadas parámetros, son necesarias para calcular la probabilidad de observar resultados muestrales. En situaciones prácticas, usted puede decidir qué tipo de distribución de probabilidad usar como modelo, pero los valores de los parámetros que especifican su forma exacta se desconocen. A continuación veamos dos ejemplos:

MI CONSEJO

Parámetro ‹ Población Estadística ‹ Muestra

• Un entrevistador está seguro de que las respuestas a sus preguntas “de acuerdo/en desacuerdo” seguirán una distribución binomial, pero se desconoce p, la proporción de quienes están “de acuerdo” de la población. • Un agrónomo cree que la producción por acre de una variedad de trigo está distribuida normalmente en forma aproximada, pero se desconocen la media m y desviación estándar s de la producción. En estos casos, debemos apoyarnos en la muestra para saber de estos parámetros. La proporción de quienes están “de acuerdo” en la muestra del entrevistador da información acerca del valor real de p. La media y desviación estándar de la muestra del agrónomo aproximan los valores reales de m y de s. ¡Pero, si se desea que la muestra dé información confiable acerca de la población, la muestra debe ser seleccionada en cierta forma!

PLANES MUESTRALES Y DISEÑOS EXPERIMENTALES

7.2

La forma en que una muestra se selecciona recibe el nombre de plan muestral o diseño experimental y determina la cantidad de información de la muestra. Saber el plan muestral empleado en una situación particular permitirá medir la confiabilidad o bondad de la inferencia. El muestreo aleatorio simple es un plan muestral de uso común en el que cada muestra de tamaño n tiene la misma probabilidad de ser seleccionado. Por ejemplo, supongamos que se desea seleccionar una muestra de tamaño n  2 de una población que contiene N  4 objetos. Si los cuatro objetos están identificados por los símbolos x1, x2, x3 y x4, hay seis pares distintos que podrían seleccionarse, como se ve en la tabla 7.1. Si la muestra de n  2 observaciones se selecciona de modo que cada una de estas seis muestras tenga la misma probabilidad de selección, dada por 1/6, entonces la muestra resultante se denomina muestra aleatoria simple o únicamente muestra aleatoria.

T A B L A 7 .1



Formas de seleccionar una muestra de tamaño 2 de entre 4 objetos Muestra 1 2 3 4 5 6

Observaciones en la muestra x1, x2 x1, x3 x1, x4 x2, x3 x2, x4 x3, x4

www.FreeLibros.me Probabilidad_Mendenhall_07.indd 255

5/14/10 8:43:28 AM

256



CAPÍTULO 7 DISTRIBUCIONES MUESTRALES

Definición Si una muestra de n elementos se selecciona de entre una población de N elementos, usando un plan muestral en el que cada una de las posibles muestras tiene la misma probabilidad de selección, entonces se dice que el muestreo es aleatorio y la muestra resultante es una muestra aleatoria simple.

Un muestreo aleatorio perfecto es difícil de obtener en la práctica. Si el tamaño N de la población es pequeño, se podría escribir cada uno de los N números en una ficha, mezclar las fichas y seleccionar una muestra de n fichas. Los números que seleccione corresponden a las n mediciones que aparecen en la muestra. Como este método no siempre es práctico, un método más sencillo y confiable utiliza números aleatorios, es decir, dígitos generados de modo que los valores de 0 a 9 se presentan al azar y con igual frecuencia. Estos números pueden ser generados por computadora o pueden incluso aparecer en una calculadora científica. De manera opcional, la tabla 10 del apéndice I es una tabla de números aleatorios que se pueden usar para seleccionar una muestra aleatoria. EJEMPL O

7.1

Una base de datos de computadora en una empresa urbana de abogados contiene archivos para N  1000 clientes. La empresa desea seleccionar n  5 archivos para revisión. Seleccione una muestra aleatoria simple de cinco archivos de esta base de datos. Solución Primero debe marcar cada archivo con un número de 1 a 1000. Quizá los

archivos se guarden alfabéticamente y la computadora ya ha asignado un número a cada uno. A continuación genere una secuencia de 10 números aleatorios de tres dígitos. Si está usando la tabla 10 del apéndice I, seleccione un punto inicial aleatorio y use una parte de la tabla similar a la de la tabla 7.2. El punto inicial aleatorio asegura que usted no use la misma secuencia una y otra vez. Los primeros tres dígitos de la tabla 7.2 indican el número del primer archivo a revisarse. El número aleatorio 001 corresponde al archivo #1 y el último archivo, #1000 corresponde al número aleatorio 000. Usando la tabla 7.2, se escogerían los cinco archivos numerados 155, 450, 32, 882 y 350 para revisión. De manera opcional, podría escoger leer en sentido horizontal las líneas y escoger los archivos 155, 350, 989, 450 y 369 para revisión.

T A B L A 7 .2



Parte de una tabla de números aleatorios 15574 45045 03225 88292

35026 36933 78812 26053

98924 28630 50856 21121

La situación descrita en el ejemplo 7.1 se denomina estudio observacional, porque los datos ya existían antes que usted decidiera observar o describir las características de ellos. La mayor parte de los estudios muestrales, en los que la información se capta con un cuestionario, caen en esta categoría. Las bases de datos de computadora hacen posible asignar números de identificación a cada elemento aun cuando la población sea grande y seleccionar una muestra aleatoria simple. Tenga cuidado al efectuar un estudio muestral y esté atento a estos problemas que se presentan con frecuencia: • No respuesta: Usted ha seleccionado su muestra aleatoria y enviado sus cuestionarios, pero sólo 50% de los entrevistados devolvió sus cuestionarios. ¿Las respuestas que usted recibió son representativas de toda la población o están sesgadas porque sólo quienes eran particularmente obstinados en el tema fueron escogidos para responder?

www.FreeLibros.me Probabilidad_Mendenhall_07.indd 256

5/14/10 8:43:29 AM

7.2 PLANES DE MUESTREO Y DISEÑOS EXPERIMENTALES



257

• Cobertura demasiado baja: Usted ha seleccionado su muestra aleatoria usando registros telefónicos como una base de datos. ¿La base de datos que usó sistemáticamente excluye ciertos segmentos de la población, quizá aquellos que no tienen teléfono? • Sesgo verbal: El cuestionario de usted puede tener preguntas que son demasiado complicadas o tienden a confundir al lector. Posiblemente las preguntas son sensibles por naturaleza, por ejemplo, “¿Alguna vez ha consumido usted drogas?” o “¿Alguna vez ha engañado en su declaración de impuestos?” y quienes responden no contestan con la verdad. Se han diseñado métodos para resolver algunos de estos problemas, pero sólo si usted sabe que existen. Si su encuesta está sesgada por cualquiera de estos problemas, entonces sus conclusiones no serán muy confiables, aunque haya seleccionado una muestra aleatoria. Alguna investigación realizada comprende la experimentación, en la que una condición experimental o tratamiento se impone en las unidades experimentales. Seleccionar una muestra aleatoria simple es más difícil en esta situación. EJEMP LO

7.2

Una química investigadora está sometiendo a prueba un nuevo método para medir la cantidad de titanio (Ti) en muestras de mineral. Ella selecciona 10 muestras de mineral del mismo peso para su experimento. Cinco de las muestras se medirán usando un método estándar y las otras cinco usando el nuevo método. Use números aleatorios para asignar las 10 muestras de mineral a los grupos nuevo y estándar. ¿Estos datos representan una muestra aleatoria simple de entre la población? Solución Hay realmente dos poblaciones en este experimento. Están formadas por mediciones de titanio, usando ya sea el método nuevo o el estándar, para todas las posibles muestras de mineral de este peso. Estas poblaciones no existen en realidad; son poblaciones hipotéticas, imaginadas en la mente de la investigadora. Entonces, es imposible seleccionar una muestra aleatoria simple usando los métodos del ejemplo 7.1. En cambio, la investigadora selecciona lo que ella cree que son 10 muestras representativas de mineral y espera que estas muestras se comportarán como si se hubieran seleccionado al azar de las dos poblaciones. La investigadora puede, no obstante, seleccionar al azar las cinco muestras a medir con cada método. Numere las muestras del 1 al 10. Las cinco muestras seleccionadas para el nuevo método pueden corresponder a cinco números aleatorios de un dígito. Use esa secuencia de dígitos aleatorios generados en una calculadora científica: 948247817184610 Como no se puede seleccionar dos veces la misma muestra de mineral, hay que saltarse cualquier dígito que ya haya sido escogido. Las muestras 9, 4, 8, 2 y 7 se medirán usando el nuevo método. Las otras muestras, es decir 1, 3, 5, 6 y 10, se medirán usando el método estándar. Además del muestreo aleatorio simple, hay otros planes muestrales con carácter aleatorio y, por tanto, dan una base probabilista para hacer inferencias. Tres de esos planes están basados en muestreo estratificado, conglomerado y sistemático. Cuando la población está formada por dos o más subpoblaciones, llamadas estratos, un plan muestral que asegura que cada subpoblación está representada en la muestra se denomina muestra aleatoria estratificada. Definición Un muestreo aleatorio estratificado comprende seleccionar una mues-

tra aleatoria simple de cada uno de un número dado de subpoblaciones o estratos.

www.FreeLibros.me Probabilidad_Mendenhall_07.indd 257

5/14/10 8:43:29 AM

Copyright © 2024 DOKUMEN.SITE Inc.