APUNTES ESTADISTICA INFERENCIAL

March 22, 2018 | Author: Zully De Flores | Category: Sampling (Statistics), Probability, Sample Size Determination, Statistics, Probability And Statistics


Comments



Description

5UNIDAD I.-MUESTREO Y DISTRIBUCIÓN DE MUESTREO OBJETIVO GENERAL Al finalizar la unidad el estudiante será capas de: determinar la magnitud de una muestra, el tipo de muestreo que debe realizar, basándose en las características de la población. 1.-Muestreo y Distribuciones de Muestreo Es la tècnica o herramienta para seleccionar una muestra de una poblaciòn definida de elementos a estudio, con el objeto de estimar paràmetros poblacionales, por ejemplo: medidas ( promedios, varianza y desviaciòn), para inferir sobre la poblaciòn a partir de una muestra. 1.1. Poblaciones y muestras. En estadìstica es común y usual emplear la palabra “poblaciòn” cuando se hace referencia a elementos que han sido determinados para su estudio, mientras que la aplicaciòn de la palabra “muestra”, cuando se describen una porción seleccionada de la poblaciòn. Cualquier tipo de negociación o empresa tanto privada como pública (dependencia), lucrativas y no lucrativas tienen la necesidad de conocer el estado que guardan en cuanto a su funcionamiento las entidades. Es decir, las variaciones, su crecimiento, sus finanzas, los volúmenes de producciòn, los mercados, el empleo, consumidores hogares, etc., situación que desde un punto de vista primario para los dueños, socios, directores, gerentes es difícil dado que los elementos que integran dichas entidades, aunque son en número finitos èstos son muy numerosos. Pero esta situación implica la búsqueda de la tècnica para conocer la situación la cual se mencionará un poco más adelante Con base en lo descrito por muchos autores, es importante indicar algunos ejemplos que enseñan claramente los apuros a los que los dueños de empresas, directores, gerentes, encargados, los consumidores, etc., se enfrentan para poder inferir sobre la poblaciòn (cuando se habla de poblaciòn se refiere al número de elementos que la conforman) y sobre todo si su campo de acción se encuentra diseminado en muchas partes del país o del mundo. Como se puede observar y entender es basta la información que existe por lo que es necesario aplicar la teoría del muestreo. ¿Qué significa esto? . Significa en primer lugar estar seguros o tener la certeza de encontrar o calcular un paràmetro, a través de un estadistico derivado del estudio de una muestra de la poblaciòn. En segundo término estar seguro o confiar en que el tamaño de la 6 muestra refleje una representatividad de la poblaciòn. A estas dos consideraciones que son importantes en la investigación obligadamente aterriza en la decisiòn de diseñar o determinar la poblaciòn a estudio de la cual se hará la selección de la muestra adecuada. En las grandes empresas o negocios públicos o privados es importante inferir sobre indicadores o peràmetros después de análisis o examinar una parte de una poblaciòn del producto o servicios que ofrecen,o en forma peraonal Por ello es preciso establecer ciertos criterios para la toma de decisiòn. Siguiendo tal criterior se expone el planteramiento siguiente: “Asì, se ofrece una muestra gratis de un nuevo producto alimenticio en un supermercado; se prueba un pedazo de pastel para saber si ya està frìo; y un cocinero prueba la sopa para saber si necesita un poco màs de sazòn. En forma semejante cuando se hojea un nuevo libro o revista, se mide un traje, sale con una persona por primera vez o ve un programa de televisión durante unos cuantos minutos antes de decidir a cambiar de canal, en realidad està muestreando” WilliM j. Stevenson, Estadistica para Administraciòn y Economìa, conceptos y aplicaciones, 2010, Mèxico D.F. Alfaomega, p185 Llegamos a la conclusión que cuando aplicamos la tècnica del muestreo estadistico es comparable con los ejemplos mensionados en párrafo anterior, pero suponemos que para esta tècnica se emplean métodos formales y con un grado màs de precisión. Es muy usual también refiriéndonos a los compradores –consumidores- que cuando desean adquirir algún bien tangible o intangible y sobre todo cuando éste es de naturaleza del primero, normalmente, para tomar una decisión necesita saber si es bueno o es perfecto. Lo anterior lo sitúa en un momento crítico ya que existe un gran universo de tales bienes -que en estadística debe entenderse como población-, por lo que ante ese dilema –momento crítico-, tiene que hacer uso de una muestra para conocer las características de esa población. Algunos ejemplos tan sencillos que le darán al estudiante idea clara son quizá cuando nos referimos a casos específicos que aquí se mencionan: cuando alguien va de compras al mercado normalmente si desea comprar un producto lo prueba primero para tomar una decisión y comprarlo. Por lo que determinan adquirirlo a partir de un pedazo del producto completo. Lo mismo hace un químico cuando toma una muestra de sangre para la prueba de laboratorio, el catador de wisky de una barrica, determina 7 que es de grado 90 e infiere que todo el wisky de esa barrica es de ese grado. Ahora si el comprador del producto se lo termina todo que compraría y le haría un mal de salud, por su parte si el químico extrajera toda la sangre del la persona y animal simplemente estos se morirían, de igual manera si el personaje se bebiera todo el wisky le haría mal y ya no tendría que vender examinara todo el wisky o los compradores probaran todo el queso, no quedaría nada para vender. Por lo tanto se puede considerar que para conocer las características de un todo (población), se debe aplicar la técnica del muestreo. De lo anterior se puede comprender que para fines de un estudio específico es necesario determinar claramente la población a estudio, y sobre todo, determinar la o las características que de ese universo -población- que se desea conocer y hacer inferencia sobre la misma. Es importante destacar en estas líneas que resulta bastante improductivo intentar analizar a todos los elementos de una población, porque por ejemplo si se piensa en conocer una característica de éstos en su totalidad –elementos de la población, se perdería tiempo y se tendrían costos muy elevados. Si lo anterior sucediera no tendría razón aplicar las técnicas ni los métodos para estimación de un parámetro a través de una muestra. De lo anterior y antes de proseguir con la identificación de otros conceptos relacionados con las poblaciones y muestras, se puede establecer que se debe entender entonces por población como: un conjunto de elementos que integran un universo a estudio -se menciona elementos ya que se trata tanto de cosas como de atributos personales- (edad, estado civil, entre otros), de igual manera la muestra se determinará para este caso: como una porción o un subconjunto de los elementos de una población y através de su análisis poder hacer inferencias sobre ésta última. Se establecen en este apartado dos tipos de población: población finita cuando se conoce el límite, por ejemplo 1500 canicas, 500 viviendas etc., población infinita cuando no se conoce su límite o el número de elementos, por ejemplo, la arena de la playa población en la que es teóricamente imposible observar todos los elementos. Parece meritorio considerar que como ejercicio se puede poner en práctica la imaginación y creatividad para poder determinar muchos casos en los que se tienen que jugar como determinar una población y derivar una muestra fracción, -porción, subconjunto- de la misma, se puede agregar más conceptos al conocimiento porque recordemos que sólo practicando ejemplos y su relación con las teorías es posible el dominio y su aplicación 1.2 Parámetros y estadísticos Si este estadístico es convincente. Como se ilustra a continuación. suelen usarse símbolos griegos y letras latinas minúsculas. la desviación muestral que se simboliza por ṡ.5 kg.es de µ=70. Levin 2010. la varianza muestral que se simboliza por ṡ2 . “Matemáticamente.es de 1500. Pearson. son la media poblacional que se simboliza por µ la varianza que se simboliza por σ2 y desviación estándar que se simboliza por σ. la mediana. respectivamente. la moda y la desviación estándar…Cuando éstos términos describen las características de una muestra. de los cuales fueron muestreados –seleccionados 250-. También dará una idea de la forma de que en un momento determinado un estadístico puede considerarse –convertirse. Véase lo siguiente: Por ejemplo se tiene interés en conocer el peso promedio de los estudiantes que ingresaron en el año 2007 en una universidad de prestigio en el área del Sureste de los Estados Unidos de Norteamérica. 236 El siguiente ejemplo puede quizá ilustrar de forma más clara sobre la identificación de lo que es un estadístico y un parámetro que son de suma importancia en la tarea de la investigación de cualquier persona interesada en la misma. tiene como parámetro que el peso medio – promedio. Cuando describen las características de una población. podemos describir muestras y poblaciones al emplear mediciones como la media. cuya población –universo. Mèxico. Levin Estadística para Administración y Economìa Richard I.5 kg. p. Generalmente para distinguir cuando se trabaja con parámetros y estadísticos. se tiene la mejor alternativa de elegir una decisión. se les conoce a aquellos datos numéricos que representan características de una muestrea.8 Partiendo de las siguientes concepciones de lo que es un parámetro y un estadístico al describir que: Parámetros son todos aquellos valores que indican las características de una población determinada.en un parámetro poblacional. De igual manera los estadísticos o estadísticas que son la media muestral que se simboliza por ẋ -se lee equis barra-. entonces se puede considerar que la población –universo-. se llaman parámetros” Richard I. ya que del conocimiento de estos conceptos –estadístico y parámetro-. Considerar en este sentido a todos aquéllos valores que de naturaleza cuantitativa se pueden derivar del análisis de una población a través de su muestra. . mientras que los estadísticos. se denominan estadísticas. La característica de la población estudiantil es el peso. -parámetros de la población-. En este proceso se obtuvo como resultado que el peso promedio muestral fue de ẋ=70. 3 Muestreo El muestreo es una técnica utilizada para conocer ciertas características de una población y consiste en seleccionar en forma aleatoria ciertos elementos de una población o universo.Levin 1998) 1.de una población. . y su importancia se puede resumir en las ventajas que se tienen al seleccionar en forma aletaroria –al azar. Las grandes empresas importantes presentan problemas de diferente índole que conllevan contratiempos en su desarrollo desde la perspectiva del sistema de economía de mercado.algunos elementos –muestra. Este hecho representa un dilema para ser certeras en la toma de decisiones y que lo resuelven sólo a través de estudios. en donde juega un papel importante el muestreo.9 Tabla Diferencias entre poblaciones y muestras Definición Población Colección de elementos considerados “Parámetros” Tamaño de la población =N Media de la población =µ Desviación estándar de la población =σ Muestra Parte o porción de la población para su estudio “Estadísticas” Tamaño de la muestra =n Media muestral =ẋ Desviación estándar de la muestra =Ș Características Símbolos (Richard I. en donde tienen que actuar dentro de estándares de la calidad y la competitividad. 3. es decir.1 Razones que justifican el muestreo . conocer ese parámetro. aplicando las siguientes fórmulas que se utilizan con frecuencia: µ=∑Xj (media de la población) N σ=∑(xj-µ)2 (desviación poblacional) N De esta forma se calcula la media poblacional y la desviación estándar.tenga idea clara de esas características que intrínsecamente tiene la población. El resultado del análisis de esa fracción muestral ( ẋ=$15. tener cierta experiencia en la materia. Como la población aún cuando se puede decir que es finita. En ese sentido lo que interesa a la empresa es conocer el ingreso promedio mensual de esas familias (población). y su análisis (ẋ=ΣX/n). La media y la desviaciòn de una muestra están dadas por: ẍ = Σx∕n ( media muestral) s= ( x-ẍ )2∕n-1 Cuando se tiene que determinar una población para muestrear. de lo que seguramente se rescatarán más ideas para comprender el papel tan importante que tiene el muestreo en la actividad industrial y de servicios Háblese de una población cuyos elementos son familias. se puede transcribir ejemplo real. es importante que el responsable –investigador. lo cual hace necesario minimizar el tiempo y costos seleccionando 85 páginas. Por ejemplo si se tiene una población de 1200 familias seleccionar el tamaño de la muestra que se identifica con ene minúscula (n) y esta es n=150. según sean las características de interés. que se tiene que estudiar con el fin de introducir un producto en la misma. sea ẋ=6 errores en promedio por cada página del escrito. Otra idea es.000.10 En congruencia con lo anterior. si se desea conocer por ejemplo el parámetro o promedio de errores ortográficos por página que hay en un escrito de 600 páginas. Esta tarea es posible su atención. es imposible en términos de tiempo y económìa su estudio. Lo cual le permitirá determinar el tamaño de la muestra para su análisis 1.00 mensuales). por lo que es necesario seleccionar en forma aleatoria una muestra de esa población. es decir. que se conoce como estadístico y que se constituye como un parámetro de la población. realiza una selección aleatoria de estas como una muestra representativa a la cual aplicará la encuesta. Por eso si una empresa por ejemplo. se considera necesario seleccionar aleatoriamente cierto número de los elementos (habitantes). se requerirían 200 años para ponerse en contacto con todavla poblaciòn en edad de votar…” Douglas A. en donde todos los elementos de la misma se destruyen en la prueba (si es de resistencia por ejemplo). 1. primero definir el tipo de población en este caso (familias) y supone que la población a estudio es de 500 familias.-Es posible encontrarse con muestras destructivas. ante la imposibilidad de aplicar encuesta a todos los habitantes que son muchos para conocer el resultado de su objetivo.Los costos que implican el estudio de todos los elementos de una población. es imposible establecer el contacto con todos los elementos de esta (población) de esta razón se pueden considerar muchos ejemplos cotidianos: Véase el siguiente ejemplo: Un candidato propuesto por un partido X quizás desea conocer el grado de popularidad y aceptación en cierta región del lugar. P. y laborando siete días a la semana. como muestra de la población. por lo que se pueden argumentar muchas razones para justificar esta técnica. por ello se toma una muestra de esa población. Se puede asegurar que aún cuando la población a estudio sea finita. las placas de acero. El procedimiento o proceso es. Cierta cantidad del agua del mar se constituye en una población infinita ( sin límite).. China McGraw-Hill. Lo cual quiere decir que si se prueba a toda la población desaparecería esta y ya no se tendría que atender o vender en su caso. tiene el interés de introducir en el mercado un producto o un servicio.11 Ya se ha señalado que para estudiar una población determinada. sin embargo. es importante considerar el tiempo y los costos entre otros aspectos. Otros casos podrían referirse de la siguiente manera: Considérese ejemplos como: Las poblaciones de bacterias son demasiado grandes que para el químico del laboratorio resultaría imposible realizar el análisis de cada una de ellas. Esta justificación tiene relación con lo que expone “Con el mismo personal y los mismos entrevistadores. Ejemplo: Se desea introducir una lavadora de lujo en el mercado. 261. parece recomendable señalar algunas de ellas. después de determinar su población. por lo que esta situación es otra de las justificaciones de las empresas y oficinas. con el objeto de minimizar sus costos de la investigación tiene que muestrear dicha población. resultarían muy elevados. Lind. por ello se toma una porción de la misma para su análisis. tanto públicas como privadas que toman en consideración para sus estudios. cables y productos similares deben contar con una resistencia mínima al grado de tensión. Ejemplificando esta situación. Para cerciorarse de . William G. en Estadística aplicada a los Negocios y la Economía 2007. 2. 3. como le es muy costoso visitar a cada una de ellas. en el área de producción de una industria. si es el caso de una gran cadena de tiendas de autoservicio. por ejemplo. en relación al precio. en los productos de la canasta básica (alimentos). para conocer el índice de precios de estos productos. Muestreo de juicio y probabilístico . esta resulta representativa de la población que se estudia. sino que se tomará una muestra en forma aleatoria de las tiendas.3. Dichas piezas se someten a tensión hasta que de rompen. 4. no es necesario analizar el 100% de tiendas.2. 1.12 que el producto satisface la norma mínima aleatoriamente se elige una muestra del producto.-Porque se sabe que si se selecciona adecuadamente una muestra. Este hecho se da en los estudios que se tienen que realizar. . pero es indispensable la opiniòn del experto Ejem plos: *el caso los legisladores.-ESTRATIFICADO 6.-SISTEMATICO 5.-PROBABILISTICO 3.-ALEATORIO SIMPLE 4.-DE JUICIO U OPINIÒN *No interviene la probabilidad. *el caso del guardabosque *el caso de Control escolar. Para conocer la situaciòn de una ley.-POR CONGLOMERADOS.-MUESTREO DE JUICIO U OPINIÒN 2. basta con abordar para lainvestigaciòna un diputado o senador. 1.13 TIPOS DE MUESTREO 1. La form a se asegurar que todos los empleados tienen la m ism a posibilidad de ser elegidos consiste en escribir el nùmero de plaza de cada empleado en papelitos y depositarlos todos en una caja. MUESTREO ALEATORIO SIMPLE *Muestra seleccionada en la que cada elemento o individuo de la poblaciòn tenga la m ism a probabilidad de ser incluido.. EJEMPLO: *De una poblaciòn de 845 empleados de una empresa “X” se va a elegir una muestra de 50 empleados. se van extayendo hasta completar los 50 que integran la m uestra decidida.indicar otros… .14 PROBABILISTICO * Tienen esta característica los dem às m étodos de m uestreo que se estudiaran: *infiere la existencia de la probabilidad que existe de que todos los elementos sean seleccionados en una m uestra. a cada 18vo. El procedim iento es que de una poblaciòn determ inada se determ ina primero la m uestra a estudio. Plantear otros ejem plos… ALEATORIO ESTRATIFICADO *La poblaciòn definida se divide en grupos o estratos. es decir para determ inar la muestra la selecciòn se hara cada kèsim o elemento de la poblacipon. En este sentido se considera que las caracterìsticas de la poblaciòn son relativam ente homogèneas. Se divide la poblaciòn entre la muestra para obtener el valor de k del valor de esta se seleccionarà al azar un elemento de K. de una poblaciòn de 2000.15 ALEATORIO SISTEMÀTICO *Seleccionar un punto aleatorio de partida o inicio. El valor de K es 20. es decir. EJEMPLO: *Suponiendo que los pacientes de un mèdico se integran en grupos de acuerdo con su edad. Nùmero se eligiràn los elem entos. el galeno desea averiguar cuantas horas duermen sus pacientes. seleccionando aleatoriamente una muestra de cada estrato. eligiendo posteriormente el valor de k que serà el inicio. se desea seleccionar una muestra de 100. 2000/100 = 20. (…) . EJEMPLO: De una empresa “X” . se elige al azar un elemento del valor de K. Si èste llegara a ser el 18. para ello tom a una m uestra aleatoria de cada estrato. sin embargo.que reúnen las condiciones para ser seleccionados. en conglomerados y se puede seleccionar una muestra de unidades y poner su atención en todos los elementos de cada unidad. Si se tienen 12 unidades se pueden seleccionar digamos 4. que represente significativamente las características de una población. debe tener idea clara sobre la población determinada. poder estar en condiciones de inferir sobre ésta para la toma de decisiones.16 MUESTREO POR CONGLOMERADOS *La población se divide en unidades prim arias. puede ser interpretado por varios autores por su naturaleza y necesidad de ser considerado para la atención de un problema a resolver de una población determinada. Por definición el muestreo de juicio. Por ejemplo. para saber cuales serán los elementos –arboles. el que va estar al frente de la responsabilidad del estudio. Tomando en cuenta lo anterior. EJEMPLO: *Se desea conocer la opiniòn de los residentes de algùn estado con referencia a las polìticas federales y estatales de protecciòn am biental. Además de lo dicho. en un gran bosque. Se considera que para este caso las características deben ser hom ogéneas. el investigador tiene que determinar la tala de los arboles que ya están en la etapa de ser derribados para la producción. Como es de observarse no se puede seleccionar en forma aleatoria una muestra de la población. es decir. . o si es el caso podrá seleccionarse ciertos elementos de cada unidad elegida. El determinar una muestra seguramente va a estar en función de la necesidad de la información que se busque de dicha población –se quiere decir que no es el mismo método de muestreo aplicado para todos los casos-. a través de una forma de definirlo aquí se plantea el comentario en razón de lo que significa de manera personal. sino que cuenta sólo la opinión del responsable del estudio. para considerar la forma y el número de elementos al seleccionar una muestra. para atender a todos los residentes de las unidades La teoría puede proporcionar –de hecho es su función. este muestreo: es un método que se puede utilizar en donde no interviene la probabilidad de que todos y cada uno de los elementos de una población pueden ser seleccionados.diferentes alternativas. se procede a tratar de desarrollar en primer lugar lo que es el muestreo de juicio y probabilístico. es decir. En este caso el investigador tendrá que oír y atender la opinión del guardabosque. Williams. En el muestreo aleatorio simple se refiere a la forma de seleccionar ciertos elementos de manera que cada integrante que conforman la poblaciòn (finita) posee la misma probabiliad de formar parte de la muestra a seleccionar. será una técnica muy práctica ya que es muy usual. Marchal y Samuel A. que se verán más adelante son nuestros en donde interviene la probabilidad. si se desea seleccionar una muestra de 50 estudiantes de una población de 500. Esta forma no es la única pueden utilizarse otras más. Sweeney y Thomas A. es decir. sistemático. la veracidad o calidad del resultado de la muestra. William G. porque después de ello se tendrá que hacer inferencias acerca de la población. para determinar el promedio en aprovechamiento de un determinado ciclo escolar.17 Este método se considera una de las formas sencillas en el proceso de selección. como es consecutiva y meterlos en una urna e ir extrayendo sin reposición hasta completar la muestra. 1. Watheh 2007). Por ejemplo. Muestreo aleatorio simple. sin embargo. si partimos desde el punto de vista de lo que significa la probabilidad. Dennis J. (David R. Lind y . Procedimiento siguiente es ir extrayendo cada uno hasta completar la muestra. estratificado y por conglomerados.3. estratificado y por conglomerados. Con frecuencia se dan casos en que en forma empírica se utilizan en eventos. la calidad de los resultados muestrales dependen del juicio de la persona que que selecciona la muestra. En el muestreo probabilístico. por ejemplo de un grupo de individuos que se dedican a una misma función (los legisladores) diputados de los que se necesita conocer su opinión en relación a un proyecto o ley. entonces se entiende que los demás tipos de muestreos: aleatorio simple. para después hacer inferencias acerca de poblaciones”. los 54 elementos que previamente fue considerado (véase tema en Douglas A. Esta forma de seleccionar la muestra -muestreo aleatorio simple-. la técnica sería seleccionarse la muestra escribiendo en tiras de papel las dos últimas cifras de la matrícula -500-.3. Anderson. Mèxico. estará reforzada con el juicio de los diputados seleccionados. para determinar resultados y la toma de decisiones de manera fácil y sencilla. cabe señalar que en este momento. sistemático. todos los miembros de la población tienen la misma oportunidad o probabilidad de ser de ser seleccionados. De nuevo. que describe la probabilidad relativa (oportuna o casualidad) de que ocurra un evento” (Douglas A Lind. “Valor entre cero y uno. Considérese una población con 700 elementos de la que se va a elegir una muestra aleatoria de 54 elementos de la población. “ Sin embargo. y la opinión de estos sobre el asunto que se investiga es válida ya que se pueden considerar como conocedores o expertos del proyecto. 2004. se pueden muestrear a dos o tres. p. inclusive. Una forma en este caso es escribir primero el nombre que le corresponde a cada uno de los elementos en tiras de papel (nombre si son personas) y luego depositarlos en una caja. en un caso práctico. Thomson En cuanto al muestreo probabilístico. se necesita tener gran cuidado al llegar a conclusiones basadas en muestras por juicio. 276. se podría muestrear un elemento de cada 600/40 =15 en la población. 2007. Lind Estadística Aplicada a los Negocios y la Economía. primeramente hay que definirla. se debe entender que primero se debe calcular k que quiere decir k-ésimo elemento de la población. es decir. Otro de los métodos de muestreo para conocer características buscadas de una población a estudio. es: muestreo aleatorio sistemático. como se puede ver se trata sólo de una simple división para encontrar el primer elemento y posteriormente se irán seleccionando los demás elementos con el mismo intervalo.18 otros en Estadistica Aplicada a los Negocios y la Economía. servirán para entender y dejar más claro la aplicación de este método de muestreo. En la versión de Douglas A. lo que se debe entender que una muestra sistemática en este sentido implica elegir aleatoriamente uno de los primeros 15 elementos de la población. es: muestreo aleatorio sistemático y se procede de la siguiente forma: para una muestra de tamaño 40 de una población de 600 elementos. se debe tener en cuenta el resultado de dividir el tamaño de la población entre el tamaño de la muestra. de esa manera se tomará una adecuada decisión para elegir el método de muestreo. China McGrawHill pp262). Los siguientes ejemplos. Se insiste también en que en el método que se explica en este apartado. El proceso se sigue empezando por el primer elemento obtenido al azar. 36. Se puede entender entonces que. luego le sigue 24. La muestra de 40 se selecciona entonces en forma sistemática. Tratando de dejar claro el criterio de este tipo de muestreo (aleatorio sistemático) en la práctica se insiste en que por ejemplo si se hace entre 1 y k suponiendo que de 20 sea 12 por ejemplo para ir seleccionando los otros elementos para la muestra se tiene entonces que 12 es el primero. Es importante insistir y recordar que para muestrear una población. existe la probabilidad de que todos los elementos de la población a estudio pueden ser seleccionados en la muestra. ya que esa tarea da una idea de lo que se persigue sobre las características de ésta –población-. . Es más correcto y fácil que si se utilizara el muestreo aleatorio simple. Para utilizar éste. 2007. es indispensable primeramente seleccionar al azar uno de los primeros elementos para poder tener un punto de inicio. es decir. en este tipo de muestreo existe la probabilidad de que todos los elementos tengan la probabilidad de ser seleccionados. China MacGraw-Hill p 265. Cuando k no cae en número entero hay que redondearlo. es el resultado de dividir el total de elementos de la población entre los elementos de la muestra. 48 etc. talla o estatura posteriormente en cada grupo o estrato se aplica el muestreo aleatorio simple para formar la muestra. requiere la búsqueda de la viabilidad de introducir un producto en el mercado. P. es ad hoc para la aplicación del muestreo estratificado: “Una poblaciòn se divide en subgrupos.. denominados estratos y se selecciona una muestra de cada uno” Estadistica para Administraciòn y Economìa. De hecho existen dos formas de tomar muestras estratificadas.23 1. En este sentido el estudio no se podrá aplicar –muestrear.a una población cuyas características en cuanto al salario promedio. 269.29 .29 aproximado de 70 Aquì la muestra fue estudiantes.SEM 2º. para garantizar que cada grupo se encuentra representado en la misma muestra. Mèxico.2 14. Levin. Alfaomega. por lo que en la población que se muestreará debe considerársele un salario promedio mensual quizá de $20 mil pesos por ejemplo (característica) de los elementos de la misma – población.72 23. y dado que las características son relativamente homogéneas. “Eatadistica para la Administraciòn y la Economìa”.00 SELECCIONADOS 13. sexo. Vèase Richar I. Dogulas A.241 Después de dividir la población que se tiene que estudiar en estratos –deben ser grupos homogéneos. La forma que se debe proceder para el uso del muestreo estratificado. ya que resultaría inoficioso el trabajo.42 18. Pearson.de 30 mil pesos. 2004. es bastante bajo. Lind. P. si se estima que el precio será de aproximadamente –puede ser real. SEM GRUPOS “”A” “B” “A” “c” TOTAL ESTUDIANTES 61 72 80 65 278 % .26 . Ver el ejemplo que se indica que garantiza el aprendizaje de este método de muestreo que se estudia: Suponga que se desea saber el número de horas que los estudiantes dedican a la preparación o estudio del material para la clase del programa que estudian. SEM 4º. Por ejemplo a los estudiantes de la Facultad de Ciencias de la Administración C. Una lavadora sofisticada por ejemplo de las que además de lavar y secar la ropa trae la función de planchado.IV. Mèxico. por edad.. previamente decidida del tamaño . El estudio a realizarse. es formando grupos o estratos homogéneos de la población y de cada grupo se muestrearán ciertos elementos para su análisis. Este ejemplo se puede considerar de la siguiente manera: SEMESTRES 1ER.95 70.22 .SEM 3er.19 Cuando las características de la población son relativamente homogéneas. se les puede agrupar en estudiantes. en comparación con las empresas agrupadas en los demás estratos tienen pocas probabilidades de ser elegidos. Marchal y Samuel A. las empresas de los grupos (estratos) 1 y 5.20 Hipotéticamente se puede derivar con la ayuda de la aplicación de la formulita para obtener el promedio: lo que significa que se tendrá que preguntar a los estudiantes de la muestra cuántas horas le dedica cada uno al estudio y preparación de materias del programa: el ejemplo se puede resolver de la siguiente forma:  = ∑X/n. Aplicando el muestreo estratificado sin embargo. como ejemplo podría considerarse que en promedio los estudiantes del 1º. este es sólo un número hipotético. p. 265. se . 0. Wathen. TABLA 8. Semestre dedican al estudio de las materia 3.5 horas Recuerde.33 0. p. Estrato Probabilidad (recuperación capital) 30% y más De 20% a 30% De 10% a 20% De 0 a 10% Déficit Número de empresas 8 35 189 115 5 de Frecuencia relativa 0. o sea  = ∑(3horas+1.1 Número seleccionado para una muestra aleatoria estratificada porcentual.10 0. etcétera (Douglas A.54 0. pues casi constituyen en conjunto cerca del 0.01 de 50 =5. Como se sigue observando. porque como se puede observar los estratos 3 y 4. Lind. consideran una probabilidad muy alta de poder ser seleccionados dichos elementos.90 por ciento.5horas+2horas+…n. Pues hay que desarrollar la fórmula para contar con el dato correcto. Williams G. podrían no seleccionarse ninguna simple y sencillamente porque la elección es al azar.02 de 50 = 1.01 Número muestreado 1* 5* 27 16 1 1 2 3 4 5 *0. 2007) La tabla anterior cuya estructura demuestra que no cabe la posibilidad de aplicar el tipo de muestreo aleatorio simple.3ho ras)/70. Al 4º.02 0. es decir. Williams.21 puede tener la seguridad que por lo menos una de las empresas de los últimos grupos mencionados formen parte de la muestra. El análisis se basa desde la perspectiva de Douglas A. ésta de clasifica o se divide en pequeñas unidades primarias y para seleccionar una muestra se elige una muestra aleatoria simple de los conglomerados.02x50). pero se observa una gran variación entre los grupos. China McGraw-Hill p 265 De lo anterior resulta claro y entendido que este método de muestreo ofrece y garantiza mayores ventajas y fidelidad que el muestreo aleatorio simple por ejemplo. “Si una investigación de mercado tiene la intención de determinar por muestreo el número promedio de televisores por casa en una ciudad grande. 267. Anderson. para lograr los resultados deseados en el estudio a realizar. Cada casa perteneciente a cada una de estas manzanas sería considerada para entrevistar a sus habitantes. muestreo acumulado. muestreo de racimo y muestreo por conglomerados. cuando existe en cada grupo una pequeña variación entre los elementos que lo integran. 1998) Es importante aclarar que tanto en el muestreo estratificado como el muestreo por conglomerados se dividen la población en grupos pero se aplican: el primero – estratificado. Dennis J. 2004). es tener idea de la característica que se desea conocer de la población. Estadistica Aplicada a los Negocios y la Economía. diversos autores lo denominan por ejemplo. Lo recomendable entonces para su aplicación –muestreo aleatorio estratificado-. se analizarán todos los elementos de los grupos seleccionados. Por ejemplo. Sweeney y Thomas A. El siguiente método de muestreo. p. esto es. 321. “Muestreo aleatorio simple estratificado Método para seleccionar una muestra en que primero se divide a la población en estratos y a continuación se toma una muestra aleatoria simple de cada estrato” (David R. Un procedimiento de muestreo de racimo bien diseñado puede producir una muestra más precisa a un costo considerablemente menor que el de un muestre o aleatorio simple” (Richard I. el objetivo es hacia un mismo resultado. que consideran las categorías: homogeneidad y heterogeneidad de las características de la población para su aplicación según el caso. podrían usar un mapa de la ciudad para dividir el territorio en manzanas y luego escoger un cierto número de éstas (racimos) para entrevistar a sus habitantes. 1(0. Levin.El . Al pie de la mencionada tabla se aprecia que la frecuencia de 0. Lind. esto se debe a que la característica que se desea estudiar de la población es heterogénea Se entiende que todos los elementos que integran un conglomerado muestreado se considera la muestra. p. es decir. 2007. sin embargo.02 de las 50 empresas es igual a 1. La aplicación del método de muestreo por conglomerados definida ya la población a estudio. 22 segundo método –por conglomerados-. sin embargo los grupos presentan similitud entre sí.4 Sesgo y error de muestreo . 1. cuando la variación es significativo dentro de cada grupo. por qu e a l fin a l de cu en t a s es u n r esu lt a do (est a dist ico o pa r à m et r o sesga do) (MTRO. la m edida cu a n t it a t iva . sin em ba r go.79 m t s. E l ca so de la t a lla o est a t u ra de los est u dia n tes de u n a u n iver sida d. (Agost o 2012 Mt r o.23 SE SGO Y E RROR E N E L MUE STRE O AL MUE STRE AR E N F ORMA ALE ATORIA *Se bu sca a l m u est r ea r u n a pobla ción qu e la m u est r a sea r epr esen t a t iva de est a en cu a n t o a su s ca r a ct er ist ica s. su a n à lisis t iene que r efleja r el pr om edio de esta t u r a m u est r a l diga m os X= 1. la in for m a ciòn fu e sesga da . Bu en o pues el m èt odo es situ a r se a la s 9 de la m a ñ a n a en la pu er t a de la F a cult a d y pr egu n t a r le su opiniòn en r ela ciòn a l m èt odo a 100 est u dia n tes. Celso Recin os Reyes) . Cu a n do la m u est r a en t on ces n o es r epr esen t a t iva . en r ela ciòn a l mèt odo a ct u a l de eva lu a ción . 2012) E J E MP LO: *De lo qu e ya se h a a lu dido. E l a su n t o es qu e segu r a men te se t om ò den t r o de los 100 elem en t os per son a s que est u dia n en el pr im er sem est r e o que son per son a s que n a da t ien en qu e ver con la F a cu lt a d a ca dèm ica m en te h a bla n do. CE LSO RE CINOS (Agost . Ma tem à tica a m en t e es cor r ect o. se dice qu e h a y u n sesgo en la in for m a ciòn y com o con secu en cia h a y u n sesgo en los r esu lt a dos. Refier e sin em ba r go. E st e a ct o n os pr opor cion a el pr om edio o por cen t a je de los que esta n de a cu er do con dich o mèt odo. a l tom a r u na m u est r a n o se especifica si esa ca r a ct er ist ica o pa r à m et ro se r efiere a l gèner o h om br e o m u jer . *Ot r o ca so se pu ede r efer ir a lo sigu ien t e: Su pon ga qu e desea sa ber la opiniòn de est u dia n t es de la F a cu lt a d. Celso Recinos Reyes Originalmente. ya que es importante recordar que lo que se busca. por este hecho se puede registrar un sesgo en la información. pu ede n o ser r epr esen t a tiva de la pobla ciòn qu e se t r a t a de in vest iga r . la m uest r a con t iene u n a por ciòn m enor de r esu lt a dos.24 P ORQUE NO SE DE F INE LA P OBLACIÒN A E STUDIAR SE SGO P OR LA NO RE SP UE STA Si los est u dia n t es que n o respon den son los m à s in con for m es con la s for m a s de eva lua ciòn . Mt r oñ Celso Recin os Reyes E RROR E N E L MUE STRE O *Difer en cia qu e se obser va en t r e el est a dist ico de u n a m u est r a (ẍ m edia m u est r a l) y(el pa r à m et r o de la pobla ciòn µ). y de n u evo. Agost o 2012. es que los elementos seleccionados de un .una población. en realidad.(desvia ciòn est a n da r m u est r a l s) (desvia ciòn est a n da r pobla cion a l σ) y (proporciòn Ṕ media muestral de la proporciòn y (P media de la proporciòn poblacional Agosto 2012 Mtro. al muestrear en forma aleatoria –al azar. Posiblemente uno de los métodos aplicados que pueden representar un sesgo es el siguiente: Supóngase que se tiene el interés de conocer la opinión de los estudiantes de la Facultad de Ciencias de la Administración C. Y para la proporción ( Ṕ ) media muestral de la proporción y ( Р )media de la proporción poblacional. porque puede ser que por el desconocimiento de la importancia que tiene este concepto –sesgo-. que la población observada no está bien definida –determinada-. “Error de muestreo El valor absoluto de la diferencia entre un estimador puntual insesgado y el parámetro poblacional correspondiente.25 universo –población-. se refleja un problema –sesgo de selección-. también es de considerar que existe sesgo por la no respuesta. se puede decir que no se determinó la entrevista a estudiantes de qué semestres. sean representativos en cuanto a las características de ésta. porque puede darse el caso que los estudiantes con mayor inconformidad con las evaluaciones no responden. se pueden cometer errores en el muestreo de una población. los errores de . por lo que en este caso se considera que hay una información sesgada. se puede concluir que: de acuerdo a los dos tipos de sesgos. Por eso cuando existen cierto número de elementos de la población que tienen posibilidades más altas frente a otros de ser seleccionados y por ese hecho estar representados en una muestra. Del caso anterior. Desviación muestral ( s ) y desviación poblacional ( σ ). Un ejemplo claro y sencillo creo que deja mucha posibilidad de identificar la forma de seleccionar una muestra insesgada. se dice que ésta tiene sesgo. es decir. 268 1997) De lo anterior. porque dentro de los elementos elegidos posiblemente se tomaron en cuenta a alumnos de primer semestre que en ese momento no tienen noticias del método de evaluación existente en la institución educativa. a las 7 de la mañana se designa a una persona para preguntar a los primeros 50 estudiantes que ingresan al edificio sobre el método de evaluación. porque no es ad hoc con la población que se desea estudiar. respecto al método de las evaluaciones. lo cual indica entonces que la muestra no es representativa de la población. la desviación estándar y la proporción muestral. Cuando la muestra entonces no es representativa. Por supuesto que se tienen respuestas de los entrevistados. (Véase Daniel Peña-Juan Romo p. Para una media muestral. por otra parte no se toman en cuenta a los estudiantes que no tengan clases en la primera hora. en realidad lo que se hizo fue elegir la muestra de 50 estudiantes. Por definición se plantea que el error de muestreo no es otra cosa más que la diferencia que se observa entre el estadístico de una muestra (  ) media muestral y el parámetro de la población ( µ ) media poblacional. la opinión debe ser sì están de acuerdo o no están de acuerdo con el mismo. IV. sin embargo. para ello. ELECCIÒN DEL TAMAÑO ADECJADO DE LA MJUESTRA AL DISEÑAR UN ESTUDIO ESTADISTICO DEBE PENSARSE SOBRE EL NÙMERO DE ELEMENTOS DEBE HABER EN UNA MUESTRA YA QUE: *SI LA MUESTRA ES DEMASIDO GRANDE SE GASTA BASTANTE DINERO EN RECABAR LA INFORMACIÒN (DATOS). corta la hojas. Si se acepta que las muestras sirven para inferir sobre las características de una población. Williams. es de señalarse que como una muestra es un subconjunto de elementos de la población.26 muestreo son |-µ|. se revisaron unas cuantas. 2004). p. no necesariamente los estadísticos muestrales –media y desviación-.(David R. Anderson. 1.2libras? .4 libras y la desviaciòn estàndar de 0. *SI LA MUESTRA ES DEMASIADO PEQUEÑA LAS CONCLUSIONES RESULTAN INCIERTAS EJEMPLO DE LA DETERMINACIÒN DEL TAMAÑO DE LA MUESTRA PARA LA MEDIA POBLACIONAL: 1. El peso medio fue de 20.5 Determinación del tamaño de la muestra.-Un procesador de zanahorias. Para controlar el peso de las cajas. Sweeney y Thomas A. ¿Cuàntas cajas debe tener la muestra para conseguir una confianza de 95% de que la media de la muestra no difiere de la media de la poblaciòn por màs de 0. Dennis J. Entonces se dice que a esa diferencia se le llama error de muestreo. entonces lo que se hace normalmente es utilizar el valor numérico de una muestra –estadístico.-Se calcula que una poblaciòn tiene una desviaciòn estàndar de 10. lava las zanahorias y las incerta en un paquete. con un nivel de confianza de 95%. Desea estimar la media de la poblaciòn a màs menos 2 unidades de error màximo admisible. 277.|s-σ| y |Ṕ-P|”.para concluir que la media poblacional está representada por la media muestral Sin embargo.5 libras. sean igual que los parámetros poblacional la media y desviación. . En una caja se guardan 20 paquetes para enviarse. ¿De què tamaño debe ser la muestra? 2. 58.. mayor serà el tamaño de la muestra correspondiente EL MARGEN DE ERROR ADMISIBLE O QUE TOLERA EL INVVESTIGADOR *Magnitud que se suma y resta de la media muestral para determinar los puntos extremos del intervalo de confianza *Tambien es la mitad de la amplitud del correspondiente intervalo de confianza.96 y el nivel de confianza de 99% a un valor de Z de 2.. *Un error tolerable màs pequeño requerirà una muestra mayor.-NIVEL DE CONFIANZA *Precisiòn deseada. o sea que tan cerca del valor verdadero que estè la estimaciòn *Los niveles de confianza màs comunes son 95% y 99%.27 CRITERIOS CONSIDERADOS PARA DETERMINAR EL TAMAÑO DE LA MUESTRA. *Si màs alto es el nivel de confianza elegido. 1. *Por el contrario a un error admisible grande corresponde una muestra menor .El valor de confianza de 95% corresponde al valor Z de 1. se puede utilizar en el estudio actual..28 LA VARIABILIDAD DE LA POBLACIÒN QUE SE ESTUDIA *Què grado de variabilidad està presente en la poblaciòn que se va a muestrear? *Si la poblaciòn se encuentra muy dispersa se requiere una muestra grande. a)Utilizarun estudio comparativo . dice que se podrìa esperar que casi todas las observaciones se encuentran a mas o menos 3 desviaciones estandares de la media si la distribuciòn sigue normal. *Sin embargo. . Se necesita conocer o contar con un calculo de los valores màximo y mìnimo de la poblaciòn. con un error de 1. es necesario utilizar un estimador para la desviaciòn estandar de la poblaciòn.0? 2.-Un asesor de la cadena de Moteles Kemble desea estimar la cantidad promedio de millas recorridas por dia por familias vacacionistas.900. 3. Entonces la desviaciòn estandar de 6 c)Utiliza un estudio piloto. EJERCICIOS DE TAMAÑO DE MUESTRA PARA LA MEDIA POBLACIONAL 1. Si se considera confiable una desviaciòn estandar de un estudio anterior. Se cree que una estimaciòn razonable de σ2 es de 18 000. *Si la poblaciòn se encuentra concentrada (homogènea) el tamaño de la muestra que se requiere serà menor. La experiencia previa indica que una estimaciòn aceptable de σ2 es de 4.-Una empresa de plàsticos desea estimar la media de resistencia al impacto de una bobina. Obtiene los nombres y direcciones de familias vacacionistas que se hospedaron en moteles de la cadema Kemble en año pasado.0 en cualquier sentido si la desviaciòn estàndar de la poblaciòn es de 10. La regla empirica. b)Un enfoque basado en el intervalo. ¿Què tan grande debe ser la muestra que seleccione el asesor a fin de estimar el millaje diariio sin alejarse màs de 25 millas con 95% de confianza?. ¿Cuàntas bobinas deberìa probar si desea alejarse menos de 20 psi del valor verdadero con 99% de confianza?.-¿Què tamaño de muestra serà necesario para producir un intervalo de confianza del 90% en el caso de la media de la poblaciòn verdadera. uv.05 con 95% de confianza. El mejor estimador de la proporciòn poblacional es de 0.05. Desde luego. Los fenómenos reales son susceptibles de modelizar con la distribuciòn normal. ¿Què tamaño debe tener la muestra de estudiantes para estimar con 95% de confianza.05.-Una universidad urbana ofrecerà clases sabatinas si la demanda estudiantil es suficientemente alta. y sin alejarse màs de 0. Considerables casos de las distribuciones de uso frecuente. ¿De cuantos hogares de ser la muestra? 3. Una distribuciòn normal se considera de uso màs importante en la distribuciòn de probabilidades. y que se deberán tomar necesarias para los estudios estadísticos de todas las variables de los negocios o empresas y entidades públicas (mercadotecnia) 1º.15. Parte del supuesto de que no se dispone de ningùn estimador dep En principio se debe considerar la existencia de poblaciones que por sus características no tienen una distribuciòn normal. es importante señalar que es válida la siguiente condieraciòn: . es un enfoque cuantitativo que tienen la mayor cantidad de poblaciones. No dispone de ninguna estimaciòn de p. 3º. Se distingue por ser una distribuciòn de variable continua con campo de variación + ∞ . 1.-El estimador de la proporciòn pòblacional debe estar a màs menos 0.es/ceases/pdf/no 01/08/2012 Razones fundamentales de su importancia. Visualmente los datos a trabajar dan la idea del tipo o la forma de distribuciòn a aplicar.∞ “ Fue descubierto por Gauss al estudiar la distribuciòn de errores en las observaciones astronómicas” www.-Una empresa de investigaciòn de mercado Lincoln and Lind desea estimar la proporciòn de hogares de cierta àrea que cuenta con televisores a color: Querrìa estimar p sin alejarse màs de 0. Cuando estos (datos ) no sean normales se pueden utilizar otros métodos estadísticos como los llamados métodos no paramétricos Para tales casos. ¿De què tamaño debe ser la muestra que se requiere 2.29 EJERCICIOS PARA EL TAMAÑO DE MUESTRA PARA LA PROPORCIÒN DE LA POBLACIÒN.Existe relaciòn con el Teorema Central del Lìmite. tienden a una característica de distribuciòn normal bajo ciertas condiciones. 2º. la proporciòn de estudiantes que se inscribirìan a las clases sabatinas si se les ofreciera la oportunidad de hacerlo?. Con un nivel de confianza de 95%. Zб/2. Williams. Una vez que se selecciona el coeficiente de confianza 1 – ά. es importante describir la estructura de la ecuación para el cálculo: Literalmente se señala “ La cantidad Zά/2(б/√n) es el margen de error. Dennis J Sweeney y Thomas A. CENGAGE Learning. P. A continuación se presenta el desarrollo de la fórmula utilizada para calcular el tamaño de n de muestra deseado. o contenga . porque puede ser que la misma no proporcione información suficiente. Sea E = el margen de error deseado: E = Zά/2 б /√n Al despeja √n = Zά/2 б/ E Al elevar al cuadrado ambos lados de esta ecuación. Mèxico. si se tiene el valor de б.30 Papeal del tamaño de la muestra Obtener una buena aproximación de los intervalos de confianza Cuando la poblaciòn no tiene una distribuciòn normal En el siguiente análisis que se relaciona con la determinación del tamaño de la muestra para la media de la poblaciòn utilizando muestras grandes ( n ≥ 30 ) y en los casos en donde se conoce el valor de la desviaciòn estàndar ( б ). Para ello. como se ve. Zб/2 puede ser determinado.326.2012. y el tamaño de la muestra n se combinan para determinar al margen de error. hacerse la pregunta ¿qué tan grande o pequeña debe ser la muestra?. Anderson. De manera que. se aconseja còmo estimar o elegir un tamaño adecuado para obtener un margen de error deseado. es probable encontrar el tamaño de la muestra n necesaria para proporcionar cualquier margen de error deseado. se obtiene la expresión siguiente para el tamaño de la muestra” Estadistica para negocios y economía David R. Por tanto. la desviaciòn estàndar poblacional σ. Ecuaciòn para el tamaño de la muestra para la media de la poblaciòn: n = (Z ά/2)2 б/ E2 Parece muy importante al realizar un estudio mediante el muestreo de una población. Sweenwy y Thomas A. Para ello. Existen indicios de que la desviación es de 20. Estima el tamaño de la muestra que se debe tomar a fin de que esta (estimación) se aleje en menos de 10 de la media verdadera con 95% de confianza. Desarrollando la fórmula correspondiente. Cuando se plantea un nivel alto. “La cantidad zα/2(σ/ѵn) es el margen de error. 303. 1. De hecho comúnmente se utilizan en los estudios realizados cuatro niveles a saber: 90%. tendrá que seleccionarse una muestra grande.5. Williams. error máximo permisible y variación de la población. Ejercicio: Una Compañía que se dedica a la producción de alimentos para ganado bovino. el error tolerable y la variabilidad de la población. Sin embargo. p. tiene la necesidad de conocer si el presente ciclo. es necesario desarrollar los siguientes ejercicios: Ejercicio: Supone una empresa “X” que desea estimar el promedio de gasto que realizan sus diversos departamentos en publicidad en el ejercicio 2009. asimismo si la muestra tiene pocos elementos. En este factor. 95%. La segunda pregunta. Anderson. Estimación del tamaño de la muestra para la media de una población.para obtener resultados. se tiene que identificar el valor de “z” en la tabla respectiva de valores. es el error que pueden tolerar quienes conducen el estudio. se debe auxiliar de la tabla de valores de la distribución normal “z”. 98% y 99%. 2004). ¿de qué tamaño deberá ser la . por ello se decide aplicar una encuesta. y relaciona la mitad de la amplitud del correspondiente intervalo de confianza. vemos que zα/2 la desviación estándar poblacional σ y el tamaño de la muestra n se combinan para determinar el margen de error. podrá tener más rendimientos que el ciclo anterior. no es limitativo se puede utilizar otro valor desde 0 a 100. su manejo resulta bastante fácil.96x20/10)2 = 15. éste lo determina el responsable del estudio y generalmente. A continuación se presenta el desarrollo de la fórmula utilizada para calcular el tamaño de muestra requerido” ( David R.37 Por lo tanto se deben tomar aproximadamente 15 elementos. en una población con una desviación estandar de 1300. se tiene: n = (1. Dennis J. En la determinación de la muestra para la media de una población es importante tener en cuenta: el nivel de confianza.31 demasiada información.1 Grado de confianza. podemos determinar el tamaño de n que se necesita para dar cualquier margen de error. Porque además hay que recordar que si es demasiado grande se derrochan recursos –tiempo y dinero. se puede determinar zα/2. Así. Una vez que seleccionamos un coeficiente de confianza 1 – α. Entonces si tenemos un valor para σ. los resultados carecen de valor práctico. La primera pregunta significa el nivel de confianza. 57x2500/429)2 = 233. Se agrega el 0.93. El valor de “z”. En el desarrollo de la sección en clase se plantearán otros problemas como práctica de aprendizaje de este tema. En este caso el dato 0. Estima el tamaño de la muestra para la media de dicha población que no este a ±429 puntos. Esta figura tiene dos partes idénticas. ya se tienen en el problema. Por lo tanto la muestra debe tener aproximadamente 26. Asi se tiene que . bajo el siguiente procedimien to: Tomando en cuenta que se le está dando al problema un nivel de confianza de 95% y como se esta trabajando con distribución normal en donde la figura completa distribución normal tiene un valor del 100%.95/2= 0. Cabe señalar que el valor 1. 98 y 99% respectivamente.32 muestra seleccionada para estimar la media poblacional dentro de ±500 puntos. considerando un nivel d confianza de 95%? Desarrollando la fórmula (**). n = (1. estima de qué tamaño debe tomarse la muestra para estimar la media poblacional dentro de ±50 para un nivel de confianza de 95%.96x60/50)2 =5. por ello el nivel de confianza se divide en 2 para obtener el valor. Sustituyendo la ecuación se tiene lo siguiente: n = (1. o cualquier otro nivel diferente para encontrar el valor de Z (distribución normal). Distribución 100% . Cuando el nivel de confianza sea de 90.53 la muestra debe ser del tamaño 5 aproximadamente. La muestra debe ser aproximadamente del tamaño 234 elementos.4750.4750 se localizó en el renglón o línea 1. Los otros datos de la fórmula. debido a que la tabla presente valores de cuatro dígitos. lo ubica en la intersección de la línea y la columna correspondiente. Ejercicio: Una población determinada de la cual se sabe que hay una desviación estándar de 2500 elementos. se tiene. se sigue el mismo criterio que se especifica o se explica en el párrafo anterior De esta forma se pueden desarrollar tantos ejemplos en cuanto a la selección del tamaño de la muestra. Ejercicio: De una población X se tiene una desviación estándar de 60.96 que corresponde a “z” en este caso se localiza en la tabla de valores de distribución “z”. enseguida se busca en la tabla el valor de “z”. Observar la siguiente figura: Escala “z”.96x1300/500)2 = 25.96.9. Sustituyendo la ecuación se tiene lo siguiente: n = (2.9 y la columna 6 lo que es igual a z=1. considerando un nivel de confianza de 99%. 50 0.10) = 0.90) = 0.90 (0.70 0. entonces p(1-p)=0. Este margen se basa en el valor de Zά/2.Williams”Estadistica para negocios y economìa”. por ejemplo.21 (0.60)(0-40) = 0. Muestras mayores proporcionan márgenes de error menores y mejor precisiòn ALGUNOSV ALORES POSIBLES DE P*(1-P*) P* P*(1-P*9) 0. Sweeney.60 0. se utiliza 0.21 (0.24 (0-70)(0.90)(0. El tamaño de la muestra para la proporción de la población.40 0.10)(0. 2012. del tamaño de la muestra para una Dentro de este análisis de estimaciòn se considerará cual será el tamaño de los elementos elegidos como muestra para lograr una estimaciòn de la proporciòn poblacional con una precisión determinada. si p=0. se puede utilizar.50)(0.Mèxico.50.09 (0.70) = 0. pero .30 0.Ṕ )/n.2. Por otra parte. en la proporciòn muestral Ṕ y en el tamaño de la muestra n.50) = 0.10 0.30. Esta funciòn que refleja el proceso para la muestra en la estimaciòn por intervalo de p es parecida al aplicado en el caso de la estimaciòn de la media poblacional.33 Ahora se hablará sobre la determinación proporción o porción de la población. “El margen de error asociado con la estimaciòn por intervalo de la proporciòn poblacional es: Zά/2√ Ṕ( 1 .3)=0. “Si se cuenta con un estimador disponible p a partir de un estudio piloto u otra fuente.3(1-0. V alor ( 0.50 porque el término p(1-q) jamás puede ser mayor cuando p =0.25***Max.60) = 0.30)(0.30) = 0.40)(0. CENGAGE Learning.09 Anderson.24 (0. y así sucesivamente.p)(z/E)2 se tiene: n = .40. Como no se encuentra disponible ningún estimador de la población.5.50. El nivel de confianza deseado es de 90%. La muestra es de alrededor 322 elementos.30 Desarrollando la fórmula: n =p(1.50. q = 0.5(1 – 0. que corresponde a un valor de z = de 1.10 de la verdadera proporción de la población y el nivel de confianza se ubica en 90% y no tenemos disponible un buen estimador para la proporción de la población.65 10 El estudiante necesita una muestra aleatoria de 69 ciudades Ejercicio: Es interés de estimar la proporción de tiendas requiere de un empleado capacitado. Wathen. 2007) En este punto vale la pena insistir en que cuando se desea estimar la muestra para la proporción de la población y no se cuenta con un dato para el valor de p (p prima). 317. Lind.5) = 0. Como se puede observar. cuyo nivel de confianza debe ser de 95%. para el valor de q en este caso sería de igual forma 0. p(1. por lo que E = 0. de lo que se concluye que. La proporción verdadera no puede ser superior a . El número surgido de observaciones es n = p( 1 – p) z/E ( )2 ( /. William G. lo que quiere decir que.p) =0. siempre se le asignará a p un valor entre 0 y 1.60. Marchal y Samuel A.05)2 = 322.96/0.05 del valor verdadero.25” (Douglas A.10.5 Se cree recomendable la transcripción de un caso práctico que el autor citado en párrafo anterior plantea. cuando p = 0.34 cuando p = 0-50. con el objeto de ver la relación de la teoría sobre este tema con fenómenos reales: Ejercicio: Si estamos en la posición de que nuestro margen de error se encuentre a 0.5)(1-. para efecto de calcular el tamaño de n para la proporción de la población.5) 1. q = 0.64. Determina de qué tamaño debe ser la muestra y que no este a ±0.7)(1.p. ¿Determina cuál es el tamaño requerido de la muestra? Solución El estimador de la proporción de la población se encuentra a 0.50. )2 =68. cuando p = 0.3(1-. 1-6 Usos y abusos de la estadística .0625 n = (. lo recomendable es asignarle el 0. se utiliza 0.10. las muestra. es capaz de reflejar conclusiones equívocas. como de aquéllas económico-administrativas. distinguir. Desde la perspectiva de la ética. porque recoge. Normalmente suceden hechos como por ejemplo. una serie de poblaciones. resume y analiza los datos. Marchal y Samuel A.) 1. también hay que creer que su utilización –estadística. Estadistica Inferencial. aseveración que se basa en el pensamiento de Benjamín Disraeli (político y estadista inglés). se tiene que conocer y utilizar los lineamientos.en forma inadecuada. parámetro y estimador. Con estas frases se puede entender el uso y abuso de la estadística. el parámetro y estimador. por lo que en el presente curso. Como dinámica. a través de mentiras al dar información estadística a personas. Las escalas o niveles de medición fueron tratadas en el curso de Estadistica Descriptiva. pues como de igual manera es fácil cometer errores por ser humano – puede ser una gran justificación-. Sin embargo.6. aquél que se traduce como un “eslogan” “que a cada mexicano le corresponde en promedio ½ pollo para su alimentación”. 17. de las ciencias sociales.1 Concepto de población. las prácticas profesionales con la investigación estadística y la elaboración de informes reciben mucho apoyo de la American Statistical Association (ASA). Algunos piensan que las cifras no mienten. . pero quien las imagina y las presente. muestra.org) acerca del profesionalismo y las responsabilidades que se aplican a los investigadores y asesores que emplean o realizan análisis estadísticos” (Douglas A. independientemente cuál es su formación profesional (licenciado en Administración.2 Escalas de medición. se sugerirá al estudiante. 2005) Dentro del aprendizaje de la teoría de la estadística por los estudiantes. William G.35 Para tratar de explicar este tema. Quizá se ha llegado a pensar que cuando se habla de estadística existe una relación con la mentira. esto es. etc. se definió lo que es la población para la estadística. sólo se hará un breve recordatorio de las mismas (escalas de medición). es una técnica que se aplica y tiene que ver con el estudio de los métodos científicos. se parte de la idea que estadística. empresas. que además de ello. organiza. etc.amstat. Lind. es correcto mencionar lo siguiente: “Dejando de lado los problemas éticos que surgieron en años recientes con los informes financieros de compañías como Enron. para derivar resultados e inferir sobre una población y tomar decisiones. En 1999.6. se consideran los mentirosos. Wathen. 1. se cree importante. en Contaduría. este organismo proporcionó lineamientos y sugerencias por escrito (visite http://www. En el inicio de esta unidad. Desde el punto de vista estricto esa posibilidad es falsa. Es decir. se toma en cuenta que un nivel es más alto o mejor que el siguiente. malo.7 4. . William G. pág. 10. hombres o mujeres. que físicamente se clasifican y cuentan. Lind. deben ordenarse por ejemplo: superior. color azul por ejemplo. cuya variable de interés es el país de origen.33 3.36 De acuerdo con Douglas A. donde la variable se refiere a nombres o números. y aún cuando éstos. es decir. inferior. Fuente OPEP OCDE (incluye E. las categorías de los datos no presentan orden.91 22. porque en este sentido sólo el interés consiste en clasificarlas por color y no el orden (así pues se refiere sólo al nombre del color). en resumen los datos del nivel nominal de medición consideran ciertas características: las categorías son etiquetas o nombres. el conteo se hace cuantos son del sexo masculino y cuantos del sexo femenino. En el nivel –escala.76 11.1 (Douglas A. en donde no se presenta un orden natural de las categorías.4 13.35 Porcentaje 39. Ejemplo: Suponga que existen canicas de 4 colores. Marchal y Samuel A. es decir hombre y mujer. es decir. Se habla en términos de niveles de medición que son clasificados como: nivel nominal. el de intervalo y el de razón En el caso del nivel –escala. U) Rusia China Otra Número de barriles diario 32.4 14. Malo. Medio.9 _____ 100. Si estas personas entran a un teatro se registra sólo cuantos son hombres y cuantas mujeres. esto es. Las categorías que representa son en escala. Si el ejercicio se refiere al género. 2007) Observando lo anterior se puede decir que. Wathen.ordinaria de medición.62 12-35 _____ 82. representan números. Vale la pena en este aprendizaje retomar el ejemplo de la siguiente tabla del suministro mundial del petróleo para 2004. la clasificación se refiere a los niveles: Superior. puede considerarse como un ejemplo de medición nominal. Inferior. es decir.de medición nominal. el ordinal.7 27. bueno promedio. cada categoría se registra en un orden lógico. no se tiene interés en saber si se presentan en primer lugar. porque no se está esperando que primero sean clasificadas las de color rojo. interesa un sistema de conteo. Bueno. Lind y otros. p. significa que por ello las diferencias son iguales en las mediciones. la diferencia entre 10 y 15 grados Fahrenheit es de 5. la distancia entre sucursales y la altura (Véase a Douglas A. sin importar su posición en la escala. 2. . estos deben ser medidas constantes. Es decir. etc. superior. la diferencia entre 50 y 55 grados también es de 5” (Douglas A. la diferencia entre valores es una constante. Lind. “Diferencias iguales entre dos temperaturas son las mismas. hay que considerar un número constante o diferencia. Calificación Superior Bueno Promedio Malo Inferior Frecuencia 6 28 25 12 En el caso del nivel de medición de intervalo. Calcular la estimación por intervalo. Lind.1 Definición de estimador y estimación. de un parámetro de interés. Willian G. cambio en los precios de las acciones. Wathen p. que la clasificación de los datos son de acuerdo con la magnitud de la característica en cuestión y en segundo término es que. es decir. Un intervalo puede considerarse como un espacio entre dos límites. además este nivel de medición indica las diferencias entre dos lados (puntos) y se dice que es constante en forma continua. el nivel de razón. 2007) Dentro de la teoría se considera como un cuarto nivel de medición. existe de hecho un intervalo para agrupar los datos. en primer lugar. dependiendo de las características de la muestra con un grado de confianza estipulado. Bueno. las evaluaciones. 13. la muestra del público que se seleccione para aplicar una encuesta tienen que evaluarlo. Las características del nivel de medición de intervalo. 2007) UNIDAD II ESTIMACIÓN DE PARÁMETROS E INTERVALOS DE CONFIANZA OBJETIVO. responde a diferencias iguales en las características. en los ejemplos que se deben tratar. la temperatura. Marchal y Samuel A. Hay una gran variedad que se pueden mencionar como: fecha. Y este incluye aquellas mediciones referentes a la producción medidas en unidades.37 Ejemplo: Cuando se va a evaluar la calidad del servicio de una empresa Pública o Privada. Wathen.(Véase la siguiente tabla que se refiere a una muestra de 71 personas). 12. peso. etc. es decir. de acuerdo a su criterio el nivel que considere. En este ejercicio se toma en cuenta operaciones como la suma y la resta. Marchal y Samuel A. William G. es un valor específico tomado de un estimador. por ello se puede decir que un buen estimador es el más eficiente que otros. el estimador refleja también una medida específica proporcionada por un estadístico –característica de la muestra-. para una mejor comprensión del estudiante en el proceso de aprendizajeenseñanza. . ẋ = µ. Cómo se puede calcular la eficiencia relativa? En términos relativos. Para este análisis fue consultada la bibliografía adecuado desde un particular punto de vista.2 Propiedades de los estimadores: insesgamiento. Al hacer la estimación correspondiente se sabe que la varianza de ẋ es menor a la varianza de la mediana de la muestra. necesariamente tiene que pasar por varios criterios para su aceptación. se realizarán ejercicios para garantizar el aprendizaje de este tema. se divide el total de la varianza de las desviaciones al cuadrado de los valores de la media entre n-1: observar y desarrollar las siguientes fórmulas: S2 =∑(xj-)2 n-1 σ2 =∑(xj-µ)2 N Obligatoriamente. es porque el valor medio del estadístico calculado al realizar todas las muestras que sean necesarias de un tamaño dado extraído de esa población. esto es porque observamos al compararlos que la varianza del primero es significativamente menor a la varianza del segundo y así sucesivamente. se puede obtener dividiendo la varianza del primero entre la varianza del segundo que matemáticamente esta dado por: Varianza1/Varianza. Se dice que la eficiencia es un concepto que se fundamenta en su variabilidad. 2. Y por ende. es posible establecer que ésta –estimación-. Lo que hace comprender que para una muestra del mismo tamaño tomada de una población. Se debe considerar que un buen estimador. Bajo ese punto de vista. la varianza de la media debe ser menor que la mediana. Cuando se dice que un estimador de un parámetro es insesgado. tiene que coincidir –ser igual.que el parámetro correspondiente: ejemplo. o sea σ1/σ2 Suponga que se compara una media muestral con la media con la mediana por ejemplo de la muestra desde el punto de vista de su eficiencia al estimar la media de una población. porque de ello depende la certeza aproximada de su evaluación de la estimación y la toma de decisiones. Por ello. se tratará de explicar en este material las propiedades de éstos –estimadores-. o Ș = σ Si se trata de tomar datos de una muestra para un insesgamiento de la varianza de población. eficiencia y consistencia.38 A través de la selección de una muestra en forma tal que sea representativa de la población se puede estimar el parámetro. Así. es de considerar que un estimador es insesgado cuando el valor de su varianza se aproxima a 0. Con ello. se concluye que la estimación puntual de la media de la población. cuando se aumenta el tamaño de la muestra. Obsérvese la siguiente expresión: s2 estimador consistente de σ2.87 40 Así se tiene que: Si se entiende que una estimación o estimador puntual se refiere a una medida derivada de una muestra para conocer el valor de un parámetro de una población dada a estudio. es la que se hace por ejemplo a través de la siguiente afirmación. el error o sesgo puede ser casi cero. es redondeando el valor. estimar la media de dicha muestra que servirá como parámetro puntual (la media) de esa población.  =3875 =96. Si se sabe que la la sumatoria (∑) de x es igual a 3875 y teniendo en cuenta que la muestra (n) es del tamaño 40. obviamente porque la muestra tendrá que ser cada vez más grande. Hasta el momento la teoría solo reconoce dos tipos de estimación.  = ∑x n ∑x =3875 n=40. Al usar este valor -=96. se puede hacer una estimación del crecimiento para 2013. Una estimación puntual que sirva como referencia para ahorrar tiempo en el trabajo relacionado con la actividad. Este fija un intervalo de valores intervalo de . Cuando se trata de estimar una media o un valor específico a partir de un solo dato como referente. El asunto es con ello.87. es de 96. Si se selecciona aleatoriamente una muestra de 60 por ejemplo y se estudia o se atiende a cada uno de esos elementos. se está haciendo una estimación puntual. También se estima el intervalo de confianza. porque el estimador se aproxima más al parámetro poblacional. 97 elementos. se dice que sólo puede ser posible. 2.39 De la característica que se refiere a la consistencia.3 Tipos de estimación: puntual y por intervalo. Su explicación parte del enfoque de que se cuenta con más información. se tiene que la media muestral ( ). sea éste en miles de millones de pesos –sumatoria de todas las actividades de la economía durante un año-. como un estimador. se esta usando el concepto de estimación puntualSupóngase que se tiene información en relación al tamaño del PIB (producto interno bruto) del año de 2012.87. es de 1. 295. Pág. Se divide el Nivel de confianza. Lind.96. “Intervalo de confianza Conjunto de valores formado a partir de una muestra de datos de forma que exista la posibilidad de que el parámetro poblacional ocurra dentro de dicho conjunto con una probabilidad específica. considerar el error estándar de la media que se simboliza: σẋ =σ √n σẋ = error estándar de la media para una población finita. no es el exacto. se toma el más próximo pero menor y no el que supera al que se está localizando. 95% entre dos . se transcribe su definición a continuación.475 se agrega un 0 porque la tabla de valores de “z”.) (0. La empresa tiene una estimación de la desviación estándar de la vida útil. William G. Uno de los conceptos que interviene en el desarrollo de la estimación de un intervalo de confianza es. para estimar el intervalo de confianza se tiene: ± valor de “z” o “t” por σ  . Marchal y Samuel A. considera cuatro dígitos. En forma simbólica.40 confianza. Para muestras grandes se utilizará la Tabla de distribucional normal “z” y para muestras pequeñas.9 y la columna 6. Solución: Como se trata de una muestra grande.47503 cuando el valor buscado en la tabla. 2007). la cual es de 4 meses.05 = 0. Utilizar el nivel de confianza de 95% (*) sustituyendo se tiene lo siguiente: 1º. se usará la Tabla de distribución “t” student.098 por tanto .05 √80 80 2º. -µ la media-. La probabilidad específica recibe el nombre de nivel de confianza” (Douglas A.valor de “z” o “t” por σ (*) Ejercicio: Ver el siguiente ejemplo: Un distribuidor de bombillas está interesado en conocer el promedio de vida que tiene la población del producto que distribuye (focos). σ/√n = desviación estándar de la población. por lo tanto el valor de “z”. para encontrar su valor su valor. se usará la tabla de distribución normal “z”. por lo tanto es 0.que es posible para la estimación del parámetro de la población. σ= 4 meses 4 = 0.05) 1. 4º.96x0. Wathen. Se calcula el error estándar σ= σ/√n. Ahora se tiene:  19 ± Z 1.95/2= 0. el cual se ubica en el renglón 1. Selecciona aleatoriamente una muestra de 80 consumidores minoristas y de su análisis resulta un promedio muestral de 19 meses. Del cual antes de proseguir. 3º. El número anterior se localiza en la tabla respectiva. n≤ 30.96 (σ. 1 meses límite superior y. se tendrán que desarrollar en sesiones de clase. La desviación estándar de la población es de 18 puntos. se puede aclarar que los ejercicios desarrollados con anterioridad. con un nivel de confianza de 95%. Se puede concluir que. Se dispone con la información del valor de la desviación estándar de la población ( σ ).1 y 18. Desarrollando la fórmula matemática se tiene:  ± z (σ) Ejercicio: Dada una muestra aleatoria del tamaño 50.No se cuenta con la desviación estándar poblacional. Pero se recomienda la sustitución de la desviación estándar de la muestra ( s ). Y de acuerdo a la bibliografía consultada. se pide: a) Calcula el error estandar b) Construye un intervalo de confianza para la media poblacional Para el cálculo de la estimación del intervalo de confianza al igual que los estimadores puntuales comienzan a través del estudio del cálculo de la media poblacional.9 meses respectivamente. con una desviación poblacional de 18 puntos.41 19 19 ┼ - 0. se deriva una media. se refieren a casos donde su utiliza la Tabla de Distribución normal . por lo que sabe que hay una desviación estándar en los precios de $5. con base en la información que se tuvo disponible y su análisis se estimó que la vida promedio de la población total de limpiadores de parabrisas se encuentra en el intervalo de 19. por la desviación estándar de la población. se tiene una media de 42. desea comprar para fabricar sus productos (licuadoras) los accesorios necesarios.00.098 0. Muestrea aleatoriamente 30 de los accesorios y encuentra que el precio promedio (ẋ) de uno de los accesorios es de $120. diversos ejemplos. se parte de la identificación de los siguientes casos para las estimaciones: 1º.9 meses límite inferior.98 = 19. Se pide estimar el error estándar y un intervalo de confianza del 90%. Calcula el error estándar y el intervalo de confianza de 99% Desarrollar la fórmula matemática se tiene:  ± z (σ) Ejercicio: De una muestra de 100 elementos seleccionada aleatoriamente de X población. Con el fin de garantizar que el estudiante aprenda a identificar y aplicar los diferentes conceptos que se utilizan en este tema. = 18. Ejercicio: Una fábrica de aparatos domésticos. y 2º. Bajo esa premisa. Esto significa que el resultado de la prueba no influye en el resultado de otra. En la descripción que sigue. Ejercicio: Se selecciona de una población. Lind. se incluyen p que son éxitos y q los fracasos. sin embargo. de . 2007) Como se señaló en la parte correspondiente a la determinación del tamaño de la muestra para la proporción en este material.” (Daouglas A. ESTIMACION DE INTERVALOS DE CONFIANZA PARA LA PROPORCIÒN. si n=20. para la estimación de un intervalo para la proporción de la población. 310. se puede utilizar otras. Se pide: a)Estimar el error estándar de l media b)Calcula el intervalo de confianza de 99% para la media. que se le asigna un valor a p. de tal suerte que tanto el valor de p y de q. La fórmula de la proporción muestral es p = x n . “t”).50 por ejemplo y q de . seleccionados aleatoriamente de una población. es el estudio de elementos. Ahora se procederá a trabajar en la estimación de intervalos de confianza utilizando la distribución compacta (dist. b) Sólo hay dos posibles resultados (lo normal es referirse a uno de los resultados como éxito y al otro como fracaso). una muestra del tamaño 28. se utiliza grados de libertad que se obtiene restando 1 al tamaño de la muestre (n-1). es necesario cumplir con los siguientes supuestos: a) Los datos de la muestra son resultados de conteo. se tendría 20-1 de tal manera que sentendrán 19 grados de libertad. Su utilización o manejo se puede resumir de la siguiente forma: considerando que es una muestra  30. se tuvo una media de 25 elementos. que además del tamaño de la muestra y el nivel de confianza. d) Las pruebas son independientes. es decir. y una desviación estándar de 12 puntos. Marchal y Samuel A. La fórmula matemática se construye:  ± t (σ) Ejercicio: De una muestra de 30 elementos. deben sumar 1. pág.50 Esta escala es la más común. c) La probabilidad de un éxito permanece igual de una prueba a la siguiente.42 (z). se tuvo una media muestral de 42 y una desviación estándar muestral de 18 puntos: A) Calcular el error estándar b) Estimar el intervalo de confianza de 99% para la media (desarrollando la fórmula). “Para crear un intervalo de confianza para una proporción. en este tipo de distribución. William G. Wathen. En las sesiones.000 unidades que contienen ciertos defectos de funcionamiento. La fórmula para la estimación del intervalo de confianza para la proporción de una población está dada por: p±z p( 1-p ) n √ Para la estimación del intervalo de la proporción de una muestra. se puede decir como ejemplo que. La afirmación que a continuación se transcribe. cuando se aplica un 95% del nivel de confianza de las medias de las muestras seleccionadas de una población se ubicarán a ±1. se tratará. desde el punto de vista muy particular tiene lógica y congruencia ya que como es aceptado.800 determinó que 700 presentaron problemas defectuosos.43 ¿Qué es la proporción de una población?. también es una razón o porcentaje. Desarrollando la fórmula p±z p(1-p) n 2. Se pide: Calcular el porcentaje de la muestra y estimar el intervalo del 95% de la proporción. La aplicación del criterio de opinión: De acuerdo en desacuerdo.4 Probabilidad de que el verdadero parámetro de la población esté contenido dentro de la estimación por intervalo. que interviene para el análisis de interés. En este apartado. Se considera no sólo una fracción de la población.57 desviaciones estándares de la media poblacional. de que el intervalo contenga la media de la población. . se desarrollaran por parte de los estudiantes una serie de ejercicios para la estimación de los intervalos correspondientes. primero se calcula. Basado en el teorema del límite central y sobre todo cuando se trata de muestras grandes razonablemente. falso verdadero. se encontrarán a ±2. de que el intervalo estimado contenga el parámetro de la población. Estas dos aseveraciones se les llaman intervalo de confianza de 95% e intervalo de confianza de 99%. si no. de hacer un análisis en forma específica de la probabilidad que existe una vez realizada una distribución. el porcentaje de la población. que se muestreará. Ejercicio: Una compañía que fabrica computadoras de marca desea conocer la proporción de las computadoras de un lote de 24. de que entre más grande sea la muestra seleccionada hay más certeza –probabilidad-. Si es el caso de 99%.96 desviaciones estándares de la media poblacional. de una muestra de 1. 44 Pero como se debe comprender el proceso de valorar la probabilidad de que el intervalo estimado contenga el parámetro de la población. Marchal y Samuel A. la distribución de la media muestral tenderá a aproximarse a una distribución normal. No obstante. cobra importancia el diseño de intervalos de confianza. es preciso determinar qué es el teorema del límite central. *299. Los dos puntos extremos de la quinta muestra son inferiores a la media poblacional. Lind. si se recuerda que un intervalo contiene una serie de medidas o valores específicos razonables para la media poblacional que para su estimación. En el análisis se dejó claro la diferencia y cómo se utiliza cada una de ellas. Wathen. Esto se debe al error de muestreo. Esto puede ser posible cuando la muestra es de tamaño más grande Cuando se abordó el tema de estimación se hizo referencia a la estimación puntual y estimación por intervalo. como en la sección anterior. µ. Antes de proseguir con el análisis de este tema. amen de conocer los demás datos para ello. se calcula la media de cada una y. que constituye el riesgo que se asume cuando se selecciona el nivel de confianza” (Douglas A. Cerca de 5% de los intervalos no contendrían el ingreso anual medio poblacional. tal vez varios cientos. que existe de que en el intervalo estimado. para cada muestra calcula la media y después construye un intervalo de confianza de 95%. posteriormente. se asocia el nivel de confianza que decida el investigador. Al tomar este tema –teorema del límite central-. Para el caso de la probabilidad de que el parámetro se encuentre dentro del intervalo. que trata además de la discusión de la probabilidad.…se determina un intervalo de confianza de 95% para la media poblacional. éste se puede entender como el proceso a través de seleccionar muestras de sólo un tamaño en particular de la población que sea. analizar la siguiente transcripción: “Suponga que selecciona varias muestras de 256 gerentes. 2007) . William G. Desde una concepción personal. en consecuencia. un intervalo de confianza particular contiene el parámetro de población o no lo contiene. El siguiente diagrama muestra los resultados de seleccionar muestras de la población de gerentes en la industria del menudeo. Obsérvese que no todos los intervalos incluyen la media poblacional. Puede esperar que alrededor de 95% de estos intervalos de confianza contenga la media de la población. este contenido el parámetro poblacional. Ahora bien. pág. 301-302. La doctora Patton es profesora de inglés. William G. para el número medio de palabras con faltas de ortografía en la población de ensayos”. Lind.Determine el intervalo de confianza de 95% para la media poblacional” “8. Construye un intervalo de confianza de 95%. Se toma una muestra de 81 observaciones de una población normal con una desviación estándar de 5. Cuando se abordó el tema de estimación de intervalos. De ahí que se tendrá para efectos del aprendizaje del estudiante. Hace poco co ntó el número de palabras con faltas de ortografía en un grupo de ensayos de sus estudiantes. trabajar con muestras mayores a 30 elementos. Determine el intervalo de confianza de 99% para la media poblacional” “2. pág. para la aplicación de la técnica y criterios en relación al tema de la estimación de intervalos para la media poblacional con muestras grandes. . La media de la muestra es 55.5 Cálculo de las estimaciones por intervalo de la media en las muestras grandes Un intervalo de confianza para la media poblacional con una desviación estándar conocida. La media de la muestra es de 40. En su clase de 40 alumnos de las 10 de la mañana. Del texto bibliográfico Douglas A. 2007) . se cree prudente y de mucho interés tomar algunos modelos de problemas. De las seis muestras solo la última contiene La media poblacional 2. Observó que la distribución de palabras con faltas de ortografía por ensayo se regía por la distribución normal con una desviación estándar de 2. se planteó en forma simbólica la representación de los límites de confianza –superior e inferior-. la selección de muestras grandes. Marchal y Samuel A. Se toma una muestra de 49 observaciones de una población normal con una desviación estándar de 10.05. Lo más preciso en este apartado es el desarrollo de una serie de ejercicios. Ya que previo a ello se ha trabajado sobre la conceptualización de los temas y el beneficio en su utilización.45 Diagrama. el número medio de palabras con faltas de ortografía fue de 6. en sesiones de clase.44 palabras por ensayo. Wathen. supone teóricamente. “1. que aquí se repiten: ẋ±valor de “z” ó “t” (σẋ). ” En todos los ejercicios para la estimación de intervalos se hará uso de la distribución normal “z”. a). Entrevistó a 100 clientes y descubre que 80 pagaron en el área de las bombas. En la descripción que se hizo en relación a la estimación por intervalo.” 7-31 En una prueba de seguridad automovilística efectuada por el Centro de Investigación en Seguridad Carretera de Carolina del Norte. se estableció la fórmula punto 2. Encuentre el error estándar estimado de la media. 2007) consultada con el propósito de insistir en el estudiante una mayor claridad con la práctica aplicando los conceptos que son necesarios incluir en el análisis: “15. Lind. William G. se transcriben: “7-30 De una población de 540 individuos. Levin.) b) Calcule el error estándar estimado de la media. A partir de esta muestra.46 De (Richard I. pág. b). 312. se encuentra que la media es de 6. 1998).3 del contenido de este material para la estimación de la proporción de una población.1 libras por plgada cuadrada.368. Calcule el valor de la proporción de la población. 2. b) Construya un intervalo de confianza de 96% para la media. a). Wathen. Marchal y Samuel A. Se construyen con la imaginación y creatividad de los estudiantes. Aquí se plantean algunos ejemplos sobre este tema y que son tomados de la bibliografía (Douglas A. Construya u intervalo de confianza de 95% para la proporción poblacional. otros ejercicios que se deben presentar en sesiones de clases. El propietario de West End Kwick Fill Gas Satation desea determinar la proporción de clientes que utilizan tarjeta de crédito o débito para pagar la gasolina en el área de las bombas. c) Construya un intervalo de confianza del 95% para la media de la población. pág.2 y la desviación estándar de 1. la presión promedio en las llantas de los automóviles de una muestra de 62 neumáticos fue de 24 libras por pulgada cuadrada y la desviación estándar fue de 2. con el propósito de generar la habilidad de distinguir los elementos que se utilizan en problemas de la estimación de intervalos de confianza que incluyan a estos –parámetros-. ¿Cuál es la desviación estándar de esta población? (Hay aproximadamente un millón de automóviles registrados en Carolina del Norte. 383. a). c) Interprete sus conclusiones” .6 Cálculo de las estimaciones por intervalo de la proporción de muestras grandes. se toma una muestra de 60. a). Pascal debe determinar la porción de chips defectuosos que le suministra el actual proveedor. 1998) se transcriben los siguientes ejercicios: “7-35 Pascal Inc. Se probó una muestra de 200 chips y de éstos 5% tenía defectos. dado un nivel de confianza igual a 0. habrá casos especiales en que siendo la muestra n≤30.5 de este material. chips sin probar para computadora. a). b). para la estimación de intervalos. 2. Se debe recordar que en los puntos anteriores de este material. una vez que hayan tenido la habilidad de distinguir y aplicar los diferentes conceptos. está considerando cambiar a su proveedor por otro que se los suministre probados y con garantía a un precio más alto.250 afirmaron que la verían y sugirieron reemplazar el programa de investigación de crímenes. a). .” Como se señala al final del punto 2. Estime el error estándar de la porción de ejecutivos que culpan de las ventas bajas al clima cálido. los ejecutivos estudian n una muestra de 400 telespectadores.95. Construya un intervalo de confianza de 99% para la proporción poblacional. una tienda de computación que compra. b) Encuentre los límites superior e inferior de confianza para esta porción. a través del planteamiento de ejercicios prácticos. Interprete los resultados que obtuvo”. Estime el error estándar de la porción de chips defectuosos. ahora se hará preferentemente con muestras n≤30. se trabajó con muestras grandes. Antes de tomar una decisión definitiva. Después de ver la comedia . para la proporción de la población.7 Estimación de intervalo mediante la distribución “t”. De (Richard I. en este apartado se trabajara con valores de “t”. b) Construya un intervalo de confianza de 98% para la porción de chips defectuosos adquiridos” “7-36 Una muestra de 70 ejecutivos de pequeña empresa fue investigada con respecto al pobre desempeño que ésta tuvo en noviembre. Por eso. se insistirá en la imaginación y creatividad de los estudiantes. al mayoreo. 65% de los ejecutivos creía que la disminución en las ventas se debió al alza inesperada de la temperatura. 386. Es importante saber que en ocasiones. lo cual trajo como consecuencia que los consumidores retardaran la adquisición de productos de invierno. c). Sin embargo. pág.. se aplicará la distribución normal “z”. Con el fin de determinar si éste es un plan costeable. que se transmite las horas de mayor audiencia. Calcule el valor de la proporción de la población.47 “17. la distribución normal no es ad hoc para el estudio y construcción de intervalos de confianza. Levin. con una nueva comedia orientada a la familia. La red Fox TV considera reemplazar uno de sus programas de inversión de crímenes. Para calcular el valor de “t” que servirá para la estimación del intervalo.05.se encontrarán valores para los niveles de confianza.02 y 0. se tiene que 25-1 = 24-.00 hasta 0. 1998).4750. va desde 0. es decir. 1998) para encontrar el valor de “t”. buscamos en la tabla t en la columna encabezada con el valor 0. su valor es 2. De tal manera que para la aplicación a casos. 0. 95%. y la desviación estándar de la población es desconocida. letra griega alfa. con su propio nombre. 90%.64. En el caso de uso de la distribución normal -“z”. se supone que la población de la cual se toma la muestra.hay mayor amplitud para determinar su valor. 2 y 1% respectivamente.262 respectivamente . por ejemplo. se debe contar con tamaño de la muestra n. se requiere de la determinación del grado de libertad. Esta probabilidad de 0. mientras que con los mismos niveles para “t” cuando n= 25. conocer algunos aspectos importantes sobre dicha distribución: Como ya se ha señalado con anterioridad. durante los primeros años del siglo xx. -normalmente son 10. 390. su valor es 1. 98% y 99% en las columnas alfa encabezadas por los valores 0. 5. 1998) Es conveniente antes de entrar a el análisis de su aplicación en la estimación de intervalos de confianza.48 “Los primeros trabajos teóricos sobre la distribución “t” fueron hechos por W. por eso se va a observar que en la tabla. para intervalos de confianza de 95%. para “z” . por otra parte.10.4500. pág. la empresa no permitía que los empleados. nivel de significancia –probabilidad de que el parámetro no se encuentre dentro del intervalo estimado-. por ejemplo si la muestra es n=25. 0. publicaran sus hallazgos de investigación. la media muestral y la desviación estándar de la muestra. su valor es 2. Encontraríamos los valores “t”apropiados.711.0. Gossett era empleado de la Guinness Brewery en Dublin Irlanda. La característica de la distribución “t” posee una mayor dispersión que la distribución “z”. Levin.10 de tener error se representa con el símbolo α. sin embargo para distribución “t”. De modo que Gossett adoptó el seudónimo de Student para publicas” (Richard I. “Si estamos haciendo una estimación a un nivel de confianza de 90%. su uso para las estimaciones se requiere tomar muestras pequeñas. su valor es de 1.” (Ricard I.96. 388.09.Practicamente el enfoque de esta distribución es buscar o medir la probabilidad de que el parámetro que se está estimando no esté dentro del intervalo. 388. es casi normal.Gossett. S.01 respectivamente. pág. aparecerán valores con mayor magnitud. Levin.110 y cuando n=10. cuando n=18. su valor es 1. Levin.” (Richard I. pág.como se presenta más compacta sólo contiene cuatro columnas y en algunos casos cinco columnas. grados de libertad gl –que se determina n-1. “¿Qué son los grados de libertad? Podemos definirlos como el número de valores que podemos escoger libremente. William G. 90%_______.771 +1. se prosigue con algunos ejemplos. se insiste en la imaginación y creatividad de lo estudiantes para el aprendizaje en el manejo de esta distribución. n = 14 df = 13 grados de libertad 0. s=σ 0-09. ¿Sería razonable que el fabricante concluyera que después de 50 000 millas la cantidad media poblacional de cuerda restante es de 30 pulgadas”? (Douglas A.05 del área bajo la curva 0.90 del Bajo la curva Distribución “t” -1.09 pulgadas. es conveniente saber que. 99%----. Se tiene que calcular el error estándar estimado de la media de la población.2 de este material.05 del área bajo la Curva 0. pág. n = 18. se harán actividades con los siguientes ejemplos que se transcriben de la bibliografía consultada: “Un fabricante de llantas desea investigar la durabilidad de sus productos. la desviación estándar.771 Como ya se conoce la técnica para determinar tanto la media poblacional como la media muestral.49 Gráfica “t”. utilizando la siguiente fórmula: . n = 13. con el propósito de familiarizarse con la identificación y aplicación de los conceptos para la estimación de intervalos de confianza. 305. decisión del nivel de confianza. Construya un intervalo de confianza de 95% para la media poblacional. Lind. 90%_______.32 pulgadas de cuerda restante con una desviación estándar de 0. Independientemente de poder realizar muchos ejercicios. Una muestra de 10 llantas para recorrer 50 000 millas reveló una media muestral de 0. Solución 1o. Marchal y Samuel A. encontrar los valores apropiados para “t” y poder construir intervalos de confianza: n = 20. 2007) Antes de proseguir con el desarrollo de la solución del problema. selección del tamaño de n. como no se conoce la desviación estándar de la población se llegará a establecer una igualdad como se expresa a continuación y aquí aplica el análisis que se hizo en el punto 1. Wathen. Si se tienen muestras de los siguientes tamaños y niveles de confianza. 98%_______. n = 30. 262(0.32+0.25 lim. y 0. Así ya se puede desarrollar la siguiente expresión para los límites superior e inferior: ±ts/√n: 0.03) = 0. Éste es igual a 10-1. ya sea para estimar la media y también la proporción poblacional.07=0. Luego.50 σ = σ/√n = σ= 0.32±2. con respecto a medidas que se trataron en el tema de la teoría central del límite. varianza y coeficiente de variación.sup. y que con regularidad coloca pedidos con dos proveedores distintos. hay un nivel de significancia de 0.05.39 lim. Proponer y resolver ejercicios por parte de los estudiantes en sesiones de clases para garantizar el aprendizaje-enseñanza de este tema. Posesionarse en el renglón de la tabla en el número 9 y se recorre hasta la columna 0. En el punto 1. son las que tienen que ver con la desviación promedio.16 = 0. La muestra es de 10 y como se necesita el grado de libertad gl.09/3. desviación estándar. se encuentra entre el intervalo de 0.5 de este trabajo –material-.09/√10. “t” su valor.03. se realizó el análisis. sobre el proceso y criterio y además los conceptos que son aplicados para calcular el tamaño de la muestra (n) al enseñar el uso de éstos para obtener información significativa de una población. 2. aquí se retomaran las observaciones y puntos de vista más específicos sobre el tema para mejor comprensión y aplicación del mismo. Después de varios meses de trabajar así.8 Tamaño de la muestra para estimar una media. En los cursos de estadística. “Además de las medidas de localización.07 = 0. ya que en la mayoría de los estudios que los estudiantes tienen que realizar. entonces se busca en la tabla de dist.32-0. con frecuencia es conveniente considerar medidas de dispersión o variabilidad: Por ejemplo. parece que la descripción más comprensiva en lo que se refiere a la dispersión. Esto permitirá al fabricante tener una certeza del 95%.05 de probabilidad de que no se encuentre el parámetro dentro del intervalo.25 y 0. inf. También se conocen como medidas de variabilidad y su uso es importante para conocer el grado de dispersión en que se encuentra una población de la cual es seleccionada la muestra. hay presencia de la duda sobre. encuentra que el promedio de días necesarios para surtir los pedidos es de .39. cuyo valor es 2. = 0.10 Medidas de dispersión: Rango.262. es decir distinguir el porqué y cuando se tendrá que hacer uso de la distribución “t”2.028 ≈ 0. como se está trabajando con un nivel de confianza de 95%. se tiene que es 9. Es razonable pensar que el parámetro µ.9 Tamaño de la muestra para estimar una proporción. suponga que es un agente de compras de una importante empresa manufacturera. ¿de qué tamaño o cuantos elementos debe contener una muestra? 2. sin embargo. Aunque la cantidad promedio es.relativa Frec. preferir al proveedor Dawson Supply. 2004) *histogramas. C. Observe la dispersión. pág. Sweeney y Thomas A. o variabilidad en los histogramas. para cada proveedor. Ahora es momento de realizar una breve presentación. Dennis J. Frec. que son utilizadas con más frecuencia. que la producción de Baton Rouge tiene una variabilidad que va de 48 a 52 montajes por hora. Lind. por lo que se concluye que la producción por hora en Beton Rouge se acerca a la media. 83. registran menor dispersión en cuanto a las fechas – días-.51 aproximadamente 10. ya que registra la diferencia entre los valores máximo y mínimo de una serie de datos. pág. se presenta sin lugar a dudas más errática. Rango. de 10 en ambos casos. Los histogramas que resumen la cantidad de días hábiles requeridos para surtir los pedidos se muestran en la figura 3. ya que la medida de dispersión tiene un valor de 20 montajes. mientras que en Tucson sucede que hay una mayor dispersión en la producción. que representa la medida de dispersión más simple. “La producción media aritmética por hora tanto en la planta de Boton Rouge como en la de Tucson es de 50. . Clarck Distributor 9 10 11 Días hábiles 7 8 9 10 11 12 13 14 15 Días hábiles Parece razonable que lo importante en todos los casos de las empresas que necesitan el suministro de materiales a tiempo. se aprecia. Williams.2. de algunas medidas de variabilidad –dispersión-. 2007) En la siguiente figura. ¿tienen éstos el mismo grado de confiabilidad para entregar a tiempo?. 72. Ver figura. se inclinan por aquéllos agentes que en esta tarea –suministro-. cuya diferencia es de 4 montajes –es el rango-. Wathen. Anderson. Marchal y Samuel A. ¿Qué proveedor prefiere usted? ” (David R. Sin embargo. podría concluir que las distribuciones de las producciones por hora son idénticas.2 Dawson Supply J. se aprecia sin embargo que la producción en la planta de Tucson. es más conveniente. William G. más o menos. los registros de producción de 9 horas en las dos plantas revelan que esta conclusión no es correcta” (Douglas A. En el caso de la ilustración de las figuras antes descritas y que se refiere al planteamiento anterior.relativa FIGURA 3. Sobre la base de las dos medias. relaciona de hecho los parámetros poblacionales ( σ y µ) de igual manera con los estadísticos ( y s ). 2007) Coeficiente de variación. Marchal y Samuel A. se expresan en porcentajes. El resultado de las operaciones matemáticas. El rango es la diferencia entre los valores alto y bajo de un conjunto de datos.77-78. William G. Wathen. Wathen.52 Producción por hora de monitores de computadoras en las plantas de Beton Rouge y Tucson. Marchal y Samuel A.. La varianza de 106. es la raíz cuadrada de la varianza. págs. 40 . pág. y la desviación media de las desviaciones de la media. Sin embargo. Baton Rouge 48 49 50 ẋ 51 52 Tucson 50 60 ẋ (Douglas A.72. 2007 La desviación estándar.8 del número de multas levantadas no se expresa en términos de multas. sino de multas elevadas al cuadrado” (Douglas A. cuya fórmula para la población esta dada por: σ = √Ʃ(x-µ)2/N. William G. Lind. Lind. la varianza resulta difícil de interpretar en el caso de un solo conjunto de observaciones. “Tanto el rango como la desviación media resultan fáciles de interpretar. son las acción de tipo B. CV (A) = 5/150X100 = 3.0% Se denota que desde el punto de vista de precios de cada emisión accionaria. Con base en una comparación absoluta la variabilidad del precio de las acciones A fue mayor a causa de una mayor desviación estándar. para comparar dos tipos de casos y considerar la variación: “En 2 emisiones de acciones de la industria electrónica. En el caso de las acciones B. 3. Así las fórmulas son”. con σ=$5 en el caso de las acciones A. el precio medio de mercado al cierre durante un periodo de un mes fue de $150. el precio medio fue de $50. UNIDAD III PRUEBA DE HIPOTESIS OBJETIVO: Aplicar la prueba a una hipótesis propuesta. dependiendo de las características de la muestra para saber si es correcta o no. Pero en cuanto al nivel de los precios deben compararse los respectivos coeficientes de variación ”. define el concepto de coeficiente de variación con la siguiente expresión: “Coeficiente de variación indica la magnitud relativa de la desviación estándar en comparación con la media de la distribución de medias.1 Concepto de prueba de hipótesis . 1999). alrededor de 2 veces más variables en su precio que las de tipo A. expresada como porcentajes. Población CV = σ/µx100 Muestra CV = S/√X100 El ejemplo siguiente.53 Leonardo Kazmier. es con el propósito de aplicar como ejercicio los elementos. con una desviación estándar de $3. 63-64. (Leonardo J. pág. Kazmier. CV(B) = 3/50X100 = 6.3%. H1 o Ha (investigciòn). Su notación . Y H1 Análisis de prueba de hipòtesis de una media y proporciòn de una poblaciòn. Hipòtesis alternativa: Contradice lo establecido por la Hipòtesis nula Ho . Ji-cuadrada (X2) y Dist. para darle valor mas confiable al paràmetro de la poblaciòn derivado de una muestra. Ahora en este caso en lugar de crear un conjunto de valores en el que se considera se encuentre el paràmetro poblacional. PRUEBA DE HIPOTESIS En el procedimiento de esta prueba de hipòtesis.54 Hipòtesis nula: Ho supuesto tentativo acerca de un paràmetro poblacional. Vèanse algunos ejemplos de enunciados que son susceptibles de probar. para probar dos afirmaciones podría decirse opuestas: es decir. . “t”. Distribuciones utilizadas: Normal “Z”. Como se recordarà en las sesiones anteriores nos ocupamos del estudio de la inferencia estadìstica mediante la construcciòn de un intervalo de confianza. “F”. se utilizarà un esquema o un procedimiento para probar la VALIDEZ de un enunciado relacionado a un paràmetro poblacional. las indicadas por: Ho. sólo es posible usar datos contenidos en una muestra. Ho: µ ≤ µo Extremo superior H1: µ > µo Ho: µ ≥ µo H1: µ < µo Extremo inferior . Ocho por ciento (8%) de los jugadores asiduos a la lotería estadounidense jamás gana màs de $ 100 en juego.8 años. La cantidad media de millas recorridas en una ChevyTrailBlazer rentada durante 3 años es de 32000 millas . el salario inicial medio en ventas para un graduado de universidad es de $ 37 130 . HIPOTESIS ALTERNATIVA DE DOS EXTREMOS: Ho:µ = µo H1: µ ≠ µo HIPOTESIS ALTERNATIVA DE UN EXTREMO INFERIOR O SUPERIOR . El tiempo medio que una familia estadounidense vive en una vivienda en particular es de 11.55 EJEMPLO DE ENUNCIADOS TENTATIVOS (Ho) La velocidad media de los automóviles que pasan por la señal de 150 millas de la carretera Wes tVirginia es de 68 millas por hora . En 2005. Treinta y cinco por ciento (35%) de los jubilados de la región Norte de Estados Unidos vende su hogar y se muda a un clima màs cálido después de un año de haberse retirado. 56 PRUEBA DE HIPOTES IS DE DOS EXTREMOS (COLA) REGION NO RECHAZO REGIÒN NO RECHAZO REGION NO ACEPTACIÒN PRUEBA DE HIPOTES IS UN EXTREMO ( S UPÈRIOR E INFERIOR) EXTREMO INFERIOR (IZQUIERDO) NO ACEPTACIÒN REGION NO RECHAZO EXTREMO S UPERIOR (DERECHO) NO ACEPTACIÒ N VALOR CRITICO . 57 ESTRUCTURA DE PUNTOS PARA PROBAR UNA HIPOTGESIS 1.-Calcular el error estàndar y el valor estandarizado de la prueba de hipòtesis .50 o µ≠12-50 se aconseja que así se debe ver o entender para la aplicación de la técnica de la prueba de hipótesis.5. Nota. Es de considerar que la hipótesis nula (Ho) no permite cambios por el hecho de que siempre será igual.-Identificar en el gràfico la regiòn de no rechazo y no aceptaciòn . la hipótesis alternativa dice que: µ<12.-Construir la hipòtesis nula (Ho) y la hipòtesis alternativa (H1) 2. 332. H<12. William G. pág. La hipótesis alternativa nunca trata la igualdad.se lee “H subíndice cero” y al construirla será siempre anteponiendo la igualdad. o suposiciones –hipótesis. ejemplo µ = 12. Marchal y Samuel A. su construcción será a través de 3 formas que pueden ser: H>12. Es indispensable plantear la hipótesis nula: La hipótesis nula se identifica por Ho.sobre los parámetros de una población.50. µ˃12. la prueba de hipótesis se define como: “Procedimiento basado en evidencia de la muestra y la teoría de la probabilidad para determinar si la hipótesis es una afirmación razonable" (Douglas A.5 y H≠12. Wathen. 2007) Siempre que se realiza una investigación existe el enfrentamiento a diversas interrogantes y como consecuencia se llega a emitir afirmaciones tentativas. Lind. ya que si ésta dice que es igual. la hipótesis alternativa que se identifica por H1.5. La teoría señala procedimientos para probar una hipótesis y el que se aconseja viene desarrollando a través de los siguientes pasos: 1º.5. 5.-Determinar el estadisco de prueba a aplicar y el nivel se significancia (ᾳ = la probabilidad de error de rechazar una hìpòtesis verdadera) y encontrar el valor crìtico ( punto que divide las regiones de no rechazo y no aceptaciòn de la hipòtesis nula) 3. Por otra parte. es decir.-Tomar en funciòn del resultado la decisiòn de no rechazar o no aceptar la hipòtesis nula Conceptualmente. Hipótesis nula “Enunciado relativo al valor de un parámetro poblacional formulado con el fin de probar evidencia numérica” Hipótesis alternativa “Afirmación que se . entonces es algo así como que le lleva la contraria a la Ho. 4. como ya quedó señalado en líneas anteriores de este material. la hipótesis nula se rechaza. si es menor. William G. Si el valor de la prueba de hipótesis “z” y “t” es mayor que valor crítico.“probabilidad de rechazar la hipótesis nula ( Ho) aún cuando ésta sea verdadera”. se habló de nivel de confianza por lo que es necesario aclarar para identificar la diferencia entre éste y el nivel de significancia. el primero. El nivel de significancia estará en función del tamaño de la muestra seleccionada. Lind. 2 y 1 % respectivamente. 333. 10.95 Región rechazo Probabilidad 0. por mencionar un ejemplo.Se calcula el error estándar y se estandariza el valor de la prueba de hipótesis “z” y “t”. Se selecciona el tipo de distribución 3º. se dice que se tiene un 98% de certeza y por el otro –nivel de significancia.donde se dividen la región de aceptación y rechazo. Por un lado. sin embargo.5 0 Escala “z” 1. pág. Región de aceptación 0. 3. cuando se trabajo en el apartado de la estimación y estimador en este material. Tipos de hipótesis Existen dos tipos de hipótesis.Cuando ya se ha calculado el valor crítico y el valor estandarizado de “z” o “t”. se acepta.1. Se determina el valor crítico –punto.58 acepta si los datos de la muestra ofrecen suficiente evidencia para rechazar la hipótesis nula” (Douglas A. Entonces el nivel de significancia es el porcentaje del error. se compara para determinar la toma de decisión. Wathen. 4º.1. Nivel de significancia. Marcar la región de aceptación y rechazo de la hipótesis nula. aquí se transcribe el punto de vista siguiente: . indica la certeza. 5o. Marchal y Samuel A. 2007) 2º.96 Valor crítico. 5. También se le conoce como hipótesis de investigación…” (Douglas A. Marchal y Samuel A. Ho. 333. . La hipótesis alternativa describe lo que lo que se concluirá si se rechaza la hipótesis nula. pág. William G. y se lee “H subíndice cero”. en esta sección del material se procederá a resolver algunos ejemplos e identificar una prueba de hipótesis de una y dos colas que también se conocen como de un extremo dos extremos o de una o dos regiones. y el subíndice cero implica que “no hay diferencia”. Marchal y Samuel A.2 Tipos de error y nivel de significancia Es evidente la relación de los tipos de error y el nivel de significancia. Wathen.3 Prueba de hipótesis con uno o dos extremos. Se representa H1 y se lee “H subíndice uno”. Las gráficas se presentan de la siguiente forma: Prueba de una cola Prueba de dos colas A continuación se plantean ejemplos. en primer lugar transcritos de la bibliografía consultada que se refieren a las pruebas con una y dos colas y se trabajará con ejemplos planteados por los estudiantes. es el riesgo o la probabilidad de rechazar la hipótesis nula. Véase siguiente cuadro: Investigador ________________________________________ Hipótesis nula No rechaza Rechaza Ho. la cual se designa Ho. cuando es correcta por un lado y por aceptar una hipótesis aún cuando es falsa. por la razón de que éste –nivel de significancia-. a nivel de tarea para su presentación en sesiones de clases. La letra mayúscula H representa la hipótesis. 335.. 2007) 3. Una vez que ya se ha estudiado los diferentes conceptos y argumentos sobre la forma o decisión de aceptar o probar una hipótesis. como quedó establecido anteriormente. Normalmente se incluye un término “no” en la hipótesis nula. 2007) 3.59 “hipótesis nula. que significa que “no hay cambio…La hipótesis nula es una afirmación que no se rechaza a menos que la información de la muestra ofrezca evidencia convincente de que es falsa. _________________________________________________________ Ho es verdadera Decisión correcta Error tipo I Ho es falsa Error tipo II Decisión correcta _________________________________________________________ (Douglas A. pág. Lind. se cometen Error tipo I y Error Tipo II respectivamente. William G. Lind. 000 horas. es porque las hipótesis están representadas: Ho:µ=µHo y H1:=µ˃µHo.000 horas).000. La  cae en esta región Aceptamos Ho. Hay que distinguir que se utiliza una prueba de hipótesis de extremo inferior.”(Richard I. Rechaza Ho sólo si la vida media de los focos muestreados está significativamente por debajo de las 1.000 horas. .000 horas Si la ẋ cae en esta región se rechaza Ho. pág. pág. 430. Ver gráfica.000 o muy por debajo de 1. Ver figura.000 horas. 429. “Una prueba de hipótesis de dos extremos es apropiada cuando la hipótesis nula es µ=µHo (en donde µHo es algún valor especificado) y la hipótesis nula es µ≠Ho. La compañía rechazará ésta sólo si le parece que la vida media está por debajo de las 1.60 En algunos casos no es usual la prueba de hipótesis de dos extremos. y entonces utiliza una prueba de dos extremos. rechaza la hipótesis nula si la vida media de los focos de la muestra está muy por arriba de 1.000 horas.Suponga que un fabricante de focos eléctricos desea producirlos con una vida media de µ=µHo = 1.000 horas. es claro que no rechazará la remesa.000. es decir. la hipótesis alternativa adecuada es H1:µ≠1. perderá clientes a favor de su competencia. Levin. Esto es. toma una muestra del producto con el fin de probar la hipótesis Ho:µ=1. 1996). 1996). µ 1. Para verificar que su proceso de producción esté operando adecuadamente.” (Richard I.000 horas en ninguna dirección. Cuan es una prueba de un extremo derecho.000 horas y H1:<1. tendrá un costo de producción muy alto porque los filamentos serán excesivamente gruesos. Así que las hipótesis del mayorista son Ho:µ = 1. el mayorista prueba una muestra para decidir si acepta la remesa o no. Como no quiere desviarse significativamente de 1.000 horas. porque esto no supondrá un costo extra. Si cree que los focos son mejores de lo esperado (con un vida media superior a 1. si el tiempo de vida es más largo. Cada vez que llega una remesa. Si el tiempo de vida es más corto. Levin. véase el siguiente ejemplo: “Consideremos el caso de un comerciante al mayoreo que compra focos eléctricos al fabricante…El mayorista los compra en grandes lotes y no desea aceptar un lote de focos a menos que su vida media sea al menos 1. del lado izquierdo de la media cuando sus hipótesis son: Ho:µ=µHo y H1:µ<µHo. 6. Estos ejes deben soportar 80. H1: µ < 3. 432. Ϭ = 0. los datos en este caso son µHo = 80. Ϭ = 12. σ = 68. La larga experiencia indica que la desviación estándar de la fuerza de sus ejes es 4.1.000 desviación estándar de la población n = 100 tamaño de la muestra  = 79.  = 65. = 363. muestras grandes y pequeñas “Un fabricante suministra los ejes traceros para los camiones correo del Servicio Postal de Estados unidos de América. H1:µ >98.000 lbxpulg2” H1:µ ≠80. pág. H1:µ ≠ 382. Levin.Ϭ=4.000 valores hipotetizados de la media de población σ = 4. H1:µ≠27. los prueba y encuentra que la capacidad de carga media de la muestra es 79. n = (Richard I.000 lb por pulg2.05 en la prueba.000 lb por pulg2 en pruebas de carga. H1:µ > 57. ¿satisfarán los ejes sus requerimientos de carga? (Richard I. n = 18 d) Ho: µ = 382. especifique qué distribución de probabilidad se debería utilizar en una prueba de hipótesis: a) Ho: µ = 27. El fabricante selecciona una muestra de 100 ejes de la producción.5.  = 99. Escritos simbólicamente. = 33. σ 0 1.5. n = 12 e) Ho: µ = 57. Se acepta µHo Rechazaremos la hipótesis nula si la media de la muestra cae en cualquiera de estas regiones Para los siguientes casos. 1996) Para la solución del problema.5. pág.4 Prueba de hipótesis para la media. 433. Ho:µ= 80.000 hipótesis nula: “la media poblacional es de 80.  = 2. 1996) 3.5. 1º.600 media de muestra Si el fabricante de ejes utiliza un nivel de significancia (α) de 0. se aplican los 5 pasos ya descritos con anterioridad.61 Si  cae en esta región Ho. pero un eje excesivamente fuerte eleva los costos de producción de manera significativa.000 hipótesis alternativa “la media no es 80. n = 50 c) Ho: µ = 3. n= 25 b) Ho:µ = 98.000” . Levin..8.600 lb por pulg2.5. es decir. la región de rechazo se marcará en el lado izquierdo de la campana. entonces la Ho. Región de aceptación Región de rechazo Región de rechazo Escala “z” Valor crítico . Los casos que se estudien y resuelvan con muestras pequeñas. El fabricante debe aceptar que la serie de producción reúne los requerimientos de carga. Se usa distribución normal “z”. Se rechaza. porque la muestra es grande y además se conoce la desviación estándar. muestras grandes y pequeñas De la misma manera que se trató en la estimación de intervalos de confianza para las proporciones. Calcular el valor crítico.000/10 = 400 z = -µ/σ = Z= 79.1. valor estandarizado de “z” es menor que valor crítico. Se utiliza el mismo procedimiento para probar una hipótesis que el de la distribución normal.000/400 = -1 4º.62 2º. -1 menor que -1.5 Prueba de hipótesis de proporciones. Calcular el error estándar y el valor estandarizado de la prueba de hipótesis “z” σ =σ/√n = 4.000/√100 = 4. 3. como se señala en la figura. Recuerda. cae dentro del tratamiento de la distribución “t”. z= -1. Como el valor de z es negativo.96 se acepta Ho. Si sucediera lo contrario. y es una prueba de dos colas.96 3º. es decir. que se acepta Ho. o sea.96 Valor crítico 5º.96 valor critico + 1. Porque el val or estandarizado de “z” es menor que el valor crítico. es factible probar una hipótesis para una porción de la población considerando que una proporción “ es la razón entre el número de éxitos y el .600-80. por la construcción de la hipótesis alternativa ( H1): observar gráfica. Región de rechazo -1. la distribución binomial se aproxima a la normal en sus características. Específicamente np y nq cada una debe ser al menos 5 antes de que podamos utilizar la distribución normal como aproximación de la binomial” (Richard I. Lind.63 número de observaciones” (Douglas A.Ho:p =0. El director de recursos humanos le dice al presidente que aproximadamente el 80%. 1996). está determinando la porción de aquéllos cuyas capacidad. El presidente reúne un comité especial para evaluar la capacidad de promoción de todos los empleados. pág. y se calcula el valor crítico: 95/2 = . Levin.8 “la porción de empleados promocionables es diferente a 80%” α = .8 valor hipotetizado de la porción de la población de éxitos qHo = 0.” (Richard I. 1996) “Consideremos como ejemplo. capacitación y experiencia de supervisión los califican para promocionarlos al siguiente nivel de administración.3 tamaño de la muestra porción de muestra de promocionables porción de muestra considerados no promocionables.7 q = 0. una compañía que está evaluando la promoción de sus empleados. Marchal y Samuel A. 2007) “Al aumentar el tamaño de la muestra. Levin. 443. y podemos utilizar la distribución normal para aproximar la distribución de muestreo.8 de los empleados de la compañía son “promocionables”. 443.2 valor hipotetizado de la porción de la población de fracasos n = 150 p = 0. sólo 70% de la muestra está calificada para su promoción. Este autor agrupa los datos para realizar la prueba de hipótesis de la siguiente manera: pHo = 0. Siguiendo los 5 pasos para la prueba de hipótesis que para la media.8 “80% de los empleados son promocionables” H1:p ≠ 0. pág. pág. Este comité efectúa entrevistas a fondo con 150 empleados y encuentra que. se pasa a la solución del problema. es decir. Uso de la distribución normal “z”.4750 en la tabla. a su juicio. 1º.05 nivel de significancia para probar hipótesis 2º. . William G. 353. Wathen. o 0. 631. “Es una familia de distribuciones diferenciadas por dos parámetros (grados de libertad del numerador. pág.025 del área 3º. 1996) Para la prueba de hipótesis de la distribución “F”.0010666= 0. En la estructura de la tabla en las columnas se representa el numerador.2) /150 =√0.8)(0. Se interpreta el resultado diciendo que se rechaza la hipótesis de que el 80% o 0.8 del personal son promocionables. Trazar la línea que divide las regiones de aceptación y echazo. y las líneas representan el denominador –grados de libertad respectivamente-.96 valor críitico Z = +1. es recomendable auxiliarse de la Tabla de valores. utilizada principalmente para probar hipótesis con respecto a varianzas” ( Richar I.0327 Se calcula el valor estandarizado de la prueba de hipótesis Z = p – pHo/σp = 0. porción de muestra estandarizada - 3. en donde se ubican valores que para efectos de la prueba se denominan “valor crítico”. sólo que para estos casos. Levin. . grados de libertad del denominador).8/0.025 del área o.96 5º.6 Prueba de hipótesis mediante la distribución “F” La distribución “F”. y está avalado ya que el valor crítico calculado es menor que valor de “z”.4750 o.06 o -1.06 4º.0327 = -3.4750 0.7-0. 3.96 0. Error estándar: σp = √ pHoqHo/n = √ (0.64 Valor crítico Z= -1. Para las muestras pequeñas se indica que es el mismo procedimiento. la distribución adecuada es la “t” Student. basada en la varianza entre las medias de las muestras (la varianza entre columnas) nj = tamaño de la J-ésima muestra j = media de la muestra de la J-ésima muestra X = gran media n = tamaño de la muestra k = número de muestras s2j = varianza de muestra de la J-ésima muestra nT = ∑nj tamaño de muestra total .).65 Al igual que como se trabajó con las anteriores distribuciones –distribución normal. 2 = nuestra primera estimación de la varianza de la población. los cuales se describen a continuación: Se plantea un problema sencillo para ilustrar la forma de resolverlo. Se examinaron los gastos mensuales de tres oficinas:: una de ellas en el Departamento de Agricultura. aplicando conceptos estadísticos en el proceso de la prueba “La Oficina de Contabilidad del Gobierno (OCG) de EUA. Al nivel de significancia de 0.__________ Agricultura 10 8 11 9 12 Estado 15 9 8 10 13 13 Interior 8 16 12 ________________________________________________________ (Richard I. distribución “t”. 613. Levin. otra en el Departamento de Estado y la última en el Departamento del Interior. Los datos se presentan a continuación. Levin. “z”. está interesada en ver si las oficinas de tamaño parecido.01. ¿existen diferencias en los gastos de las diferentes oficinas”?(Richar I. (Las oficinas que gastan más son susceptibles de una auditoria especial. pág. 1996) Antes de desarrollar el proceso para la prueba de hipótesis es indispensable identificar los siguientes conceptos que integran las fórmulas aplicadas: Tomados de la bibliografía consultada. 1996) Gastos mensuales (en miles de dólares) Algunos meses _____________________________________________. la teoría recomienda pasos a seguir para una prueba de hipótesis. pág. gastan la misma cantidad de dinero en personal y equipo. 613. “F” Se calcula las medias muestrales. Desde luego que la prueba apropiada es Dist.µ . 3º. 1º. X = 11 . 10 +8 + 11 + 9 + 12 = 50/5 = ẋ= 10 15 + 9 + 8 + 10 + 13 + 13 = 68/6 = ẋ = 11.)2/n-1 varianza de la muestra Ϭ 2 = ∑nj(-X)2/k-1 nj .66 Fórmulas: s2 =∑(x.1 Ϭ2 = primera estimación de la varianza de la población Ʃ nT – k sj 2 segunda estimación de la σ2 poblacional. Con la aplicación de todos los elementos señalados. X 50+68+36 = 154/14 =. hipótesis alternativa. se procede a probar la hipótesis.µ3 no son todas iguales. 2º.33 8 + 16 + 12 = 36/3 = ẋ = 12 Se calcula la gran media: es x doble barra. Ho:µ1 = µ2 =µ2 hipótesis nula “existe diferencias en los gastos” H1:µ1. Ẍ)2 1 .89 37.47 S22 = Ʃ( x . .ẋ 15 9 8 10 13 13 11. por lo que se usa la tabla de valores de “F”.4 ᵹ2 = Ʃnj( ẋ . Así dicho valor es de 7.82 dado por: 4 (2.9 1 Ʃnj(ẋ-Ẍ)2 5 5.3 (x .34 5 32 7.34 Ʃ(x-ẋ)2 = 10 S12 =Ʃ( x .ẋ )2 16 16 0 x .89 1.ẋ )2 13-69 5.3 11.4 3 13.69 2. Grados de libertad: No. para encontrar el valor crítico.3 11.Ẍ )2 k–1 Agricultura ẋ = 10 X.Ẍ)2 n( ẋ .01. De muestras – 1 nT – k 2 11 El nivel de significancia es de 0.3 12 Ẍ 11 11 11 ẋ-Ẍ -1 .21 que se busca con 2 grados de libertad del numerado y 11 grados de libertad del denominador.47) + 2 (16) 11 11 11 4º.3 Interior ẋ=12 x .1 S32 = Ʃ(x .3 11.3 1 ( ẋ .3 11.4 2 6.3 11.7 varianza entre columnas Estado ẋ=11.ẋ )2 n–1 10 4 32 2 Ʃ(x-ẋ)2 = 2.67 ᵹ2 =Ʃnj( ẋ .ẋ 10 8 11 9 12 10 10 10 10 10 (x-ẋ)2 0 4 1 1 4 13.Ẍ )2/k – 1 n 5 6 3 ẋ 10 11.5 16 Ʃ(x-ẋ)2 = 37.ẋ)2 n–1 Segunda estimación de la varianza de la población: ᵹ2 = Ʃ nj-1 Sj2 nT-k = 16.ẋ )2 n .29 10.89 2.5)+ 5(7.ẋ 8 16 12 12 12 12 ( x . 7 = 0. Estas.7 Prueba de hipótesis mediante la distribución X2. en las que se supone una población normal. por lo tanto se puede concluir que se acepta. siguiendo la distribución de probabilidad normal.68 5º. 7. La cola larga de la distribución es hacia el lado derecho. Cuando los valores de x aumentan. Existe una familia de distribuciones F. “2. Marchal y Samuel A.21. como 6. reciben el nombre de pruebas no . Lind. valor crítico En los apartados anteriores. “1. William G. la curva F se aproxima al eje de x pero nunca lo toca…”. 2007). con área de 0. pág. La distribución F es continua. Región de aceptación Valor de F = 0. La distribución F no puede ser negativa. Un miembro particular de la familia se determina mediante dos parámetros: los grados de libertad en el numerador y los grados de libertad en el denominador…”. se realizaron pruebas de hipótesis en donde se utilizaron una sola. Esto significa que se supone un número infinito de valores entre cero y el infinito positivo” “3. Es asintótica.407408. frente al valor crítico. “5.6. El valor menor que F puede tomar es 0”.42-.1. “4.21 3. cuando el número de grados de libertad aumenta. Pero existen pruebas disponibles.005 7.42 16 Este valor -0.Decisión. Principales características de la distribución F Se transcriben las principales características tomadas de la bibliografía consultada para este tema (Douglas A. 3. Wathen. dos y hasta tres medias de poblaciones.42 Región de rechazo. que existe variación en los gastos de las diferentes oficinas. la distribución se aproxima a ser normal”. Tiene sesgo positivo. es menor. tanto en el numerador como en el denominador. su uso es más común. En esta prueba se conjuga el binomio de frecuencias observadas y frecuencias esperadas. 2007): “La señora Jan Kilpatrick es la gerente de marketing de una fábrica de tarjetas deportivas. instaló un puesto y ofreció tarjetas de los siguientes seis jugadores miembros del Salón de la Fama.69 paramétricas También hay pruebas. En una exhibición de tarjetas de beisbol en Soutthwyck Mal el pasado fin de semana. respectivamente. en donde los datos son tomados como a escala de medición nominal.1.1 = 19 y 0. Esta prueba –prueba de bondad de ajuste-. Antes de continuar con el análisis es importante señalar que estas dos frecuencias significan: frecuencia observada (fo). frecuencias que teóricamente se esperan ver en una distribución de frecuencias. es el registro del número de sucesos o eventos. es tomado de la bibliografía consultada (Douglas A. 647-648. Wathen. en la que se suponen frecuencias esperadas iguales. Ella planea iniciar la venta de una serie de tarjetas de fotografías y estadísticas de juego de ex jugadores de las ligas mayores de Beisbol. En este tipo de prueba de bondad de ajuste interesa comparar básicamente una distribución observada contra otra distribución esperada. George Brett. Hank Aaron y Johnny Bench. es decir solamente interesan números y que éstos se clasifican sin un orden natural. Nolan Ryan. Lind. al igual que en las pruebas de bondad de ajuste en donde las frecuencias esperadas son desiguales. pág.y además hay que establecer el nivel de significancia y grados de libertad para encontrar el valor crítico. Marchal y Samuel A. n. El siguiente ejemplo que se desarrolla. En otras palabras se quiere saber si los hechos o acontecimientos están distribuidos en forma normal. Para la prueba de este estadístico es necesario usar la tabla de valores de esta distribución –Ji-cuadrara o x2. En este tipo recae el estadístico de prueba Jicuadrada o x2 3. Uno de los problemas es la selección de ex jugadores.7. Ty Cobbg. Prueba de bondad de ajuste x2 : frecuencias esperadas iguales. Al final del día vendió u n total de 120 tarjetas. mientras que frecuencia esperada (fe). El número de tarjetas vendidas de cada jugador aparecen en la tabla…¿La señora Kilpatrick puede concluir que las ventas no son iguales para cada jugador?” . William G. que se ubica en el renglón del grado de libertad y la columna correspondiente: ejemplo n=20. Tom Seaver.02. Wathen. Se procede a desarrollar el proceso de la prueba de la siguiente forma: 1º.70 Jugador Tom Seaver Nolan Ryan Ty Cobb George B Hank Aaron Johonny Bean Total Tarjetas vendidas 13 33 14 7 36 17 120 TABLA 17. Se selecciona el nivel de significancia. . que como se ha explicado que éste es la probabilidad de que se rechace la Ho.2 Frecuencias observadas y esperadas de las 120 tarjetas vendidas Jugador Tarjetas Vendidas (fo ) 13 33 14 7 36 17 Número vendido esperado (fe ) 20 20 20 20 20 20 Tom Seaver Nolan Ryan Ty Cobb George Brett Hank Aaron Johnny Bench Total 120 120 (Douglas A. William G. Lind.05. En este caso se aplica 0. frecuencias observadas y 2º. H1: Hay una diferencia entre las fo y fe. pág. 648. Marchal y Samuel A. Se Construyen: Ho: No hay diferencia entre las frecuencias esperadas. Ahora para probar la hipótesis que las ventas son iguales para todos los jugadores . 2007) Como se observa. se han determinado el número de frecuencias observadas y el número de frecuencias esperadas. por cada jugador. 3.71 3º.070.05 Probabilidad No se Rechaza Ho. se tiene 11. Características de la distribución x2 Como toda distribución aplicada a los problemas en los negocios contienen sus características que las distinguen unas de otras.05. Los valores Ji-cuadrada nunca son negativos. Lind. 2007) “1.7.45 =12. Si el nivel de significancia de 0. se describen las siguientes: (Douglas A. Se toma la tabla de Ji-cuadrada ( x ). Para determinar el valor crítico.8 = 0.45 = 8. para lograr el dominio e identificar todos los elementos que incluye el proceso de la prueba de este estadístico. Esto se debe a que la diferencia entre fo y fe se elevan al cuadrado…” . En este tema no hay problema.45 34.45 valor x 2 La hipótesis nula es rechazada. Hay que desarrollar otros ejercicios como tarea que presentarán los estudiantes en sesiones de clase. William G. 651. Wathen. sustituyendo entonces 6 – 1 = 5 porque k es igual al número de muestras. simplemente se sabe que el estadístico de prueba de hipótesis es x2: y se aplica la siguiente fórmula: X2 =Ʃ ( fo – fe)2 Fe 13 33 14 736 17 20 20 20 20 20 20 =7 (7)2 49/20 = 13 (13)2 169/20 =-6 (-6)2 36/20 2 =-13 (-13) 169/20 = 16 (16)2 256/20 =-3 (-3)2 9/20 = 2. Se representa la regla de decisión en la siguiente gráfica: Región de rechazo 0. Para el caso del estadístico de prueba x2. pág.070 Valor crítico 34. ya que es mayor el valor de x2 que valor crítico.8 = 8. En este ejercicio es: para los grados de libertad k – 1. Marchal y Samuel A.2. 11. que trazado en la gráfica es el punto de separación de la región de aceptación y región de rechazo.45 = 1.45 3º. Si esta diferencia es significativa. Este tipo de prueba de hipótesis básicamente está relacionada con las porciones de una población a través de las muestras. pág. sino del número de categorías”. “La Américan Hospital Administrator Association (AHAA) reporta la siguiente información respecto del número de veces que los adultos mayores son admitidos en un hospital durante un período de un año…Una encuesta de 150 residentes de Bartow Estates. el administrador necesita determinar si el lugar y el reconocimiento del nombre del candidato son dependientes o independientes. es útil su aplicación. y así sucesivamente como se observa en la siguiente tabla: TABLA 17. 42 y 51%.4 Resumen del estudio de la AHAA y de una encuesta de los residentes de Bartow Estates. “En muchas ocasiones. reveló que 55 residentes no fueron admitidos durante el año pasado…” (Douglas A.…Por lo tanto. Existe una familia de Ji-cuadrada. otra para 3 grados de libertad. Aún cuando la Prueba Ji cuadrada tiene frecuencias esperadas que no son iguales. Lind. William G. normalmente interesa la opinión o decisión de la población en cuanto a algo. etc. si el administrador llega a la conclusión de que la diferencia solamente se debe al azar).7. entonces puede decidir que el lugar escogido para pronunciar un discurso proselitista en particular no tendrá efecto en su recepción. otra para 2 grados de libertad. la forma de distribución Ji cuadrada no depende del tamaño de la muestra. para distinguir si una proporción difiere de otra. Hay una distribución de Ji cuadrada para 1 grado de libertad. Wathen. de los votantes investigados de las tres regiones reconocen el nombre del candidato.” ( Richard I. 1996). A continuación se transcribe un ejemplo. “3.. pág.72 “2. la distribución comienza a aproximarse a la distribución normal…”. 578. La distribución Ji cuadrada tiene un sesgo positivo. el administrador puede llegar a la conclusión de que el lugar afectará la forma en que debe actuar el candidato. a medida que aumenta el número de grados de libertad. 654. . Marchal y Samuel A. respectivamente. Levin. 3. comunidad con una población predominante de adultos mayores activos en el centro de Florida. Es decir.3. 2007). tomado de la bibliografía consultada y que se considera de utilidad para el aprendizaje-enseñanza de esta técnica. Sin embargo. Para conducir la campaña con éxito. Suponga que el administrador de campaña de un candidato a la presidencia del país estudia tres regiones diferentes y encuentra que 35. Pero si la diferencia no es significativa (es decir. Prueba de bondad de ajuste de x2: frecuencias esperadas desiguales. entonces. los administradores necesitan saber si las diferencias que observan entre varias proporciones de muestra son significativas o solamente son resultados del azar. se identificará a la variable independiente como X y a la variable dependiente como Y.30= 45. es preciso convertirlos para conocer las frecuencias esperadas teóricamente. de este material se obtuvo que x2 =1.1. Este criterio da la posibilidad de agrupar tanto las fo como las fe. Lind. Por lo tanto se concluye que se acepta la hipótesis nula Ho.como esta estructura del problema manejan cuatro categorías. William G. Una que se conoce y que corresponde a una variable independiente.815 y aplicando la fórmula desarrollada en el paso 3 de la prueba con frecuencias esperadas iguales. en la tabla. 654. 4. y la otra que es desconocida y que recibe el nombre de variable dependiente. UNIDAD IV. se tiene n – 1 = 4 – 1 = 3 grados de libertad y el nivel de la probabilidad..ANALISIS DE REGRESIÓN Y CORRELACIÓN OBJETIVO: Identificar el grado de relación y correlación entre un conjunto de pares de datos estimando el intervalo con un grado de confianza . Tanto en la administración pública como privada. 4. se prueba la hipótesis. Tipos de relaciones. Marchal y Samuel A. vean 150x. con las frecuencias observadas. pág. para calcular el valor de Ji cuadrada x2. Introducción La determinación de la relación entre variables es fundamental para los estudios y la toma de decisiones. Así una vez organizados los datos se procede para calcular las frecuencias esperadas de la siguiente forma: Este proceso es muy sencillo. Para el caso del presente análisis. Wathen. En la tabla de valores de Ji cuadrada o x2 se localizó al nivel de significancia de 0.2.40 = 60. 150x.73 Número de Porcentaje de Número de residentes Número esperado Admisiones AHAA del total de Bartow ( fo ) de residentes(fe) 0 40 55 60 1 30 50 45 2 20 32 30 3 o más 10 13 15 Total 100 150 150 (Douglas A.05 y 3 grados de libertad el valor crítico que es igual a 7.. “No hay diferencia entre la experiencia local y la nacio nal respecto de las admisiones en un hospital”. son las frecuencias esperadas sucesivamente. entonces para calcular el valor crítico. 2007) Como no se puede comparar los porcentajes que registra Bartow.3723. las tomas de decisiones están fundamentadas en el conocimiento de la información para que la evaluación sea significativa. . para conocer verazmente la relación que existe entre dos variables en particular. existen dos establecimientos que producen y venden bienes. se está hablando de una relación directa.74 Como se trata de interpretar las relaciones que existen entre variables. la venta de latas de aerosoles y el nivel de contaminación ambiental. se puede considerar la siguiente tabla que se refiere a la variable independiente (llamadas) y número de unidades de producto vendidas variable dependiente (ventas) Vendedores A B C D E F G H I J Llamadas 25 45 20 40 10 10 20 20 30 30 Unidades vendidas 35 65 40 60 35 60 50 40 40 60 DIAGRAMA DE DISPERSIÓN DATOS DE LA TABLA ANTERIOR . Considérense los siguiente ejemplos: En una fábrica se sabe que hay una relación entre la tecnología y la productividad. la variable X que es conocida y la variable Y desconocida. Esta es una relación inversa. en este sentido se habla de una relación en donde la variable independiente crece mientras que la variable dependiente disminuye. 4. En este campo se puede figurar la tendencia de una recta o una tendencia diferente o sea curva. Diagrama de dispersión.3. Nótese que en estos ejemplos que hay un incremento en la variable independiente que provoca un incremento en la variable dependiente por lo tanto. Como ejemplo de este subtema. se definirá y describirá que el análisis de regresión y correlación lineal corresponde a una relación asociada que existe entre dos variables que como se ha señalado antes. Cuando se habla por ejemplo de la competencia. el PIB (producto interno bruto) y el consumo total. Un diagrama de dispersión es un gráfico por puntos que son pares de los cuales el primero se refiere a lo que se conoce como variable independiente y el segundo que es la variable dependiente. si uno de los dos mejora e incrementa su producción puede ser que vende más que el otro. pero no se puede aventurar y decir que la relación es la ideal.75 70 60 50 40 Series1 30 20 10 0 0 10 20 30 40 50 Series2 Los datos observados de la tabla y gráfica. La línea de regresión se representa mediante una recta en la gráfica siguiente . sin embargo como se observa el vendedor F que sólo hizo 10 llamadas pudo vender más que el vendedor C. es decir perfecta. dan la idea de la relación entre el número de llamadas y las ventas del producto. lo que indica que los vendedores que más llamadas hicieron pudieron vender más unidades. Y = a + bX De la cual se explica lo siguiente: (fórmula) a=intersección de la recta con el eje vertical (y) b=pendiente de la recta . cuyo símbolo es Y. Determinación de “Y estimada” mediante ajuste de mínimos cuadrados.5. La ecuación de regresión expresa la relación lineal entre dos variables y recibe el nombre de “Y estimada”. Así se determina la ecuación para la estimación de la variable dependiente Y.4. 4. Representación gráfica de los tipos de relación: lineal y curvilínea.76 70 60 50 40 Series1 30 20 10 0 0 10 20 30 40 50 Series2 4. 77 X=variable independiente Estimación mediante la línea de regresión, en los diagramas visualmente se observa que la línea se coloca al ajustar los puntos de datos. La línea de regresión es una ecuación y esta dada por y = a +bx. Con esta ecuación, se puede tomar cierto valor de la variable x –independiente--, para calcular el valor de y la letra a representa la “intersección y” Por ejemplo, considere que a = 3 y b = 2, el valor de y cuando x = 7, por lo que sustituyendo los valores en la ecuación se tiene: Y = 5 + 2(7) = 5 + 14 = 19 Ahora véase como se obtiene el valor de la pendiente b, a través de una representación en el gráfico suponiendo los siguientes puntos: Primer punto: (x1,y1) = 4,5 y (x2,y2) = 5,7. Entonces se tiene que el valor de b esta dado por: (x2,y2) segundo punto (x1,y1) primer punto =3 Sustituyendo b = y2 – y1 = 7 - 5 x2 – x1 5-4 =2 1 = 2 Ahora aplicando la ecuación mediante el uso del método de mínimos cuadrados, para la “ y estimada” que se simboliza: Y=variable dependiente “ye estimada”. Ahora se procede a estimar los valores de a (intersección) y b (pendiente) Para ello es práctico suponer un ejercicio para el uso de la ecuación de la estimación mediante este método. 78 Ejemplos hipotéticos: (ejemplo 1) El Gerente de administración de una empresa necesita estimar lo que le implicará gastar para la reparación de su equipo de transporte. Suponiendo que cuenta con una camioneta de lujo con una antigüedad de 3 años. En otras palabras el gerente tiene interés en conocer la relación que existe entre la antigüedad y el gasto que se tiene que hacer en reparación. Para ello, se ha concentrado información considerable sobre cuatro camionetas de las mismas características que posee la empresa La solución se determina de la siguiente manera: Primeramente se tiene que organizar los datos requeridos para calcular la línea de regresión. Ordenar a continuación dichos datos: GASTOS ANUALES DE REPARACIÓN DE VEHÍCULOS. Cuadro 1 No.de unidad Edad de Cada unidad (X) Gastos de reparación durante el último año (Y) 1 2 3 4 6 4 4 2 7 8 6 5 Obtener los valores de XY, X2, Y2 Cuadro 2 Unidad 1 2 3 4 4 X2 36 16 16 4 72 Y2 49 64 36 25 174 Edad (x) 6 4 4 2 16 Gastos (y) 7 8 6 5 26 XY 42 32 24 10 108 Con los datos de los cuadros 1 y 2 se puede determinar la ecuación, para estimar los valores de “y” cuando X=7 y X=8 años respectivamente. Estableciendo el criterio a aplicar se tienen que desarrollar: 79 X = 4, Y = 6.5 (ecuación 1) b =ΣXY- nXY ΣX2 –nX2 a= Y –bX ý = a + bx (ecuación 2) (ecuación 3) Sustituyendo las ecuaciones propuestas, se tiene: b = 108 – 4(4)(6.5)/72-4(16) = .5 a= 6.5 – 0.5(4) = 6.5 – 2. = 4.5 Cuando X = 7, “ye estimadada” es: ý = 4.5 + .5(7) = 4.5 + 3.5 = 8 1 camioneta con antigüedad de 7 años, hará un gasto de 8 mil pesos. Cuando X = 8 “ye estimada” es: Ý = 4.5 + .5(8) = 4.5 + 4 = 9.5 camioneta con antigüedad de 8 años, se hará un gasto de 9 mil pesos. (Ejemplo 2) La siguiente muestra de observaciones se tomó aleatoriamente. (Cuadro 3) Variables X 4 5 3 6 Y 4 6 5 7 (Cuadro 4) X 4 5 3 6 10 Σx 28 X2 16 25 9 36 100 Σx2 186 10 7 Y2 16 36 25 49 49 Σy2 175 Y 4 6 5 7 7 Σy 29 XY 16 30 15 42 70 Σxy 173 Con los puntos tomados del cuadro 4, se puede determinar la ecuación, para estimar los valores de “y” cuando X=7 cuyos datos fueron registrados como se indica en el siguiente cuadro: (Cuadro 5) Empleado 1 2 3 4 5 Calif. 2 y 3 4. = a + bx están registrados en el siguiente cuadro: (Cuadro 6) Empleado 1 2 3 4 5 Σx X2 Y2 Calif. por lo que analiza comparativamente una muestra aleatoria de 5 empleados de una línea de producción con su rendimiento por hora (productividad). Prueba de destreza (x) 11 13 15 16 11 Unidades producidas por hora (y) 57 65 69 70 52 Ahora. para calcular el error estándar atreves de: . En razón de ello.6 Error estándar de la estimación El propósito de esta medición constituye el desarrollo de intervalos para mejor confianza de la variable predicta (dependiente). x 11 13 15 16 11 Productividad xy por hora 57 65 69 70 52 Σy Σxy Σx2 Σy2 Aplicar las fórmulas matemáticas: 1. los cálculos que se tienen que realizar para calcular la pendiente y el punto de intersección de y de la ecuación correspondiente. es decir.80 (Ejemplo 3) El departamento de Recursos Humanos de una empresa importante desea conocer la relación de calificaciones de pruebas y la destreza en la productividad. Retomando el caso del cuadro 2. desviación estándar que se refiere a la forma de dispersión de los pares de puntos que se localizan arriba y debajo de la de la línea de regresión. se deberá primeramente conocer o determinar atreves de ecuación matemática el error estándar de la estimación el cual se identifica por: (Se). 6 Se = 1.7 y 9.5 ) ( -0.26.82) ( 1.25 0.26.7 Asi se tiene una confianza de más de 68% que el monto de gasto de una camioneta con 7 años de antigüedad estará ente 6.26. se puede observar el grado de dispersión de los valores dados por cada par de datos (variable independiente y variable dependiente).5 5.26 ( error estándar ) Estimación de intervalo para la “ye estimada”. 1.25 2.2 4–2 = 3. . se utilizará la tabla de valores de “t”.26= 6.26 = 9.5+3.82 6.25 2 ∑(y .26 8 – 1.26 límite superior límite inferior 8+1.1 Comentario sobre la interpretación del error estándar de la estimación.00 Desarrollando la ecuación 4: Se = 3. cuando se aplica por ejemplo.81 Se = (Y . 2 = 1. = 4. En un diagrama de dispersión.6.0. = 8±1.25 0.5 + 0. 4. Ý= 4. Como se trata de muestras pequeñas.5(7)± 1. se tiene la estimación de los límites superior e inferior.5 ) ( -0.5 6.) 2 n–2 (Ecuación 4) (Cuadro 7) X 6 4 4 2 y 7 8 6 5 ý 7. en donde existe una línea recta de “ye estimada” y trazando líneas por encima y de debajo de la recta de “ye estimada”. Desarrollando la siguiente expresión matemática: Ý= a + bx± “t”Se (Ecuación 5) Sustituyendo la ecuación.ý) 3.18 ) ( y – ý )2 0. Con un nivel de confianza de más de 95% el intervalo se obtiene con un ±2 Se.5±(1)1.18 ( y – ý) ( . y 3 errores estándares de niveles de confianza más de 68%.82 2. 95% y 99% respectivamente. .
Copyright © 2024 DOKUMEN.SITE Inc.