Unidad 1 Introducción a La Estadística Inferencial

Unidad 1 Introducción a la estadística inferencial.1.1 Breve historia de la estadística. 1.2 Concepto de estadística. 1.3 Estadística descriptiva. 1.4 Estadística inferencial. 1.5 Breve introducción a la inferencia estadística. 1.6 Teoría de decisión en estadística. 1.7 Componentes de una investigación estadística. 1.8 Recolección de datos. 1.9 Estadística parametrica (población y muestra aleatoria). 1.10 Aplicaciones. Unidad 2 Inferencia estadística: estimación. 2.1 Conceptos básicos Inferencia estadística . 2.2 Distribuciones de muestreo. 2.3 Estimación puntual. 2.4 Estimación de intervalo. 2.5 Intervalos de confianza para medias. 2.6 Intervalos de confianza para diferencia entre medias. 2.7 Intervalos de confianza para proporciones. 2.8 Intervalos de confianza para diferencias entre proporciones. 2.9 Intervalos de confianza para varianzas. 2.10 Intervalos de confianza para razones de dos varianzas. Unidad 3 Pruebas de hipótesis con una muestra. 3.1 Metodología para la prueba de hipótesis. 3.2 Hipótesis nula y alternativa. 3.3 Error tipo I y error tipo II. 3.4 Pruebas de hipótesis Z para la media (desviación estándar poblacional conocida). 3.5 Pruebas para proporciones. 3.6 Selección del tamaño de muestra para estimar la media poblacional. 3.7 Selección del tamaño de muestra para estimar la proporción poblacional. Unidad 4 Pruebas de hipótesis con dos muestras datos numericos y varias muestras de datos numéricos. 4.1 Introducción Pruebas de hipótesis. 4.2 Distribucion normal y Distribucion t de Student. 4.3 Pruebas de significancia. 4.4 Comparación de dos muestras independientes: Pruebas t para las diferencias entre dos medias. 4.5 Prueba de Fisher para varianzas y de igualdad de las varianzas de dos poblaciones normales. 4.6 Comparaciones de dos muestras pareadas 4.7 Modelo totalmente aleatorio: análisis de varianza de un factor. 4.8 Selección del tamaño de muestra para estimar la diferencia de dos medias. 4.9 Aplicaciones. Unidad 5 Pruebas de hipótesis con dos muestras datos categoricos y varias muestras con datos categóricos. 5.1 Prueba Z para la diferencia entre dos proporciones. 5.2 Prueba para la diferencia entre dos proporciones. 5.3 Prueba para la diferencia en n proporciones Z. 5.4 Prueba de independencia (ji-cuadrada). 5.5 Pruebas de contingencia (ji-cuadrada). 5.6 Pruebas de bondad de ajuste. 5.7 Aplicaciones. INTRODUCCIÓN En la antigüedad el hombre registraba las muertes y nacimientos en una roca que se ubicaba en la entrada de la parroquia puesto que ellos tenían la necesidad de contar a sus habitantes tanto vivos como muertos, la estadística surgió como la necesidad de registrar eventos y tal vez no con el nombre de estadística pero siempre ha existido y ahora gracias a que los científicos se han preocupado en definir a la estadística sabemos que ahora se divide en estadística descriptiva e inferencial. En esta investigación se hablara de la estadística abarcando desde sus antecedentes históricos hasta sus métodos de empleo, también se definirá la estadística descriptiva e inferencial describiendo a cada una de ellas de tal modo de que se estructuren parte de los principios básicos de la estadística. 1.1 BREVE HISTORIA DE LA ESTADÍSTICA. La recopilación sistemática de datos económicos y de población se inició en Venecia y Florencia, durante el renacimiento. El término estadística, derivado de lapalabra estado, se utilizó entonces para referirse a la obtención de datos de interés estatal. Esta idea de recopilación de datos se extendió desde Italia a otros países de la Europa occidental. Durante la primera mitad del siglo XVI, era habitual que los gobiernos europeos obligaran a las parroquias a que registraran los nacimientos, los matrimonios y las defunciones. Debido a las muy escasas condiciones de salud pública, las estadísticas referidas a estos hechos tenían un especial interés. Las altas tasas de mortalidad en Europa antes del siglo XIX se debieron primordialmente a epidemias, guerras y hambruna. Frecuentemente, sucedieron plagas en aproximadamente 400 años. En 1562, como forma de conseguir que la corte real se trasladara al campo, la ciudad de Londres comenzó a publicar los datos de mortalidad. Inicialmente esos datos listaban los lugares de defunción y si las muertes habían sido causadas por dicha plaga. Desde 1625, esta información se extendió a todas las causas de defunción. 1.2 CONCEPTO DE ESTADÍSTICA. Es la ciencia de las matemáticas que se encarga de la selección, recolección, tabulación, presentación y análisis de la información que se utiliza en la toma de decisiones organizacionales. 1.3 ESTADÍSTICA DESCRIPTIVA. La estadística descriptiva es el conjunto de técnicas para analizar, describir e interpretar los datos recolectados sobre un fenómeno de interés, con el fin de tomar decisiones, obtener conclusiones o plantear hipótesis. Para seleccionar mejor la técnica adecuada de la estadística, resulta necesario clasificar las variables en dos tipos: escalares y categóricas. Algunos términos muy utilizados enla estadística descriptiva son: * POBLACIÓN: Se concibe como el conjunto total de elementos, datos, personas, atributos, medidas, acontecimientos u objetos, que poseen una o más características comunes y cuyas propiedades serán analizadas. La población puede ser: a. POBLACIÓN FINITA: Cuando es posible enumerar físicamente todos los elementos que pertenecen a la población. b. POBLACIÓN INFINITA: Cuando es imposible enumerar físicamente todos los elementos que pertenecen a una población. * MUESTRA: es un subconjunto de la población, que se selecciona siguiendo ciertos procedimientos estadísticos, que se llama teoría de muestreo. * PARÁMETRO: Valor numérico que resume todos los datos de una población completa para determinar su valor es necesario utilizar la información poblacional completa. * ESTADÍSTICO: Es un valor numérico que resume todos los datos de una muestra y sirve como estimación del parámetro de la población. * VARIABLE: Es una característica, atributo o medida que se está analizando en el estudio estadístico. La variable puede ser: 1. VARIABLE CUALITATIVA: Clasifica o describe un atributo o cualidad de los elementos de la población o muestra (atributos). 2. VARIABLE CUANTITATIVA: Los datos recolectados cuantifican un elemento de la población o muestra. La variable cuantitativa puede ser: a) VARIABLE CUANTITATIVA DISCRETA: Cuando los valores que toma la variable son enteros que no se pueden partir. b) VARIABLE CUANTITATIVA CONTINUA: Cuando los valores que toma la variable se pueden partir. * DATOS: Conjunto de valores recolectados para la variable. * DATO: Valorde la variable asociado a un elemento de una población muestra. * EXPERIMENTO: Actividad planeada, cuyos resultados producen un conjunto de datos. * VARIABLE ALEATORIA: Una variable aleatoria (v. a) es una función que asigna a cada elemento de un espacio maestral un número real. Es decir, una variable es aleatoria si toma diferentes valores como resultado de un experimento aleatorio. 1.4 ESTADÍSTICA INFERENCIAL. Busca obtener conclusiones sólidas y más profundas, basado en el trabajo con muestras y su posterior generalización de resultados para la toma de decisiones y conclusiones sólidas. La estadística nos permite inducir conclusiones de situaciones, sucesos o fenómenos previamente estudiados. 1.5 BREVE INTRODUCCIÓN A LA INFERENCIA ESTADÍSTICA. La inferencia estadística es una ciencia sobre la cual se apoya una gran variedad de disciplinas, desde la medicina y la astronomía hasta la sociología y la biología. En lo que atañe a los fenómenos industriales y organizacionales es una excelente herramienta para dos actividades fundamentales: 1. Predecir; lo que se traduce en una planeación de mayor precisión y exactitud, y por lo tanto, en una asignación de recursos lo más adecuada posible a las necesidades del horizonte de planeación es la cuantificación de los riesgos inherentes a los errores de predicción. 2. Controlar; lo que significa una evaluación permanente, que deberá conducir a una retroalimentación y a una mejora de los métodos de trabajo, en busca del perfeccionamiento. 1.6 TEORÍA DE DECISIÓN EN ESTADÍSTICA. La estimación óptima de procesos aleatorios está basada en la teoría de decisión estadística, en lamedida en que la información extraída del proceso aleatorio se emplea para la obtención de algún objetivo de análisis, cuyo resultado es una decisión. Aunque la variedad de tareas, en las cuales se hace necesaria la toma de decisión, es amplia se tiene una formulación matemática con las siguientes propiedades: a) Cualquier solución está orientada a la obtención de un objeto concreto, que bien puede estar definido por una cantidad, finita o infinita, de variantes con sus respectivas bondades y restricciones, sobre las cuales se estima la calidad de la decisión a tomar. b) La decisión se toma, basados tanto en la información como en la evidencia estadística a priori y obtenido durante el proceso de solución. c) La toma de decisión dentro de un conjunto de posibles variantes puede contemplar la incertidumbre, determinada por la respectiva probabilidad de toma de cada decisión. La decisión seleccionada dentro de todas las posibles variantes, que brinde la mayor bondad de solución de acuerdo a un objetivo propuesto, se denomina óptima. 1.7 COMPONENTES DE UNA INVESTIGACIÓN ESTADÍSTICA. Se requiere una investigación de carácter estadístico cuando no se tiene un buen flujo de información que permita que las observaciones se organicen y condensen ya que por lo general, se encuentran dispersas, y en forma desordenada. Las siguientes se pueden considerar clases de operaciones o etapas en una investigación: PLANTEAMIENTO: Al trazar un plan de investigación, se debe definir y organizar cada una de las actividades necesarias para llevar a cabo el trabajo y poder alcanzar los objetivos propuestos. Dentro de la etapa deplanteamiento se podrán considerar ciertos aspectos que a continuación se presentan donde el orden y la necesidad de cada uno de ellos dependerá de la misma naturaleza de la investigación. * OBJETO DE LA INVESTIGACIÓN Antes de iniciar cualquier proceso de investigación, se hace indispensable identificar con claridad y precisión el fin que se propone, formulando el problema en tal forma que nos permita identificar los objetivos generales y los específicos y, de ser posible, una jerarquización de los mismos * UNIDAD DE INVESTIGACIÓN La unidad es la fuente de información, es decir, a quien va dirigida la investigación, la cual puede ser una persona, una familia, una vivienda, un establecimiento comercial, industrial o de servicio público, una explotación agrícola o ganadera, y si determinación depende del objeto de la investigación. La unidad debe ser clara, en tal forma que sea entendida por todos; además, adecuada al tipo de investigación; mensurable, que permita ser medida, y comparable con los resultados obtenidos en investigaciones similares. Al lado del elemento principal que posee la información, se presenta con mucha frecuencia, la necesidad de establecer otras unidades denominadas secundarias, cuando se aplica al muestreo aleatorio por etapas. * CLASE DE ESTUDIO En primer lugar hay que determinar qué tipo de investigación se va a realizar: a) Investigación descriptiva b) Investigación experimental o investigación controlada c) Investigación explicada o analítica La distinción entre la investigación descriptiva y la analítica, en algunos casos no es muy clara. Se dice que la primera consiste en obtener informacióncon respecto a grupos, en cambio en la analítica permite establecer ciertas comparaciones es una situación provocada por el investigador, en condiciones controladas, cuya finalidad es conocer por que causa se produce un caso particular. * EXAMEN DE LA DOCUMENTACIÓN Y METODOLOGÍA Es importante determinar si la investigación ha sido realizada con anterioridad, con el fin de prescindir del estudio; averiguar si se cumplió el objetivo propuesto y si la información está actualizada. En caso contrario, habrá necesidad de realizarla, tratando de solucionar las dificultades que se presentaron en la anterior, en razón a un mayor conocimiento sobre la población objetivo y, además, procurando un mejoramiento en la metodología utilizada. * MÉTODO DE OBSERVACIÓN Una vez planteado el objetivo de la investigación, definida la unidad o unidades, y determinando que el estudio no fue realizado con anterioridad, o que los datos que se tienen requieren de su actualización, se debe decidir, el método que se empleara, es decir, si se va a estudiar a la población en su totalidad o solo una parte de ella. * MUESTREO El muestreo es utilizado por su menor costo, mayor rapidez y menor número de personas que intervienen en la investigación. Generalmente hay más de un método de muestreo, para su selección se podrán determinar algunos aspectos: a) Grado de precisión requerida para los estimadores b) Tamaño de muestra c) Costo y tiempo * MUESTREO PROBABILÍSTICO Dentro del método de muestreo probabilístico, muestreo aleatorio o al azar, se usan entre otros, los siguientes tres procedimientos: a) Muestreo aleatorio simple: estemétodo permite que la selección de todos los elementos que constituyen la población tengan la misma posibilidad de ser incluidos en la muestra. b) Muestreo aleatorio estratificado: es aquel donde la población se estratifica, es decir, se forman grupos o estratos, de tal forma que el elemento tendrá una característica que solo le permitirá pertenecer al mismo. c) Muestreo sistemático: este método de selección es utilizado por algunos contadores para revisar sumas, cuentas, etc., y consiste en determinar, en primer lugar, un intervalo igual al valor obtenido al dividir el tamaño de la población por el de la muestra. Luego se toma aleatoriamente una observación. Supongamos que entre el 01 y 10 se seleccionó la observación 6 y como el intervalo es 10, la segunda observación será 16, luego 26, y así sucesivamente * MUESTREO NO PROBABILÍSTICO En el muestreo no probabilístico se toman las muestras de cualquier tamaño y los elementos son seleccionados de acuerdo con la opinión o juicio que tenga el investigador sobre la población. En el caso de una población homogénea, la representatividad de tal muestra puede considerarse satisfactoria. * PROCESO DE RECOLECCIÓN Las encuestas se pueden realizar por correo, entrega personal del cuestionario, entrevista, panel, observación directa, motivación, teléfono, otros. Las encuestas por correo tienen algunas ventajas, tales como las de ser poco costosas, ya que el valor de recolección corresponde al valor del envió y retorno del cuestionario. La entrevista es un buen proceso de recolección, ya que permite recoger el mayor número de cuestionarios, se obtiene respuestas a todas laspreguntas, se aclaran las dudas del informante, se pueden hacer comprobaciones; pero su desventaja radica en el mayor costo, ya que requiere de más tiempo y de más recursos humanos. Además, las respuestas pueden estar influenciadas por el entrevistador. * PREPARACIÓN DEL PRESUPUESTO Una vez establecidos algunos de los aspectos técnicos, se determina si se cuenta con los suficientes recursos financieros que permitan la realización completa de la investigación. En la elaboración del presupuesto deben tenerse en cuenta las diferentes etapas de la investigación. Los siguientes puntos son básicos que se deben tener en cuenta al elaborar el presupuesto: Organización: | * Estudios preliminares * Asesorías * Trabajos experimentales * Trabajos geográficos * Propaganda | * impresión de los formularios * Capacitación de personal * Contratación de servicios auxiliares * Uso de equipo, computadoras, papelería, etc. * Locales. | * CALENDARIO DE TRABAJO Se trata de un ordenamiento de las diferentes etapas involucradas en la investigación, con las correspondientes fechas de iniciación y terminación, con el fin de controlar cada fase, procurando que se cumpla dentro del tiempo establecido. También es una forma de determinar el tiempo de la investigación. * PREPARACIÓN DEL CUESTIONARIO Aspectos materiales: * Tamaño del formulario, procurando que no sea demasiado grande que dificulte su manejo y archivo. * La calidad del papel dependerá de las veces que se ira a utilizar, en el proceso de recolección, del tipo de impresión y otros aspectos. * El color de la tinta y del papel no debe molestar la vistade la persona que lo va a diligenciar, criticar o codificar. * Tipo de impresión a emplear Aspectos técnicos * Incluir únicamente las preguntas indispensables. * Las preguntas deben ser claras, concisas y comprensibles para quien las hace y para quien las responda. * Las preguntas deben ordenarse, comenzando con las fáciles y terminando con las más difíciles. * No se deben emplear abreviaturas. * Se deben suprimir las preguntas que, de antemano, se considera no van a ser contestadas. * La pregunta debe ser de tal claridad que, siendo formulada en lenguaje corriente, atienda a la técnica de investigación. 1.8 RECOLECCIÓN DE DATOS. Termina la etapa de planteamiento, se procede a distribuir y a recoger los formularios, controlando el número de formularios entregados y recogidos y, al mismo tiempo, verificando la calidad de las informaciones obtenidas. La organización del trabajo de campo o de recolección contempla, entre otros, los siguientes puntos: * Supervisión * Control de encuestas * Revisión de los cuestionarios inconclusos * Calidad y consistencia de las respuestas * Cumplimiento de los plazos prefijados * Distribución de los entrevistadores Algunos de los errores que se pueden presentar en la recolección de datos se clasifican en: * Errores en la medición o cuantificación de las características. * Errores del entrevistador o influencia negativa del mismo. * Mal diseño del cuestionario * Falta de instrucciones o imprecisas. PROCESAMIENTO Y ANÁLISIS: La información obtenida debe ser depurada, clasificada, resumida y analizada, aplicando para elloadecuadas técnicas. Los puntos más importantes en esta etapa son: * CODIFICACIÓN: Cumplido el proceso de revisión de cada una de las respuestas obtenidas, se procede a la codificación de las mismas, especialmente cuando se va a sistematizar. Aquellos formularios donde la mayor parte de las preguntas son cerradas, pueden ser pre codificados, es decir, cada respuesta posible tiene el código impreso en el formulario. * TABULACIÓN: Puede ser manual, sistematizada o computarizada y su selección dependerá: * De la cantidad de formularios que se van a utilizar. * Del número de preguntas que tenga el formulario * Del tiempo y de los recursos, ya sea financieros o de equipos, disponibles. Cuando la tabulación se acuerda desde el principio, como parte íntegramente de la planeación general de la investigación, es de suponer que todo el proceso sea totalmente satisfactorio. * ANÁLISIS E INTERPRETACIÓN: Esta etapa se puede considerar como la más importante del informe, ya que el análisis de los datos tendrá que ver con la formulación del objetivo mismo de la investigación y de las hipótesis establecidas. * INFORME: Finalmente, se llega a la etapa de elaboración del informe, ya sea para uso interno de la empresa o para terceros. La redacción y entrega del informe final, corresponde a la última etapa de la investigación y a la culminación de los trabajos que la misma causo. A pesar de que el informe constituye un todo indivisible, podemos considerar tres partes perfectamente identificables: introducción, conclusiones y apéndices. * PUBLICACIÓN: Corresponde a la fase final de la investigación, y con ella se proponehacer llegar a las personas interesadas el resultado del estudio, teniendo en cuenta todos los aspectos considerados en el proceso, de tal forma que los datos sean comprensibles, con la correspondiente validez de las conclusiones. 1.9 ESTADÍSTICA PARAMÉTRICA (POBLACIÓN Y MUESTRA ALEATORIA). La estadística paramétrica es una rama de la estadística inferencial que comprende los procedimientos estadísticos y de decisión que están basados en las distribuciones de los datos reales. Estas son determinadas usando un número finito de parámetros. Esto es, por ejemplo, si conocemos que la altura de las personas sigue una distribución normal, pero desconocemos cuál es la media y la desviación de dicha normal. La media y la desviación típica de la desviación normal son los dos parámetros que queremos estimar. Cuando desconocemos totalmente que distribución siguen nuestros datos entonces deberemos aplicar primero un test no paramétrico, que nos ayude a conocer primero la distribución. La mayoría de procedimientos paramétricos requiere conocer la forma de distribución para las mediciones resultantes de la población estudiada. Para la inferencia paramétrica es requerida como mínimo una escala de intervalo, esto quiere decir que nuestros datos deben tener un orden y una numeración del intervalo. BIBLIOGRAFÍA * Estadística básica – Ciro Martínez Bencardino (2008) * Estadística básica – Adriana Guerrero * Introducción a la estadística – Sheldon M. Ross * Introducción a la inferencia estadística – William C. Guenthen * Fundamentos de inferencia estadística - Jorge Andrés Alvarado Valencia * http://es.wikipedia.org

Unidad 1 Introducción a La Estadística Inferencial

Comments

Description