estadistica para la toma decisiones.pdf

ESTADISTICA PARA LA TOMA DE DECISIONES.40 30 Porcentaje 20 10 0 Bajo Intermedio Alto Hábito de estudio Dr. CLETO DE LA TORRE DUEÑAS [email protected] 2011 1 1RA EDICION Hecho el Depósito Legal en la Biblioteca Nacional del Perú REGISTRO Nº : 2009-09684 Todos los derechos reservados. Prohibida la reproducción total o parcial de este libro en forma idéntica o modificada por cualquier medio mecánico o electrónico, incluyendo fotocopia, grabación o cualquier sistema de almacenamiento y recuperación de información no autorizada por el autor. Impreso en Perú, 2009. 2 CAPITULO I INVESTIGACION CIENTIFICA. 1.1 INVESTIGACIÓN CIENTÍFICA La investigación científica, se puede entender como un conjunto de actividades que realizamos para obtener conocimientos nuevos, sobre problemas nuevos que afectan la realidad, pero que sean nuevos, respecto a la ciencia, es decir, respecto al conjunto de conocimientos ya provisionalmente establecidos y sistematizados por la humanidad, conocimientos nuevos que, como aportes, se sumarán a la Ciencia. ¿Qué es investigar? Investigar viene del latín investigare.  Es la forma más adecuada de aproximarse al conocimiento de la verdad mediante verdades parciales.  Desarrollar actividades con el objetivo de registrar, indagar o descubrir la verdad.  En términos generales, es agregar algo nuevo a los conocimientos humanos.  Es un proceso que, mediante la aplicación del método científico, procura obtener información relevante y fidedigna. corregir o aplicar el conocimiento De entender, verificar, 3 EL PROCESO DE INVESTIGACIÓN INTERROGANTES PARA EL PROCESO: DISEÑO ¿Qué estudiar? Cuál es la situación actual? Selección del tema. Planteamiento del problema ¿Cuáles son las preguntas de Formulación del problema investigación respondidas? ¿Qué propósitos tiene la Objetivos. que deben ser investigación que se plantea? ¿Cuáles son los motivos para Justificación. hacer el estudio propuesto? ¿Quiénes anteriormente planteado? ¿Qué hay escrito al respecto? ¿Qué se pretender probar? ¿Cómo se va a realizar la Marco Teórico. Hipótesis. Metodología. han sobre investigado Marco Histórico el tema investigación? ¿Cuánto tiempo se requiere para el estudio propuesto? ¿Qué recursos se necesitan? ¿A que fuentes escritas se va a referir el investigador? Presupuesto. Bibliografía. Programación INTERROGANTES PARA EL PROCESO: DESARROLLO ¿Qué tipo de información se Identificación de información. necesita para cumplir los objetivos, responder la pregunta (s) de 4 representa la realidad. el modelo. de fuentes de Si utilizo fuentes primarias. ¿Cómo se utiliza la información Elaboración procesada y ordenada? información. etc. el paradigma. obtenida? ordenamiento información. es la práctica.  Lo que ES. y análisis de la ¿Cómo se puede presentar el Presentación de los resultados de informe de los resultados del la investigación. estudiar CRITERIOS BASICOS PARA IDENTIFICAR PROBLEMAS.investigación hipótesis? y verificar las ¿Dónde encuentro la información? Definición información. procesamiento de y la ¿Cómo organizar la información Tabulación. ¿a Determinación de la muestra cuántas personas debo requerir para obtener información? ¿De qué forma puedo obtener la Técnicas información? de recolección: Observación. el ideal.  DEBERÍA SER diferente a ES. encuesta. difiere de lo que ES. el patrón comparativo.2 PROBLEMA DE INVESTIGACIÓN Es un hecho. análisis? 1. entonces existe Problema 5 .  De manera general se considera que hay un problema cuando lo que DEBERÍA SER.  El DEBERÍA SER. es el marco referencial. fenómeno o situación que incita a la reflexión o al estudio y es importante puesto que permite conocer la situación que se va a mostrando sus principales rasgos. Determinación de Necesidades Educativas COMPORTAMIENTO REAL COMPORTAMIENTO DESEADO DISCREPANCIA LO QUE ES LO QUE DEBE SER NECESIDAD EDUCATIVA SITUACIÓN PROBLEMÁTICA 6 . PROBLEMA DE INVESTIGACION.  El control del pronóstico es la serie de acciones para superar las consecuencias de los problemas.  Formulación del problema Aspectos a integrar en la conceptualización y en la definición de un problema de investigación.  El diagnóstico es la descripción de los síntomas o problemas.  El pronóstico es la serie consecuencias de los problemas. el pronóstico. el control del pronóstico y la formulación de la pregunta o preguntas o la redacción de un texto a manera de pregunta. Para la presentación del POI. Pensar en: Qué se investigará? Quiénes participarán Elementos del enunciado: Variable/s Sujetos a estudiar 7 . es necesario considerar cuatro momentos: el diagnóstico. función. nivel. incidencia. instituciones. la población o muestra a la que se refiere la investigación.  Tiempo Está referido al momento en que ocurre el hecho o situación problemática. características.  La especificidad Es el aspecto o los aspectos concretos que se quiere investigar acerca del hecho o situación problemática. acontecimientos. evolución. desempeño profesional. tendencia. prevalencia. etc. procesos. implicancias. consecuencias. modalidades. desde el punto de vista estadístico. importancia. seres. Son aquella en las se ponen de manifiesto los hechos o situaciones problemáticas y constituyen. ELEMENTOS DE DEL TITULO DE UN PROBLEMA Especificidad Situación problemática Unidad de estudio Espacio Tiempo  Situación problemática Responde a la pregunta ¿Qué investigar? Por ejemplo: Rendimiento académico.  Unidades de estudio. Por ejemplo: causas. gestión educativa. Ciudad del Cusco. estructura. Aceros Arequipa. etc. Zona Franca. relación. Perú. influencia.Qué estrategia se seguirá? Dónde se realizará? Cuándo se realizará? Diseño Ámbito de estudio Período de Tiempo. ¿Dónde?... grupos  Espacio Esta referido al lugar en el que ocurre el hecho o situación problemática. Son: Personas. objetos. 8 . Puede ser geográfico o administrativo. ¿Cuándo? sociales. etc.  Estar expresados en verbos en infinitivo (determinar. Son enunciados desagregados del objetivo general orientados al logro de propósitos concretos y están en relación a lo que aspira alcanzar con el estudio. Ejemplo 1: Reforzar la capacidad de gestión en los centros de educación inicial del país para la atención de los dominios del aprendizaje de los niños de 4 y 5 años de edad. Expresa el cambio requerido Conjunto de actividades que se desarrollan.  Los objetivos deben ser verificables  Al definir los objetivos. diagnosticar.1. explicar. Los objetivos específicos (plural). refutar. evaluar. Elementos a tomar en cuenta para redactar un objetivo Sujeto Contenido Acción Elemento de estudio. analizar.  Los objetivos son de dos tipos: El objetivo general (singular). Los Objetivos Específicos. Es un enunciado proposicional integral y un Logro terminal a alcanzar en la investigación. comprobar.3 FORMULACION DE OBJETIVOS Son los propósitos o fines que se pretenden lograr al realizar la investigación. debemos pensar inmediatamente en la manera de verificar si éstos se han cumplido o no (pensar en métodos o herramientas para ello)  Lo anterior nos permitirá ir dibujando el perfil metodológico de nuestra investigación  Los objetivos se convierten así en la carta de navegación de la investigación a realizar  Los objetivos deben ser precisos y no muy ambiciosos: deben ser acordes con los recursos disponibles (tiempo) y ello delimitará el nivel de detalle esperable. 9 . identificar.) conocer. 10 . enfoque teóricos.4 JUSTIFICACION Y DELIMITACION DE LA INVESTIGACIÓN Criterios de justificación. estudios y antecedentes en general que se refieran al problema de investigación. conduce a dar respuesta al problema? ¿Se conoce y se domina la metodología seleccionada? ¿Hay problemas ético morales en el desarrollo? 1. Contenido: La atención de los dominios del aprendizaje.5 MARCO TEORICO En el marco teórico se integra con las teorías. obtener y consultar la literatura y otros documentos pertinentes para el problema de investigación. Originalidad Relevancia Interés Factibilidad Criterios para delimitar Espacial . Sujeto : Niños de 4 a 5 años de edad 1.Geográfica Cronológica VIABILIDAD: Es necesario plantearse las siguientes preguntas: ¿Se dispone de Recursos? ¿Es factible realizar en el tiempo previsto? ¿Es factible lograr la participación de los sujetos u objetos necesarios? ¿Es factible conducir el estudio con la metodología necesaria? ¿La metodología a seguir.Acción : Reforzar la capacidad de gestión en los centros de educación inicial del país. Para elaborar el marco teórico es necesario detectar. así como extraer y recopilar de ellos la información de interés.  La revisión de la literatura puede iniciarse manualmente o acudiendo a un banco de datos al que se tenga acceso por computadora.  Ampliar el horizonte del estudio y guiar al investigador. 1.  Orientar el estudio. explicarnos por qué se produce el fenómeno de estudio.  Proveer un marco de referencia para interpretar los resultados de estudio.  Implicar nuevas líneas y áreas de investigación.6 HIPOTESIS DE INVESTIGACION Afirmaciones o suposiciones que hace el investigador respecto al problema de investigación.  Delimitar el área de investigación. Es una suposición que permite establecer relaciones entre hechos. leyes referentes al estudio ¿Qué funciones cumple el marco teórico?  Sirve de guía al Investigador  Provee un marco para la interpretación de resultados  Prevenir errores.  Establecer los antecedentes del problema.  La construcción del marco teórico depende de lo que encontremos en la revisión de la literatura:  Marco Teórico: Fundamentación teórica dentro de la cual se enmarca la investigación  Marco Conceptual: Definición de conceptos relevantes utilizados en el estudio  Marco Normativo: Normas.  Fundamentar el contenido del problema. 11 . El valor de una hipótesis reside en su capacidad de establecer esas relaciones entre los hechos y de esa manera.  Facilitar la formulación de las hipótesis. 12 .  Los conceptos de las hipótesis deben ser claros y precisos. Se deben formular hipótesis que están relacionadas con técnicas disponibles para su verificación.  Deben ser de poder predictivo y explicativo. Las hipótesis en las ciencias sociales sólo pueden someterse a prueba en un universo y contexto bien definidos.  Tener fundamentación teórica.¿Qué Funciones cumple?  Direccionar el problema objeto de investigación  Identificar variables objeto de análisis  Orientar el uso de métodos y técnicas de obtención de información Elementos estructurales de la hipótesis 1. 2. Los elementos lógicos. 3.  Debe ser formulada en términos de relación o causalidad. instituciones. que puedan ser los individuos. En las hipótesis. las características o propiedades cualitativas o cuantitativas que presentan las unidades de análisis. viviendas. etc. los conceptos son las variables y las unidades de análisis.  Las variables y su relación. Variables.  Los conceptos de las hipótesis deben contar con realidades o referencias empíricas observables (verificables). precisos y concretos. Las unidades de análisis. son los que relacionan las unidades de análisis con las variables y estas entre sí. REQUISITOS PARA FORMULAR LA HIPÓTESIS  Debe referirse a hechos reales. grupos.  El planteamiento de las hipótesis deben prever las técnicas para probarlas. tienen que ser comprensibles. Requisitos para estructurar las hipótesis  Las hipótesis deben referirse sólo a un ámbito determinado de la realidad social. que con las dependiente. Ser lógica (L): La relación de las variables debe ser racionalmente pertinentes Debe tener poder explicativo. que pueden grupos. debe ser respuesta a su problema. Estar de acuerdo con las técnicas y recursos disponibles para probarlas. El nivel de una investigación viene dado por el grado de profundidad y alcance que se pretende con la misma 13 . Debe ser compatible con los conocimientos actuales (Teoría) Ser Contrastable (C) : Es decir. ser comprobable Necesita tener referencia empírica. Las Variables: Independiente y Los elementos lógicos. Debe ser operacional. ser individuos. ELEMENTOS ESTRUCTURALES DE LA HIPÓTESIS Las unidades de análisis:. relacionan las unidades de análisis variables y a estas entre sí.7 NIVELES DE INVESTIGACIÓN. instituciones y otros. capacidad de ser probada y verificada en los hechos. Fundamentarse en un cuerpo teórico. familias. 1.CARACTERÍSTICAS Ser específicas (E): Debe indicar un asunto concreto por investigar. 2010. Responde a las preguntas ¿Cómo son? ¿Cuántos son? ¿Dónde están? Se refiere a las características cualidades internas y externas. 2010. ¿Por qué? La finalidad es determinar por qué un hecho o fenómeno de la realidad tiene tales y cuales características. INVESTIGACIÓN EXPLICATIVA Orientada al descubrimiento de las causas o consecuencias o condicionantes de la situación problemática Está dirigida a responder a las causas de los eventos físicos o sociales y su interés se centra en explicar por qué y en qué condiciones ocurre un fenómeno.? Ejemplo 3: Principales causas de la deserción escolar en la región andina del Perú. propiedades y rasgos de la población de estudio Problema Pregunta ¿Cuál es grado de . Problema Pregunta ¿En que medida .? ¿Cómo influye. Ejemplo 4: Nivel de aplicación de metodologías de enseñanza por los profesores de las instituciones educativas A y B de Cusco.? ¿Qué nivel…? Ejemplo 2: Nivel de conocimiento de las estrategias cognitivas por los profesores. INVESTIGACIÓN COMPARATIVA Orientada al estudio de las semejanzas o diferencias de un hecho o situación problemática en dos circunstancias diferentes.... de la población de la ciudad de Cusco. 2011.INVESTIGACIÓN DESCRIPTIVA Orientada al descubrimiento de las propiedades particulares del hecho o situación problemática y también a la determinación de la frecuencia con que ocurre el hecho o situación problemática.. o por qué dos o más variables se relacionan... 14 .... Problema Pregunta ¿Es más eficaz ….? Ejemplo 7: Evaluación del efecto del uso de tres tipos de materiales didácticos en el rendimiento académico. 2011. INVESTIGACION BASICA. 2011. Ejemplo 6: Correlación entre hábitos de estudio y aprendizaje en los estudiantes de la Universidad de Nacional San Antonio Abad del Cusco. 15 ..E de la ciudad de Cusco. a continuación se refieren algunos de ellos.….. Solo busca aplicar y profundizar el conocimiento científico existente acerca de la realidad. 1. INVESTIGACIÓN CORRELACIONAL Orientada a descubrir la covariación o correspondencia entre los valores de dos hechos o situaciones problemáticas.. INVESTIGACIÓN EXPERIMENTAL Orientada a descubrir la validez de un hecho para la modificación de una situación problemática. Ejemplo 5: Influencia de la internet en la lectura de los estudiantes de secundaria de la Ciudad del Cusco.INVESTIGACIÓN RELACIONAL Orientada al descubrimiento de la influencia de un hecho o situación problemática en otro hecho o situación problemática.que……. 2011. ¿Qué cambios y modificaciones se han producido? ¿Qué mejoras se han logrado?.. en las I.8 TIPOS DE INVESTIGACION Los Tipos de investigación se determinan mediante la aplicación de distintos criterios. INVESTIGACION TECNOLOGICA. modificar o producir cambios en un determinado sector de la realidad.INVESTIGACION APLICADA. 2005). la profundidad así como también el éxito de los resultados de la investigación dependen de la elección adecuada del diseño de investigación. de los cuales debe elegirse uno o varios para llevar a cabo una investigación particular (Hernández.9 DISEÑOS DE INVESTIGACION. Se investiga para transformar. Fernández y Baptista.  El investigador debe seleccionar un diseño de investigación. se busca cambios mediante la aplicación de nuevos sistemas. su propósito es dar respuesta objetiva a interrogantes que se plantea en un determinado fragmento de la realidad y del conocimiento con el objeto de contribuir en la estructuración de las teorías científicas. Fernández y Baptista (2000). He aquí un esquema donde se resumen los diferentes tipos de investigación según Hernández. Se orienta a resolver problemas facticos. Castillo. ya que el diseño de investigación indica los pasos a seguir para alcanzar dichos objetivos.  Conjunto de estrategias procedimentales y metodológicas definidas y elaboradas para el desarrollo del proceso de investigación. Se relaciona esencial. existen diferentes tipos de diseños de investigación.  Las maneras de cómo conseguir respuesta a las interrogantes o hipótesis planteadas dependen de la investigación. objetiva y metodológicamente con el nivel experimental. Esto se refiere a la manera práctica y precisa que el investigador adopta para cumplir con los objetivos de su estudio. Por esto. Es necesario por tanto que previo a la selección del diseño de investigación se tengan claros los objetivos de la investigación.  El diseño de investigación puede ser pensado como la estructura de la Investigación.  La precisión. 1. 2000. INVESTIGACION SUSTANTIVA. 16 . Entendemos por diseños cuasi-experimentales cuando se cumplen las siguientes condiciones:  Los grupos sobre los que se lleva a cabo la investigación no han podido establecerse como equivalentes en las características fundamentales. de tal manera que se tiene un grupo control equivalente a los grupos experimentales. Los grupos no han sido asignados al azar. por procedimientos aleatorios y los grupos resultantes son equivalentes.“En los diseños cuasi-experimentales los sujetos no son asignados al azar a los grupos no emparejados.Diseños experimentales Son aquellos en los que se cumple que: Los grupos a ser investigados han sido asignados al azar.  Como dice Hernández et al. sino que han sido establecidos por algún otro procedimiento de muestreo. sino que dichos grupos ya estaban formados antes 17 . Diseños cuasi-experimentales. del experimento. 184) La diferencia con los diseños experimentales y cuasi. que manipula las variables independientes para averiguar su influencia en las variables dependientes. Diseños transversales correlacionales: Se encargan de describir relaciones entre dos o más variables en un momento determinado. para después analizarlos. El propósito de este método es describir variables y analizar su incidencia e interrelación en un momento dado. cuando el investigador aplica un tratamiento a un solo grupo de sujetos. Diseños transversales explicativos: Son aquellos en los cuales las causas y efectos ya ocurrieron en la realidad (estaban dados y manifestados) y el investigador los observa y explica.experimentales se ve con claridad. 18 .”  También algunos autores denominan CUASI-EXPERIMENTAL. sin grupo de control. Lo que hacemos en la investigación no experimental es observar fenómenos tal y como se dan en su contexto natural.” (Hernández. Es decir. Diseños no-experimentales. Diseños transversales descriptivos: son aquellos que tienen como objetivo indagar la incidencia y los valores en que se manifiesta una o más variables. Se establece que un diseño no-experimental es: “la que se realiza sin manipular deliberadamente variables. observándolo antes y después de aplicar el tratamiento. Método transversal: Es el diseño de investigación que recolecta datos de un solo momento y en un tiempo único. se trata de investigación donde no hacemos variar intencionadamente las variables independientes. son grupos intacto (la razón por la que surgen y la manera como se formaron fueron independientes o aparte del experimento. porque en estos dos siempre hay algún tipo de intervención del investigador. Diseños longitudinales: Son aquellos que analizan cambios a través del tiempo (en variables o sus relaciones), dentro de alguna población en general. 1.10 VARIABLES A las características objeto de estudio en la población se les llama variables, ya que pueden variar de un individuo a otro y se representara por letras mayúsculas: X, Y, Z,. . ., debemos distinguir los distintos tipos de variables que hay, lo cual nos va a permitir utilizar las herramientas estadísticas apropiadas. TIPOS DE VARIABLES. Las variables estadísticas pueden ser de dos tipos: Variables cualitativas o atributos: describen cualidades y no toman valores numéricos, estas a su vez pueden ser: Nominales.- Las cualidades no presentan ningún orden. Ejemplo Sexo del estudiante (Femenino, Masculino), Procedencia, I.E. Ordinales.- Este tipo de variables presentan orden Ejemplo: Grado de estudios (Analfabeto, primaria, secundaria, superior), Nivel de conocimiento de Docentes. Variables cuantitativas: toman valores numéricos. A su vez pueden ser: Discretas.- Solo toman un número finito o infinito numerable de valores distintos (generalmente números naturales o enteros). Ejemplos: número de estudiantes por secciones, número de profesores, número de aulas, etc. Continuas.Toman valores en un intervalo. Generalmente corresponden a medir magnitudes continuas. Ejemplo, Rendimiento académico, altura, ingreso del docente, etc. Una característica esencial de este tipo de variables es que sus valores nunca son observables con exactitud, sino que dependen (las observaciones) de la precisión del instrumento de medida. 19 Ejemplo 7 Un especialista estudia, el nivel de introversión en niños menores de 4 años en las instituciones educativas de la ciudad de Cusco. previos para este estudio. Solución: Población: Niños menores de 4 años de las I.E de la ciudad de Cusco. Muestra: Niños de 3 años de las I.E de la ciudad de Cusco. Variable: Nivel de Introversión. Tipo de variable: Cuantitativa Unidad de estudio: Niño menor de 4 años. Defina los conceptos 1.11 ESCALAS DE MEDICION Se llama medición Tenemos las al proceso de atribuir números a las características. siguientes escalas de medición: nominales, ordinales, cuantitativas de intervalo y cuantitativas de razón. Escala nominal. La clave de estas escalas de medida es que sólo informan de la igualdad o desigualdad de los individuos en una característica, pero no de posibles ordenaciones, puesto que la característica a la que se refieren no se tiene en mayor o menor medida, sino que simplemente adopta formas cualitativamente distintas. Los números solo sirven para distinguir valores o categorías diferentes de la variable. Esta escala se emplea para variables cualitativas nominales. Ejemplo 8: El sexo 1=Masculino y 2=Femenino esto simplemente es un proceso de codificación pero no significa que la mujer sea mayor que el hombre, ni el doble, ni que existe sexo intermedio. Escala Ordinal. Los números además de servir para distinguir reflejan un orden existente sobre los valores de la variable. 20 Se obtiene clasificando objetos o arreglándolos en un orden con respecto a alguna variable común. La pregunta es simplemente, si el objeto tiene más o menos de esta variable que algún otro objeto. Esta escala se emplea para variables cualitativas ordinales. Ejemplo 9: Nivel de conocimientos de estrategias cognitivas por parte de los docentes. Excelente=5, bueno =4, regular =3 y malo = 2.” es cierto la relación de orden 2<3<4<5. Escala de Intervalo: La ubicación del punto origen no es fija, puesto que 0 no denota la ausencia del atributo. Aquí los números para clasificar los objetos representan también incrementos iguales del atributo que se esta midiendo. Esto significa que los números pueden ser comparados. La diferencia en 1 y 2 es la misma que entre 2 y 3, pero es solo la mitad de la diferencia entre 2 y 4. Las temperaturas Fahrenheit y Centígrados son medidas que tiene diferentes escalas de intervalo y diferentes puntos de 0. Escala de Razón: Medida numéricas en las cuales cero es un valor fijo en cualquier escala y la diferencia entre valores es diferente Además de la distancia de orden e intervalo, se añade un origen absoluto de forma que no solo cabe hallar distancias (ya en la escala de intervalo), si no también múltiplos exactos. En este caso, el valor representado por 4 tiene doble cantidad medida que él representado por un 2. Ejemplo 10: Edad del profesor expresada en años. 40 años y 20 años son edades distintas y 40 años es superior a 20 años Entre 40 y 20 hay una diferencia de 20, la misma que entre 50 y 30. El 0 tiene sentido. Una persona con 0 años, realmente no tiene edad todavía no ha nacido. En el siguiente cuadro se muestra un resumen de las características de las escalas de medición. 21 Resumen de escalas de medición Tipo Información deducible Relaciones Nominal “igual que” o “distinto que” Transform. admisibles Significa Significa orden No Aplicaciones inyectivas Significa distancia Origen No No Ejemplos Procedencia del Profesor, tipo de metodologia Si Relaciones Ordinal “mayor que” o “igual que” No No Grado de planificación, Funciones crecientes Nivel de utilización de materiales educativos. Igualdad o Intervalo desigualdad de diferencias Igualdad o Razón desigualdad de razones Si B .x (b 0) Si Si Rendimiento académico, Número de estudiantes. A + b.x (b 0) Si Si No Temperatura, inteligencia ESCALAS PARA LA MEDICION DE ACTITUDES La escala de clasificación por categorías es la que usan ampliamente los investigadores de ciencias de la salud y sociales. Escala de clasificación por categorías: Existen cuatro categorías a partir de las cuales los entrevistados pueden elegir para señalar su nivel general de satisfacción. - Muy satisfecho (+2) - Satisfecho (+1 ) - Algo satisfecho (0) - No del todo satisfecho (-1) Escala De Comparación: Es una versión de la escala de categorías, califica a estas categorías como: “excelente”, “muy bueno”, “bueno”, “regular” 22 y “deficiente”, positiva o negativa) de los individuos. ni verdadero Verdadero Alternativa A Alternativa B Alternativa C Alternativa D 23 . Es un tipo de instrumento de medición o de recolección de datos que disponemos en la investigación social.eliminando de esta forma la comparación implícita. ni en desacuerdo -1 2 En desacuerdo -2 1 Muy en desacuerdo En desacuerdo Totalmente en desacuerdo Probablemen te no Definitivamen Completame te no nte falso Falso Neutral o indiferente Indeciso Ni falso. Es una escala para medir las actitudes. El problema con tal escala es que el punto de referencia es poco claro y diferentes entrevistados pueden usar diferentes puntos de referencia o estándares. Alternativas o puntos en la escala de Likert Asignación Asignación Numérica I 2 Numérica II 5 Muy de acuerdo Totalmente de acuerdo Definitivamen Completame te sí nte verdadero 1 4 De acuerdo De acuerdo Probablemen te sí 0 3 Ni de acuerdo. Escala de Likert: La escala de Likert requiere que un entrevistado indique un grado de acuerdo o desacuerdo con respecto a una variedad de afirmaciones (reactivos) relacionadas con el objeto de las actitudes. Consiste en un conjunto de ítems bajo la forma de afirmaciones o juicios ante los cuales se solicita la reacción (favorable o desfavorable. Ejemplo 11: Ha encontrado en la institución educativa el apoyo y las facilidades necesarias para que usted desarrolle de modo óptimo su trabajo.6% 20% 51% 100% 2(5) 4(4) 7(3) 9(2) 23(1) Total=88 Totalmente en desacuerdo (1) Para interpretar el puntaje se ubica en los tramos de la escala de likert. El puntaje mínimo resulta de la multiplicación del número de ítems por 1. Una puntuación alta está dada por el número de ítems o afirmaciones multiplicado por 5. 24 . ( ) Definitivamente sí ( ) Probablemente sí ( ) Indeciso ( ) Probablemente no ( ) Definitivamente no Ejemplo 12: El Director de la UGEL se preocupa por el bienestar del recurso humano. PM--------------------I----------------------I----------------------I-----------------PA Donde: PM: Puntaje mínimo y PA: Puntaje Máximo. se suman los valores obtenidos respecto de cada items.Para obtener las puntuaciones de la escala de Likert. Categorías de Respuesta Frecuencia Porcentaje Asignación de puntajes Totalmente de acuerdo De acuerdo Indeciso En desacuerdo (5) (4) (3) (2) 2 4 7 9 23 n=45 4.4% 9% 15.  Este tipo de variable se encuentra en las siguientes investigaciones: 1. Explicativa.  Considerando el tiempo. supone cierta autonomía con relación a las demás variables. originada o influida por la variable independiente. debido a que la realidad está en movimiento y que todos los hechos están concatenados. según sea la posición que ocupen en el enunciado.Totalmente En (1) 45*1=45 En Indeciso (3) De acuerdo (4) Totalmente de Acuerdo (5) desacuerdo desacuerdo (2) 45*2=90 45*3=135 45*4=180 45*5=225 La puntuación 88 se aproxima a 90. pueden cambiar. Explicativa 25 . Correlacional Variable dependiente  Es aquella que juega un rol de consecuencia. causal o de influencia en otra u otras variables. Toda característica de estudio se conoce como variable. Relacional 3. señalar que las variables independientes en determinados problemas. 2. por lo tanto se ubica en la parte que indica en desacuerdo. Experimental ( en la experimental se le conoce como estímulo) 4. las independientes son más antiguas que las dependientes.12 TIPOS DE VARIABLES UTILIZADAS EN LA INVESTIGACION CIENTIFICA. Variable independiente  Es aquella que juega un rol determinante. 1. al ser determinada. Se encuentran en las siguientes investigaciones: 1. pero es necesario. Esto significa que no pueden existir variables dependientes sin las independientes. 2011. elementos o aspectos que se son inherentes. Variable independiente: Rendimiento Académico Variable dependiente: Uso de mapas mentales Variable Intermedia  Es aquella que juega un rol de factor condicionante. Relacional 3. la encontramos en investigaciones: 1.  La variable interviniente. estructuras. Experimental (La variable dependiente en una investigación experimental se le conoce como respuesta) Ejemplo 13: En el problema influencia del uso de mapas mentales en el rendimiento académico de los estudiantes de las I. 2011. Quillabamba. pues permite medir las características. Descriptiva 2. incidencia. 26 . Variable independiente: formación académica. atributos. modifique le resultado más complejas y de mayor profundidad. Ejemplo 14: En el estudio de formación académica y rol de la experiencia en el desempeño profesional.E de la región de Cusco. Correlacinal 4. Variable Dependiente: Desempeño profesional Variable Intermedia : Experiencia Variable interviniente  Es aquella que en ciertas medida juega un rol pasivo en el problema. Comparativa. pues su presencia entre la variable independiente y variable dependiente hace que sin tener el carácter de factor causal o determinante.2. por lo que nunca van acompañadas de algún otro tipo de variables. Variables Asociadas  Son aquellas que no guardan mayor nivel de dependencia. son tipo de alimentación y obesidad 27 .  Este tipo de variables.  Las variables asociadas son rasgos sociales y rasgos culturales Variables Interdependientes  Son aquellas que indistintamente pueden ser consideradas como causa o como consecuencia una de otra. 2011. se trata de dos o más variables intervinientes. Corresponden a la investigación correlacional. Las variables interdependientes. no hay relación causal entre ellas y considerando el criterio tiempo vienen a ser más o menos contemporáneas. Variable interviniente : Nivel de desnutrición. Ejemplo 16: En el problema: Rasgos sociales y culturales de los profesores de la ciudad de Cusco . Ejemplo 17: En el problema: Correlación entre tipo de alimentación y obesidad de los estudiantes de la ciudad de Cusco. pues para que aparezca el problema surgen de manera simultánea. se encuentra en la investigación descriptiva multivariable. 2010. 2011.Ejemplo 15: En el problema: Niveles de desnutrición de los estudiantes de las instituciones educativas de la ciudad de Sicuani. Resumen del tipo de variables según tipo de investigación. 1. se tiene los siguientes tipos de investigación biomédica. En el área de las ciencias de la salud. se puede realizar mediante: Investigación documental Investigación de campo 28 . la cual es el acopio de información y se incluye desde elaborar fichas bibliográficas hasta la aplicación de cuestionarios con el empleo de técnicas de muestreo. Las variables según su naturaleza se clasifican en cuantitativas y cualitativas. La recopilación de datos.13 RECOPILACIÓN DE DATOS. Dentro de un proceso de investigación una de las actividades que se realizan es la recopilación de datos. interviniente. (2006) un instrumento de medición es un recurso que utiliza el investigador para registrar información o datos sobre las variables que tiene en mente. Las variables según su relación casual se clasifican en: independiente. Para Hernández et. 2.al. La construcción de instrumento consiste en generar un número suficiente de ítems para medir todas las variables con todas sus dimensiones. dependiente. Descriptiva Interviniente Asociada Comparativa Interviniente Explicativa Independiente(s) Dependiente(s) Relacional Independiente Dependiente Correlacional Interdependiente Interdependiente Experimental Estimulo (Factor) Respuesta Observaciones: 1. .Documental escrita 4. 29 ..La ficha de campo 3. a) Entrevistas formales b) Entrevistas informales La Encuesta. Consiste en obtener información directa mediante diferentes actividades por contacto directo con el hecho que se quiere investigar así como las personas relacionadas y se puede realizar: a) Por observación directa b) Por interrogación La observación.La entrevista 2. Consiste en el estudio de documentos escritos sobre un objeto determinado. Es una de las técnicas más comunes y es considerada como la relación directa entre el investigador y el objeto de estudio a través de individuos o grupos con el fin de obtener testimonios reales...La investigación documental.. es decir son todos aquellos documentos registrados en diferentes dispositivos físicos a los que podemos tener acceso en forma directa o indirecta para su consulta y se puede clasificar en: 1.Documental hemerográfica 3. Consiste en recopilar información sobre una parte de la población..Documental bibliográfica 2.La encuesta La Entrevista...Documental audiográfica 5. el cual consiste en realizar la percepción intencionada de una actividad determinada mediante la experimentación la cual consiste en la obtención de datos cuantitativos por medio de la medición del fenómeno que se este observando.Documental iconográfica La investigación de campo. Es el procedimiento empírico básico. Para realizar la observación se utilizan diversos instrumentos auxiliares los cuales son: 1.Estudio de Actividades 4.Documental videográfica 6... asignen cada ítem al objetivo que pretende medir.Cuestionario administrado por el entrevistador La Cedula. las cuales son preguntas formuladas por escrito y no es necesaria la presencia del investigador.  Seleccionar una muestra de expertos en el contenido del test. El procedimiento cuantitativo más sencillo sería el siguiente:  Especificar los diversos objetivos (v.Cuestionarios por correo . Existen procedimientos cuantitativos diversos para que cada experto valore el grado en que un ítem sirve para evaluar el objetivo al que corresponde. Tiene carácter de anónimo.gr. si bien pueden utilizarse jueces expertos en el tema para valorar la congruencia entre los diversos items y los diversos objetivos. El Cuestionario. donde el encuestador es quien llena la cedula de entrevista.Cuestionario administrado por el entrevistado . 30 . áreas diferentes de contenidos) que se Pretenden evaluar.  Elaborar varios ítems para cada objetivo. 1.  Pedirles que. según su opinión. además de que es posible aclara la información sobre las preguntas y es utilizada cuando una persona tiene un bajo nivel cultural.14 VALIDACIÓN DEL INSTRUMENTO La validación de los instrumentos se realiza con el fin de conseguir una mayor objetividad al seleccionar los ítems en los respectivos cuestionarios.La información recopilada puede emplearse para un análisis cuantitativo con el fin de identificar las magnitudes del problema. VALIDEZ DE CONTENIDO El proceso de validación de contenido es eminentemente lógico. . Es un eficaz auxiliar en la observación científica que contiene aspectos del fenómeno esenciales.  Seleccionar los ítems en los que los expertos manifiestan mayor acuerdo en sus clasificaciones. sencillo y no da lugar a diversas interpretaciones? 8. obtendríamos también datos similares? 5. ¿Estima usted que las escalas de medición utilizadas son pertinentes a los objetos materia de 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 estudio? 10. ¿Considera usted que la cantidad de ítems registrados en esta versión son suficientes para tener una comprensión de la materia de estudio? 3. ¿Considera usted que si aplicamos en reiteradas oportunidades este instrumento a muestras similares. propios de las variables del estudio? 6. CRITERIO DE EXPERTOS Método 1:HOJA DE PREGUNTAS PARA LA VALIDACIÓN PREGUNTAS 1. ¿Considera usted que los ítems contenidos 1 2 3 4 5 1 2 3 4 5 ESCALA DE VALORACION 1 2 3 4 5 en este instrumento. son todos y cada uno de ellos. ¿Que aspectos habría que modificar. ¿Considera usted que la estructura del presente instrumento es adecuada al tipo de usuario a quien se dirige el instrumento? 9. que aspectos tendrían que incrementarse o que aspectos habría que suprimirse?………… 31 . ¿Considera usted que los ítems del instrumento miden lo que se pretende medir? 2. ¿Considera usted que los conceptos utilizados en este instrumento. son una muestra representativa del universo materia del estudio? 4. ¿Considera usted que todos y cada uno de los ítems contenidos en este instrumento tienen los mismos objetivos? 7. ¿Considera usted que el lenguaje utilizado en el presente instrumento es claro. PROCEDIMIENTO El método DPP mide la adecuación de los instrumentos. .......75 )2 +( 5 5 )2 + .541 Determinar la distancia máxima (Dmax) del valor obtenido respecto al punto de referencia Cero (0). para medir la variable de interés.... Yi = El promedio del ítem i......... x ...5 4. n 2 ) . se determina la distancia de punto múltiple (DPP).5 5 5 4 4.....(X 9 Y9 )2 Donde: Xi = Valor máximo en la escala para el ítem i.. 32 . ) (1. M x a (1 x 1 2 Donde: Xi = Valor máximo en la escala concedido para el ítem i.25 4.( 5 4... Ejemplo 18...... con la ecuación: 2 2 D )x .. mediante la siguiente ecuación: DPP = (X 1 Y1 )2 +(X 2 Y2 )2 + . en función a la valoración de los expertos. DPP = ( 5 4.. En el presente estudio la valoración de los expertos es: EXPERTOS Item 1 2 3 4 5 6 7 8 9 1 5 5 5 5 5 5 4 4 4 2 4 5 4 5 5 5 5 4 4 3 5 5 5 4 5 5 3 5 5 4 5 5 4 4 5 5 4 4 5 Promedio 4....5 )2 1.(1 . Con los promedios hallados.75 5 4...5 2..... 1 = Valor mínimo de la escala para cada ítem.. 33 ... en caso contrario.541 6....4 2. B.....6-12 A = Adecuación Total B = Adecuación en gran medida C = Adecuación Promedio D = Escasa Adecuación E = inadecuación DPP=1.4 5. lo que indica la Adecuación del instrumento y que puede ser aplicado. Siendo: Escala Valoración Valoración de Expertos 0-2.(5 1) 2 12 La Dmax hallada fue de 12 La Dmax se divide entre el valor máximo de la escala. C. Con el valor hallado anteriormente (apartado 4) se construye una nueva escala valorativa a partir de cero.2 7.4-4..8-7.2-9.6 9. El punto DPP debe caer en las zonas A o B. D....DMax (5 1) 2 (5 1) 2 .541 cayendo en la zona A. luego de las cuales se somete nuevamente a juicio de expertos... lo que nos da un valor de 12/5=2.. y E. llamándose con las letras A.8 4.. hasta llegar a Dmax. El valor hallado del DPP fue de 1.. Dividiéndose en intervalos Iguales entre si. la encuesta requiere reestructuración y/o modificación. Método 2 Cuadro 1. En caso de ser negativa su respuesta. n Aspectos generales El instrumento contiene instrucciones claras y precisas para responder el cuestionario Los ítems permiten el logro del objetivo de la investigación Los ítems están distribuidos en forma lógica y secuencial El número de ítems es suficiente para recoger la información.. Formato para validar instrumentos a incluir en el instrumento de validación. sugiera los ítems a añadir Validez Aplicable ( ) Validado por: Firma: No aplicable ( ) Si No ************* 34 . ÍTEM Claridad En la Criterios a evaluar Coherencia interna Inducción a la Lenguaje Adecuado Con el nivel (sesgo) Del informante Si No Si No Si No Si No Si No Mide lo que pretend e medir redacció n respuesta observaciones ( si debe o eliminarse modificarse un favor indique) 1 . 1. 103). La confiabilidad responde a la pregunta ¿con cuánta exactitud los ítems. reactivos o tareas representan al universo de donde fueron seleccionados?. p. Se usa la correlación por el método de los puntajes directos (Correlación r de Pearson): rxy n Donde: n xi2 xi yi 2 xi yi yi2 yi 2 xi * n rxy : es el coeficiente de correlación n: número de sujetos X: valores de X (1ª aplicación) 35 . se tienen: Método Test-Retest: una forma de estimar la confiabilidad de un test o cuestionario es administrarlo dos veces al mismo grupo y correlacionar las puntuaciones obtenidas.95 (Popham. cit. op. Entre los métodos para estimar la confiabilidad. cit.80 y 0. op. El término confiabilidad “…designa la exactitud con que un conjunto de puntajes de pruebas miden lo que tendrían que medir” (Ebel. citado por Fuentes. 1980. El coeficiente que se obtiene recibe el nombre de coeficiente de estabilidad porque denota la coherencia de las puntuaciones en el tiempo Para un desarrollo adecuado y sean confiables deben variar entre 0. Esta prueba piloto ha de garantizar las mismas condiciones de realización que el trabajo de campo real. es imprescindible probar el cuestionario sobre un pequeño grupo de población. citado por Fuentes.5.). aproximadamente entre 14 y 30 personas.. 1977.10 CONFIABILIDAD del INSTRUMENTO Antes de iniciar el trabajo de campo. Se recomienda un pequeño grupo de sujetos que no pertenezcan a la muestra seleccionada pero sí a la población o un grupo con características similares a la de la muestra del estudio. De esta manera se estimará la confiabilidad del cuestionario. pero su método no supone necesariamente varianzas iguales en los sub-tests. Esto supone que las dos test mitades son paralelos. Su fórmula es: 36 . tienen igual longitud y varianza entre sí.Y: valores de Y (2ª aplicación) Método común de división por mitades o Hemitest: este método computa el coeficiente de correlación entre los puntajes de las dos mitades del test o cuestionario aplicado. El método de división por mitades de Rulon: utiliza la división del test en mitades. Se estima a través del coeficiente de confiabilidad de Spearman-Brown: Se establece la correlación entre los dos puntajes de las dos mitades del test a través del método de los puntajes directos. no en los ítemes. rtt Donde: 2 sd 1 2 st rtt : coeficiente de confiabilidad 2 sd : varianza de la diferencia entre las puntuaciones de las mitades st2 : varianza de las puntuaciones del test total El método de división por mitades de Guttman: también se denomina coeficiente de consistencia interna. coeficiente de consistencia interna. Correlación r de Pearson: r12 n 2r12 1 r12 n x12 x1 x2 2 x1 x2 2 x2 x1 * n x2 2 Estimación del test completo (Spearman-Brown) con la fórmula: rtt Se interpreta la prueba de hemitest como coeficiente de consistencia interna. ya que una sola prueba contiene las dos formas equivalentes y su énfasis lo pone en las puntuaciones de los sujetos. 2003). como las escalas tipo Likert. : Sumatoria de las varianzas de los ítems. cuya ecuación es: donde: : coeficiente de confiabilidad de la prueba o cuestionario número de ítems del instrumento : Varianza total del instrumento. donde: 0 significa confiabilidad nula y 1 representa confiabilidad total. 37 . La suposición básica es considerar que todos los ítemes presentan igual varianza. Para calcular el coeficiente de confiabilidad se usó el ”COEFICIENTE ALFA DE CROMBACH ( )” Córdova (2009). Coeficiente de consistencia interna.rtt Donde: 2 sa sb2 2 1 st2 rtt : coeficiente de confiabilidad 2 sa : varianza de las puntuaciones de los ítemes pares 2 sb : varianza de las puntuaciones de los ítemes impares st2 :varianza de las puntuaciones del test total ALFA DE CRONBACH Para evaluar la confiabilidad o la homogeneidad de las preguntas o ítems es común emplear el coeficiente alfa de Cronbach cuando se trata de alternativas de respuestas policotómicas. Método de Kuder-Richarson 21: permite obtener la confiabilidad a partir de los datos obtenidos en una sola aplicación del test. El coeficiente α de Cronbach puede ser calculado por medio de la varianza de los ítems y la varianza del puntaje total (Hernández Sampieri et al. la cual puede tomar valores entre 0 y 1. 89 CONFIABILIDAD Muy alta Alta Aceptable Moderada Baja Muy baja Despreciable 38 .KR21 Donde: n n 1 1 M n M nst2 n: número total de ítems M: media aritmética de las puntuaciones obtenidas por los individuos st2 : varianza de las puntuaciones totales Para la interpretación de la confiabilidad se utiliza el siguiente cuadro: TABLA DE CATEGORÍAS ESCALA r>0. 69 0.42 0.57 0.17 0.17 0.53 0.46 0. Determine la confiabilidad.45 0.83 varianza del instrumento 39 . para la siguiente información Encuestados 1 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Total 0 0 0 0 0 0 0 0 1 0 0 0 0 1 1 3 2 0 1 1 0 0 0 0 0 0 1 0 1 0 0 1 5 3 3 0 1 0 0 1 0 0 0 0 0 1 0 0 0 4 1 1 2 1 1 1 2 0 1 2 1 1 1 2 0 17 Preguntas (Ítems) 5 1 2 1 1 1 1 1 0 1 2 1 2 2 2 0 18 6 1 1 1 0 1 1 2 1 0 2 1 2 2 0 0 15 7 0 1 0 0 2 0 2 0 0 0 0 0 0 0 0 5 8 0 1 0 1 1 1 1 0 0 2 1 2 0 1 1 12 9 0 2 0 0 0 0 0 0 0 2 2 0 0 0 0 6 10 0 2 0 0 0 0 2 0 0 2 2 1 0 0 0 9 Puntos 3 12 5 3 7 4 10 1 3 13 9 9 5 6 3 93 0.Ejemplo 19. utilizando alfa de cronbach.24 0. la misma que presenta en cada ítems cinco alternativas. con la finalidad de señalar su nivel de acuerdo.Varianza de cada pregunta El índice de confiabilidad es alto de conformidad con la tabla de categorías. Alternativa Asignación numérica a b c d e 5 4 3 2 1 Para obtener las puntuaciones de la variable de estudio. El puntaje mínimo (PM) resulta de la multiplicación del número de ítems (x) por 1. a partir de las cuales los entrevistados pueden elegir. se suman los valores obtenidos respecto de cada ítem. BAREMACIÓN DEL INSTRUMENTO. Una puntuación alta (PA) está dada por el número de ítems o afirmaciones multiplicado por 5. Para medir la variable de estudio se aplico una encuesta utilizando la escala de likert. UTILIZANDO ESCALA DE LIKERT. PM--------------------I----------------------I----------------------I------------------PA El promedio del puntaje del instrumento se obtiene mediante: 40 . El tipo de escala que se utiliza es ordinal (Escala de intensidad). UTILIZANDO ESCALA DE INTENSIDAD.5 2.5 2.Pr omedio Puntaje n Para facilitar la interpretar las puntuaciones de la variable de estudio se transforman a una escala cualitativa.5 Malo Regular Bueno Muy bueno BAREMACIÓN DEL INSTRUMENTO.5 Pr omedio Pr omedio 4. a partir de las cuales los entrevistados pueden elegir.5 Pr omedio 1. Puntaje Obtenido Categoría Deficiente Pr omedio 1. Para medir las variables de estudio se aplica encuestas.5 2.49 1. según el siguiente criterio. asignación un valor a cada alternativa como se muestra en el siguiente cuadro: Alternativa Asignación numérica a b c d 4 3 2 1 Con la finalidad de realizar un análisis estadístico de las variables con sus respectivas dimensiones previamente se realizo la baremación del instrumento (Medición de la variable) 41 .5 Pr omedio 1. con la finalidad de señalar su nivel de acuerdo. las mismas que presentan en cada ítem cuatro alternativas. Finalmente la escala vigesimal es transformada a una escala cualitativa: Categoría Deficiente Malo Regular Bueno Muy bueno 42 . de preguntas (Ítems) Mínimo Máximo Puntaje Obtenido m m Puntuación transformada A escala vigesimal m 1 20 x 4m T La puntuación original se transformación a una escala vigesimal utilizando la siguiente relación T 1 4m-1 x 19 T 1 4m 1 1 Puntaje Obtenido 0-8 9-10 11-13 14-17 18-20 x 1 19 Despejando el valor de x. El puntaje máximo (PA) está dada por el número de ítems multiplicado por 4. se suman los valores obtenidos respecto de cada ítem. PM--------------------I----------------------I----------------------I------------------PA En el cuadro siguiente se muestra el resumen de la puntuación: Características Puntuación original Nro.Para medir la variable de estudio (Puntuación). El puntaje mínimo (PM) resulta de la multiplicación del número de ítems (x) por 1. se obtiene la puntuación del individuo en escala vigesimal. .? Formulación de problemas específicos.? 2. Guía de observación Cuestionario encuestas Entrevistas Ubicación de ítems ……… 43 . ¿……………… Objetivo específico . RECOLECCIÓN DE DATOS PRUEBAS ESTADISTICAS ……………. DIMENSIONES ……. Esta referido a la estructura del proyecto de Investigación y que para fines didácticos se presenta en el siguiente esquema: TITULO:……… PROBLEMA General ¿……………………. Formulación de hipótesis operativas.11 MATRIZ DE CONSISTENCIA. … Variable Dependiente OBJETIVO General HIPOTESIS General VARIABLES Variable independiente …………… TIPO DE ESTUDIO Nivel de investigación…. ¿…………………. 1. …………… …………. Muestra………… INDICADORES ………….5... POBLACIÓN Y MUESTRA Población…. Tipo de investigación…………. Diseño de investigación……… VARIABLES …. CAPITULO III: DISEÑO METODOLÓGICO 44 .MODELO DE TESIS TÍTULO DE LA TESIS: CAPITULO I: PROBLEMA DE INVESTIGACIÓN PLANTEAMIENTO DEL PROBLEMA FORMULACIÓN DEL PROBLEMA DE INVESTIGACIÓN OBJETIVOS JUSTIFICACIÓN  ORIGINALIDAD:  PERTINENCIA:  RELEVANCIA:  OPORTUNIDAD:  FACTIBILIDAD: IMPORTANCIA LIMITACIÓN ÁREA DE ESTUDIO DELIMITACIÓN DELIMITACIÓN ESPACIAL DELIMITACIÓN TEMPORAL CAPITULO II: MARCO TEÓRICO ANTECEDENTES DE ESTUDIO MARCO CONCEPTUAL MARCO NORMATIVO MARCO TEÓRICO CONCEPTUALIZACIÓN EN TÉRMINOS HIPÓTESIS DE INVESTIGACION. Cleto De La Torre Dueñas NIVEL DE INVESTIGACIÓN TIPO DE NVESTIGACION.Estadística para la toma de decisiones Dr. CAPITULO IV: PRESENTACION DE RESULTADOS CONCLUSIONES RECOMENDACIONES BIBLIOGRAFIA ANEXOS 45 . DISEÑO DE INVESTIGACIÓN POBLACIÓN Y MUESTRA VARIABLES OPERACIONALIZACIÓN DE VARIABLES TÉCNICAS E INSTRUMENTOS DE RECOLECCIÓN DE DATOS TÉCNICAS DE ANÁLISIS DE DATOS. Se hizo una encuesta a una muestra representativa de profesores de la UGEL La Convención sobre el nivel de acuerdo con la carrera pública magisterial propuesta por el gobierno. c. Se realizo el estudio de la calidad de vida y servicio educativo de los profesores de las I. b. d. 3. Especifique a. a. Edad.E de la UGEL Cusco. Especifique. Rendimiento Académico (Bajo. realice el análisis correspondiente. La escala de medición a emplear. d. Nivel. Totalmente de acuerdo De acuerdo Indeciso En desacuerdo Totalmente en desacuerdo Frecuencia 15 40 25 10 6 En base a la información. 1. La(s) variable(s) de estudio y el tipo de variable. Proponer un titulo para esta investigación. Clasificar cada una de las siguientes variables : a. Alto). Tipo de investigación e. c. La(s) variable(s) de estudio y el tipo de variable. b. Diseño de investigación 2. Nivel de investigación. Influencia del uso de materiales didácticos en el rendimiento académico de los estudiantes de la ciudad de Cusco. 46 . tipo y diseño de investigación. 4. Medio. La escala de medición a emplear. c. Carrera publica magisterial.EJERCICIOS PROPUESTOS. Sexo. b. h. Universidad A. Calidad de vida y desempeño pedagógico de los profesores de la UGEL Cusco. Numero Telefónico Numero de DNI de un profesor. j. e. 6. Cleto De La Torre Dueñas d. medio o alto). Nivel educativo (primario secundario. 2011. Estrato social (bajo. Tipo de enseñanza (privada o pública). Método de enseñanza. Profesor 1 1 2 3 4 5 1 0 1 1 0 2 0 0 0 0 0 3 1 1 0 1 1 Ítems 4 0 1 1 1 0 5 0 0 1 0 1 6 0 1 1 0 1 Determine la confiabilidad y validez del instrumento. g. Años de estudios completados. 47 . 5. 2011. f. i. En los siguientes temas de investigación Causas de la deserción escolar en la Región Cusco. k. obteniendo los siguientes resultados. Se aplico un test para medir la competitividad del magisterio a una muestra piloto de 5 profesores. superior). Influencia del Uso de TIC en el rendimiento académico de los estudiantes de la carrera Profesional de Educación. Elabore la matriz de consistencia para cada uno de los casos. Nivel de congruencia entre la sumilla y el silabo.Estadística para la toma de decisiones Dr. 2011. En ésta se recogen los distintos valores (números o categorías) que toma la variable junto con sus correspondientes frecuencias de aparición. Resumir los datos es un procedimiento útil para conseguirlo y puede hacerse mediante tablas. 2. estas se fortalecen significativamente cuando se la acompañan con gráficos descriptivos ilustrativos. poniendo en relieve sus rasgos más importantes. 48 .1 TABLA DE FRECUENCIAS. gráficos o valores numéricos.CAPITULO II ORGANIZACIÓN Y PRESENTACIÓN La presentación de datos a través de tablas estadísticas es una actividad importante dentro de los sistemas de información. Un primer resumen de la información contenida en un conjunto de datos observado se obtiene al organizarlos en lo que se llama una tabla de frecuencias. A lo largo de este tema veremos las principales técnicas numéricas y gráficas que nos permiten describir una característica de interés observada en una población. En el contexto de los sistemas de información. en más de una oportunidad se encontrara que un buen grafico resume y expresa mucho más que párrafos completos de comentarios e interpretaciones literales. 1 TABLA DE FRECUENCIAS PARA VARIABLES CUALITATIVAS Si en una muestra de n elementos..... se cumple n k hi 1 i 1 La frecuencia absoluta acumulada del valor i-ésimo es la suma de las frecuencias absolutas hasta dicho valor.... Hi Fi n Una tabla de frecuencias tiene la siguiente estructura: 49 . fk n La frecuencia relativa de un valor Ci es el cociente de la frecuencia absoluta (fi) entre el tamaño de la muestra (n). Se representa por fi y cumple k fi i 1 f1 f 2 .1. se denota por Fi Hi h1 h2 .Estadística para la toma de decisiones Dr. Para resumir la información. se denota por Fi Fi f1 f 2 .. hi . previamente definimos algunos conceptos: La frecuencia absoluta de un valor Ci es el número de veces que dicho valor aparece en la muestra. fi La frecuencia relativa acumulada del valor i-ésimo es la suma de las frecuencias relativas hasta dicho valor. se representa por hi hi fi .. C2. Ck de una variable cualitativa X. Cleto De La Torre Dueñas 2.. se observa k categorías diferentes C1.....….. Categoría de la variable X C1 C2 …. Ck Total Frecuencias absolutas fi f1 f2 … fk n Frecuencias relativas hi h1 h2 … hk 1.00 Frecuencias Porcentuales pi p1 pi … pk 100.00 frecuencias absolutas acumuladas Fi F1 F2 … Fk=n frecuencias relativas acumuladas Hi H1 H2 … Hk=1 GRAFICAS. Las representaciones gráficas prácticamente están orientadas de acuerdo con las necesidades del investigador o estadístico, de todas formas se tienen algunas normas de trabajo y representación, que tienen por objeto facilitar la lectura de los datos e información que se maneja estadísticamente. La calidad de un gráfico estadístico consiste en comunicar ideas complejas con precisión, claridad y eficiencia, de tal manera que: • • • • Induzca a pensar en el contenido más que en la apariencia No distorsione la información proporcionada por los datos Presente mucha información (números) en poco espacio Favorezca la comparación de diferentes grupos de datos o de relaciones entre los mismos (por ejemplo una secuencia temporal) La finalidad de los gráficos estadísticos es: – – – – – – Organizar los datos. Observar patrones. Observar agrupamientos. Observar relaciones. Comparar distribuciones. Visualizar rápidamente la distribución de los datos. 50 Estadística para la toma de decisiones Dr. Cleto De La Torre Dueñas – Visualizar, obtener y comparar medidas estadísticas. El cuadro anterior se puede representar utilizando los siguientes gráficos.  Diagrama de barras o rectangulos Es la representación gráfica usual para variables cuantitativas sin agrupar o para variables cualitativas. Para el caso de variables cualitativas se construye dibujando sobre la categoría correspondiente un rectángulo con altura igual a la frecuencia (absoluta o relativa). También es válido para variables cuantitativas discretas, considerando en el eje de abscisas los valores de la variable en orden creciente en lugar de las categorías, sobre cada valor levantamos una barra de altura igual a la frecuencia (absoluta o relativa).  Diagrama de Pareto. Se ordenan las categorías de mayor a menor importancia y se dibujan los rectángulos correspondientes.  Diagrama de sectores. Es el más usual en variables cualitativas. Se representan mediante círculos. A cada valor de la variable se le asocia el sector circular proporcional a su frecuencia. Para hallar el ángulo usamos la siguiente proporción: al tener una circunferencia 360º, el cociente entre la frecuencia absoluta (o relativa) total y la frecuencia absoluta (o relativa) que queramos representar será igual al cociente entre los 360º de la circunferencia y el ángulo a determinar, así : n fi 360º 1 hi 360º Donde  es el ángulo a determinar. Pictogramas. Expresan con dibujos alusivos al tema de estudio las frecuencias de las modalidades de la variable. La escala de los dibujos debe ser tal que el área 51 de cada uno de ellos sea proporcional a la frecuencia de la modalidad que representa. 2.1.2 TABLA DE FRECUENCIAS PARA VARIABLES CUANTITATIVAS DISCRETAS Una vez obtenida una muestra de cualquier población y observados los valores que toma la variable en los individuos de la muestra, estos valores se suelen ordenar. Si la variable es cuantitativa la ordenación será de menor a mayor. Dada una variable X, consideramos una muestra de tamaño n que toma k valores distintos, x1, . . . , xk (x1 < x2 < . . . < xk). La organización es en forma similar al caso cualitativo. Categoría Frecuencias Frecuencias Frecuencias de la absolutas fi relativas hi frecuencias frecuencias relativas Porcentuales absolutas pi variable X x1 x2 …. xk Total f1 f2 … fk n h1 h2 … hk 1.00 acumuladas acumuladas Fi Hi H1 H2 … Hk=1 p1 pi … pk 100.00 F1 F2 … Fk=n La grafica para representar esta información es Bastones. 52 Estadística para la toma de decisiones Dr. Cleto De La Torre Dueñas Observaciones Los datos iniciales se pueden representar utilizando los gráficos. Diagrama de cajas(box-plot) Presentación visual que describe al mismo tiempo varias características importantes de un conjunto de datos, tales como el centro, la dispersión, el alejamiento de la simetría, y la identificación de valores extremos (puntos atípicos), es decir, de valores que se alejan de una manera poco usual del resto de los datos. Presenta los tres cuartiles, (y los valores mínimos y máximos) alineados sobre una caja vertical u horizontalmente. El procedimiento Para el diagrama de cajas y bigotes es: 1. Dibujar un segmento con extremos en los valores menor y mayor que aparecen en la muestra paralelo a uno de los ejes . 2. Dibujamos una caja con extremos en el primer y tercer cuartil y marcamos en ella la mediana. 3. Se hallan los límites interiores (Q1 – 1.5 IQR y Q3 + 1.5 IQR) y los límites exteriores (Q1 – 3 IQR y Q3 + 3 IQR). Donde Qi : Cuarteles que seran desarrollados más adelante. 4. Se unen, con unos segmentos (bigotes), Q1 y Q3 con los valores adyacentes de la muestra. 5. Por último se indican los valores atípicos Tallos y Hojas (stem & leaf) Procedimiento semigráfico para el que se preparan los datos resumiéndolos en dos o tres cifras (expresándolos en las unidades adecuadas). A continuación se disponen en una tabla de dos columnas del siguiente modo: 1. Si los datos son de dos dígitos, a la izquierda (en el tallo) aparece la cifra de las decenas, a la derecha separada por una línea aparecen las hojas y se escriben ordenadas y todas seguidas. 2. Si hay tres dígitos el tallo está formado por los dos primeros. Las hojas son las unidades. 53   n: Numero de datos.. Las frecuencias harán ahora referencia al número de datos que hay en cada intervalo. LSk LI i 2 LSi Determinación de las marcas de clase. se tiene los siguientes pasos:  Elegir un numero de intervalos de clase (K) Puede utilizar la regla de Sturges. mi Donde LI : Limite inferior LS : Limite superior.3 TABLA DE FRECUENCIAS PARA VARIABLES CUANTITATIVAS CONTINUAS. xmin 2 A LI2 . 54 . k 1 3. Definimos entonces como clase a cada uno de los intervalos en que se agrupan los datos.    Determinar el rango . xmin A LI1.1.3log(n) Donde k: Numero de intervalos. R xmax xmin R/k Determinar la amplitud de las clases A Determinación de los intervalos: I1 xmin . Ik  xmin (k 1) A. LS2 ……………………….2. xmin kA LI k . A veces se hace necesario trabajar con datos agrupados. Para construir distribución de frecuencias por intervalos. LS1 I2 xmin A.  Realizar la clasificación y el conteo de datos en cada clase construida. Este cuadro se representa mediante los siguientes gráficos: Histograma de frecuencias Un histograma es la representación más frecuente con datos agrupados. Resulta de suavizar el polígono de frecuencias.  Curva de frecuencias. Para representar el polígono de frecuencias en el primer y último intervalo. se construye a partir de la tabla estadística. utilizamos como diagramas diferenciales los histogramas y los polígonos de frecuencias.00 Frecuencias Porcentuales pi p1 pi … pk 100. un rectángulo que tiene a este segmento como base. y se unen por una línea recta los puntos del histograma que corresponden a sus marcas de clase.  Ojivas  55 .00 frecuencias absolutas acumuladas Fi frecuencias relativas acumuladas Hi H1 H2 … Hk=1 I1 I2 …. El criterio para calcular la altura de cada rectángulo es el de mantener la proporcionalidad entre las frecuencias absolutas (o relativas) de cada intervalo y el área de los mismos.Estadística para la toma de decisiones Dr. representando sobre cada intervalo. Ik Total m1 m2 … mk F1 F2 … Fk=n Cuando las variables son continuas.00 Frecuencias relativas hi h1 h2 … hk 1. Cleto De La Torre Dueñas Intervalos Ii Marcas de clase mi Frecuencia s absolutas fi f1 f2 … fk n Frecuencia s relativas hi h1 h2 … hk 1. ya que consiste en unir mediante líneas rectas los puntos del histograma que corresponden a las marcas de clase.  Polígono de frecuencias El polígono se construye fácilmente si tenemos representado previamente el histograma. en sus puntos angulosos. suponemos que adyacentes a ellos existen otros intervalos de la misma amplitud y frecuencia nula. 5 15.2 18.3 16.4 19.1 21.2 16.2 19.2 15.5 17.9 17. A R k 14 7 2 Establecimiento de los límites y construcción de la tabla: 56 .3 19 a) Construya la tabla de distribución de frecuencias b) Represente la información obtenida.9 21 21.7 19.3 19.4 22.8 18.3 19.9 17.5 23.8 18.3 18.2 17.8 18.5 20.4 17.7 23 23 23.3log(90) 7.5 17.2 20.1 17.9 19.7 19.5 19 19.4 21.9 20 20 20.5 19.9 20.4 13.7 19.2 23.4 19.44 7  Determinar la amplitud de los intervalos R xmax xmin 26.8 26.2 12.5 19.8 20.1 16.1 19.5 24.8 17.7 19.7 19.4 14.8 20.4 15.1 19.2 14  Determinar el tamaño del intervalo de clases (c).8 18.3 18.3log(n) 1 3.  Elegir el número de clases.1 18.8 18.8 16. a) Para construir una tabla de frecuencia se tiene los siguientes pasos.8 19.2 19.3 20.1 24.6 20. 12.7 22 22.3 18.6 18. mediante un grafico.4 15. Usando la relación de sturges se tiene: k 1 3.4 18.6 21.2 24.5 16.5 19.2 18 18.5 16.8 18.6 17.3 20.2 17.1 17. se obtuvo siguiente información en el incremento mensual de utilidades en miles de soles de 90 sucursales de la empresa.6 20. Solución.EJERCICIOS RESUELTOS 1) En un estudio realizado sobre el impacto que presenta aplicar una estrategia comercial en las ventas .3 23. 57 .2) TOTAL mi 13. B. A continuación se presenta los resultados de la encuesta aplicada a 37 usuarios.2) [16.97 1 b) Histograma de frecuencias relativas.1 0. D.18 0. D. C.87 0. B.22 6. A. D. C. A.07 0. D. D. A.09 0.2) [18.2 25.4 0.29 0. La gerencia desea saber si se nota alguna preferencia por uno u otro tipo de tributación.2) [22.02 0.2 – 16.69 0. His tograma 40 30 fr ec uenc ia 20 10 0 12 15 18 21 24 27 2.2 – 18. C. A. A.2 – 14.- SUNAT pone a disposición de sus clientes cuatro nuevos planes de tributación.03 1 pi 2.2 17. 2– 24. D. B. Represente la información mediante un gráfico apropiado. D A. D. D. D.2 – 20.2) [14. D. D. B.2) [24. A.2 21. D. C. A.33 100 Hi 0. A.2) [20.2 0.2 – 26. B.2 15. A.2 fi 2 6 18 36 16 9 3 n=90 Fi 2 8 26 62 78 87 90 hi= fi/n 0. D. B.02 0. Cleto De La Torre Dueñas LI .2 19.LS [12.8 10 3.2 23.Estadística para la toma de decisiones Dr.2 – 22. D. B. B.67 20 40 17. 62 40.54 100 15 12 fr ec uenc ia 9 6 3 0 A B C D 27.Solución.54% A B C D {[} {\} {]} {^} 21. Tipo de capital. A C B D Total fi 10 4 8 15 n=37 hi 0.Se realizo un estudio sobre el tipo de error en la facturación en la ciudad de Cusco.2703 0.62% 10. 58 .2162 0.1081 0.81% {_} {`} 3. registrándose los siguientes resultados.81 21.4054 1 Pi 27.03 10.03% T ributación 40.. 4 19.0 Deficiente Regular Bueno Total 59 .4 34. respecto a planes de marketing. se realizo un estudio sobre el conocimiento que presentan los 41 administradores de empresa.Estadística para la toma de decisiones Dr.. 50 40 Porcentaje 30 20 10 0 Calculo Concepto Otros Tipo de error en la facturación 4.1 100. Cleto De La Torre Dueñas Tipo de Error en la facturación Frecuencia 45 70 86 201 Porcentaje 22. Conocimiento Frecuencia 26 8 7 41 Porcentaje 63.5 17.8 100.0 Calculo Concepto Otros Total Represente gráficamente la información. Los resultados se muestran a continuación.En una ciudad.8 42. 60 .0% Deficiente Regular Bueno Conocimiento EJERCICIOS PROPUESTOS 1.0% 20.Represente la información mediante un grafico.0% 0. 60. b) Grafique el histograma. 87 93 101 104 105 105 106 107 107 109 110 114 114 116 117 118 118 119 120 122 122 125 125 128 129 133 133 134 135 138 140 141 146 146 148 152 155 155 162 167 173 176 183 194 197 204 212 230 a) Construya la tabla de frecuencias.0% Porcentaje 40. Los datos del Cuadro siguiente corresponden a saldos en cuenta corriente de 48 empresas en miles de soles. 7. 6.44. 7. se determino la inversión que estos realizan en la bolsa de valores . 5. 4. 9. 6.50.Construir una distribución de frecuencias de estos pesos. 6. 7. 4. ii) Elementos de la población. 11. de los compradores de cierto producto de venta masiva. iii) Variable en estudio.Se llevó a cabo un estudio de mercado con el fin de describir el nivel de consumo mensual en unidades. En una muestra aleatoria de 35 pequeños empresarios.44. f). 6.44. Para ello se realizó una encuesta a un grupo de individuos elegidos al azar y los datos reunidos se muestran a continuación: 4. 8.38.. d).40..45. 4. 7.35. e) Determine el porcentaje exacto de empresarios con una inversión que fluctue entre 39. en lugar de una gráfica de barras 61 . 10. 9. 6. 42.44. 5.41.42. 9. 9. 7. 8. 6.38. iv) Tipo de dato analizado. 10.44. 6.41. N5 . 7. pertenece al intervalo X 2S X . 8.40. f 4 .. 7.Estadística para la toma de decisiones Dr..40.¿Por qué se ha utilizado un histograma para representar estos datos.. b).36.47. 5..Encontrar las frecuencias relativas. a).Encontrar las frecuencias relativas acumuladas. 3.39. a) Identifique los siguientes conceptos: i) Población analizada.36. 8. 8. 6.Encontrar las frecuencias acumuladas.5 miles de soles. Cleto De La Torre Dueñas c) Establezca si los datos siguen una distribución simétrica.48. 5.Dibujar un histograma con los datos de la parte a). 8. 7. F4 c) Construya un gráfico estadístico adecuado para la tabla construida en la parte a) e interprételo.39. 10. 7. 7.42..40.5 y 42. d) Se desea determinar el porcentaje de empresarios cuya inversión. c).38.41.45. b) Construya una tabla de frecuencias completa e interprete: n3 . g). 8. 7. 3. 7. 8. 8. 6.40.39. obteniéndose los siguientes resultados en miles de soles : 34. X 2S X .47. 9.41. 10.39.42. 2. 5. 7 25.4 20.¿Cuál es la amplitud total de la distribución de los datos? b).2 26.8 22. b) Dibuje el polígono de frecuencias.6 25. la frecuencia absoluta y la frecuencia relativa acumulada "a menos de".0 26.0 24.Calcular la media y la varianza con los intervalos del apartado b y después calcúlense las mismas magnitudes sin ordenar los datos en una tabla estadística..7 20.9 21.1 21.4 a) Construya una distribución de frecuencia con 5 clases..9 26.9 26.4 22..9 21.6 21.9 20. c)..El gerente de ventas de una empresa a registrado los siguientes montos de sus ventas diarias en cientos de soles: 24.0 28..2 25.2 24.2 22. 9.5..1 21.8 20. 62 . f).9 25.6 26.0 24.8 21.3 24..7 30.Obtenga la distribución de frecuencias acumuladas. 110 113 124 117 108 118 110 98 118 111 120 106 126 122 132 112 99 128 112 105 108 101 102 94 117 103 115 112 129 114 113 119 120 111 115 135 100 107 119 121 107 117 123 103 130 122 113 109 100 134 a). absolutas y relativas.0 21.. Incluya los limites dados.0 22.5 25.8 20.Obtenga la distribución de frecuencias absolutas y relativas. d).0 25.Dibuje el polígono de frecuencias relativas.Dibuje el polígono de frecuencias relativas acumuladas.3 26. con tal fin se realiza una auditoria respecto al volumen mensual de las ventas de los últimos 50 meses.SUNAT esta realizando un estudio sobre la evasión de impuestos por parte de una empresa. ¿Con qué método se obtiene mayor precisión? e).7 21. con los intervalos anteriores. Construir la tabla de distribución de frecuencias.U asesor de una pequeña empresa de corretaje. De un grupo de 50 sujetos. Construya la distribución de frecuencia acumulativa. el asesor obtuvo los datos siguientes con respecto a los diferentes niveles de réditos requeridos por cada individuo para que pueda invertir 1000 dólares: Punto de diferencia ($) fi 70 – 75) 75 – 80) 80 – 85) 85 – 90) 90 – 95) 95 – 100) 100 – 105) 105 – 110) 2 5 10 14 11 3 3 2 a. Grafique la distribución de la parte (a) convirtiéndola frecuencia relativa. b. estaría dispuesto a invertir su capital.Suponga que usted es el estadístico oficial de líneas aéreas KLM y que el presidente del consejo de administración le ha pedido que recoja y organice datos relativos a las operaciones de vuelo. Construir una ojiva. Su interés principal a partir de los valores diarios se centra en la variable de número de pasajeros. El asesor sabe que si un inversionista potencial pudiera obtener un cierto nivel de intereses. 11.Estadística para la toma de decisiones Dr. 63 en ojiva de . no estaría dispuesto a hacerlo. b.. intenta diseñar programas de inversión que fuesen atractivos para jubilados. Ha obtenido estos datos de los diarios de vuelo de los últimos 50 días y ha reflejado esta información: 68 72 50 70 65 83 77 78 80 93 71 74 60 84 72 84 73 81 84 92 77 57 70 59 85 74 78 79 91 102 83 67 66 75 79 82 93 90 101 80 79 69 76 94 71 97 95 83 86 69 a. c. Construir un histograma y un polígono de frecuencias. Cleto De La Torre Dueñas 10. pero debajo de un cierto nivel de intereses.. (Ver cuadro siguiente) 64 .c. Podemos distinguir 4 aspectos o características principales que pueden resumirse en una distribución. La conjunción de técnicas numéricas y gráficas permite una buena descripción de la variable.usando cantidades que informen de la concentración de las observaciones alrededor de dicho centro -medidas de dispersión. Los estadísticos resúmenes tratan de reflejar numéricamente distintos aspectos de la variable en estudio.y mediante números que reflejen la forma (asimetría y apuntamiento) de la distribución -medidas de forma. el resumen puede hacerse eficazmente de una forma más sencilla y precisa: utilizando valores numéricos que den idea de la ubicación o del centro de los datos -medidas de posición. En muchos casos. CAPITULO III MEDIDAS DESCRIPTIVAS DE UNA DISTRIBUCIÓN DE DATOS Las técnicas estudiadas anteriormente permiten una descripción visual de la distribución de una variable. Cleto De La Torre Dueñas Media Centralización Mediana Moda Percentiles Cuartiles Posición Deciles Varianza Medidas descriptivas Dispersión Desviación típica Coeficiente de variación Rango Nos dan un centro de la distribución de frecuencias Son valores de la distribución que dividen en partes iguales Las medidas de dispersión cuantifican la separación. mediana y moda. Las medidas de tendencia central son fundamentales ya que permiten localizar cuantitativamente la zona central o de mayor acumulación de información de un conjunto de datos correspondientes a una variable.Estadística para la toma de decisiones Dr. 65 . Definimos tres medidas de tendencia central: media. Pretenden resumir todos los datos en un único valor. la dispersión.1 Medidas de tendencia central Los promedios o medidas de tendencia central son valores representativos de un conjunto de datos. obtenidos de una muestra seleccionada de una población específica o de un conjunto de resultados del espacio muestral de un experimento aleatorio. la variabilidad de los valores de la distribución respecto al Recorrido Intercuartilico Coeficiente de Asimetría Forma valor central Comparan la forma Coeficiente de Apuntamiento que tiene la o Curtosis representación gráfica 3. ( x ) Media para datos sin agrupar: Dado un conjunto de observaciones mediante x .. x f 1m1 f 2m2 .Media. para hallar la media tomamos la marca de las clases. en este caso la media es: x f 1x1 f 2 x 2 . n fkxk k xi hi i 1 Si los datos están agrupados por intervalos. n fkmk k hi mi i 1 La media se mide en las mismas unidades que la variable. corresponde a un 50% de valores son inferiores y otro 50% son superiores.... para n impar 66 . la media se representa x Media para datos agrupados x1 x 2 ... Mediana para datos sin agrupar La mediana es el valor del dato central y depende del tamaño de la muestra. . xn. Me xn 2 1 .. (Me) Se calcula para variables cuantitativas. Mediana. . y tiene el inconveniente de verse muy afectada por la presencia de datos que sean extremadamente grandes o pequeños (datos atípicos).. . es el valor de la serie de datos que se sitúa justamente en el centro de la muestra una vez se ha ordenado ésta. xn n xi i 1 n Consideremos el caso en que tenemos una distribución de frecuencia para variables cuantitativas discretas. se obtiene mediante: n x1.. .... (Mo) Es el valor con mayor frecuencia.Estadística para la toma de decisiones Dr.5 H i hi 1 A La mediana sólo tiene en cuenta la posición de los valores en la muestra y por lo tanto tiene mejor comportamiento que la media cuando hay observaciones anómalas. Mediana para datos agrupados Cuando trabajamos con variables agrupadas por intervalos es imposible determinar con precisión los valores que toman los datos. en este caso. Mo LI 1 1 2 A LI fi fi fi 1 fi 1 fi fi A 1 Donde: 1 fi fi fi fi 1 1 1 67 . debemos buscar otro método para determinar el valor de la mediana. Moda. la variable se dice multimodal y puede calcularse para cualquier tipo de variable (Cuantitativas o cualitativas). ya que esa información se ha perdido en privilegio del agrupamiento intervalo. Si los datos están agrupados hablamos de clase modal y será aquella para la que la frecuencia absoluta sea mayor. Por lo tanto. Me LI n Fi 2 fi 1 A LI 0. Cleto De La Torre Dueñas x Me n 2 x 2 n 1 2 . Si hay más de una moda. Si n es par. En general. en este caso la media. puedes utilizar la moda. que también es útil cuando la distribución está distorsionada por valores extremos o la distribución es bimodal. Cuando valores extremos distorsionan la distribución de los datos.¿Cómo elegir entre las medidas de tendencia central?. Si se trata de una variable ordinal. el uso de la mediana es más apropiado pues se ve menos afectada. Clases de Distribuciones Distribución Simétrica se presenta si todas las observaciones están concentradas en un solo valor de la variable. su valor se correrá a la izquierda también y por el mismo 68 . la media es la medida de tendencia central más útil y más empleada. generando una distribución asimétrica hacia la izquierda. El uso de la media es el más apropiado cuando y la distribución de los datos es unimodal y aproximadamente simétrica. mediana y moda coincidirían en el mismo. o sólo necesitas una descripción rápida y aproximada de la tendencia central. en este caso como la media es la suma de los valores de las observaciones dividido por la cantidad total de observaciones. pero en la práctica esta medida de tendencia central no se utiliza demasiado. x Me Mo Distribución asimétrica sesgada a la izquierda Supongamos ahora que las observaciones de la parte izquierda se alejan del valor central más que las observaciones de la parte derecha. tercer cuartil. En este caso la media.Estadística para la toma de decisiones Dr. en 4 partes iguales. i=1. ordenada de menor a mayor.2. primer cuartil.3 Qi - LI i i. segundo cuartil. es decir: x Me Mo Distribución asimétrica sesgada a la derecha. y se denotan por Qi . 3. Percentiles Dividen la muestra ordenada en 100 partes iguales. 69 . - Q2. es la mediana.n Fk 4 fk 1 A Q1. es mayor que la mediana y que la moda. al menos el 75% de los datos son menores o iguales que él y al menos el 25% de los datos son mayores o iguales que él. la media será menor que la mediana y ambas menor que la moda. Mo Me x . Cleto De La Torre Dueñas motivo. Cuartiles Dividen la muestra.2 Medidas de Posición. Q2 = Me. al menos el 25% de los datos son menores o iguales que él y al menos el 75% de los datos son mayores o iguales que él. Q3. la localización central será menos representativa de los datos en su conjunto de lo que sería en el caso de datos que se acumulasen más alrededor de la 70 . los estadísticos de variabilidad o dispersión muestran si los valores de las observaciones están próximos entre sí o están muy separados. es claro que Q1 = P25.n Fk 10 fk 1 A 3. Deciles Dividen el conjunto de datos en 10 partes iguales y se denota con Di . La dispersión de la distribución suministra información complementaria que permite juzgar la confiabilidad de nuestra medida de tendencia central. La dispersión es el grado en que los datos numéricos tienden a extenderse alrededor de un valor medio. i=1. ser muy distintos si uno se halla más disperso que el otro. Si los datos están ampliamente dispersos.Pi LI i i.…9 Di LI i i.3 Medidas de dispersión Mientras los estadísticos de tendencia central nos indican los valores alrededor de los cuales se sitúan un grupo de observaciones. Dos conjuntos de datos pueden tener la misma localización central y no obstante. Pi ( 1 i 99 ) es un valor tal que al menos el i% de los datos son menores o iguales que él y al menos el (100-i) % de los datos son mayores o iguales que él. A partir de las definiciones de los cuartiles y percentiles.n Fk 100 fk 1 A El i-ésimo percentil. Q2 = P50 =Me y que Q3 = P75. Por ejemplo. Además. Sólo tienen sentido para variables cuantitativas y se define: n xi S2 i 1 x 2 n xi2 i 1 n n n x 2 n x 2 . Para datos tabulados por intervalos. Puede sufrir un cambio desproporcionado por la existencia de valores extremos en el conjunto. las utilidades con una fuerte dispersión indican un riesgo mayor parar los accionistas que las utilidades que permanecen relativamente estables. Cleto De La Torre Dueñas media. Observaciones sobre la varianza: Las unidades de la varianza son los cuadrados de las unidades de los datos y en muchas ocasiones no son fáciles de interpretar.Estadística para la toma de decisiones Dr. Para datos tabulados de variable discreta mi S2 i 1 fi i 1 f i mi2 n x 2 . fi xi2 xi S2 i 1 fi i 1 n n n x 2 n x 2 . Varianza. si no conviene tener una amplia dispersión de valores respecto al centro o si esa dispersión implica un riesgo inaceptable. Desviación típica (S) Es la raíz cuadrada positiva de la varianza s 71 s2 . a los analistas financieros les interesa la dispersión de las ganancias de una empresa. para n variables continuas. deberemos ser capaces de reconocerlo y no escoger las distribuciones que presentan la máxima dispersión. Para datos no tabulados. También es aplicable a casos en que se quieran comparar individuos semejantes de poblaciones diferentes. Las unidades de la desviación típica se expresan en las mismas unidades de los datos. se realiza entre ellos una transformación llamada tipificación. z Fórmulas: z x x para muest ras s xpara población Esta nueva variable (z). nos indica cuántas desviaciones estándar está un valor por arriba o por debajo de la media del conjunto de datos al cual pertenece. Se conoce por tipificación de una variable “x” a efectuar el cambio de origen y de escala de la variable. Variables tipificadas Los distintos conjuntos de datos están asociados por lo general a diferentes medias. Con el propósito de reducir los datos a un mismo punto de referencia y a una escala común. Por ejemplo.La desviación típica poblacional suele denotarse por Observaciones sobre la desviación típica: . Puede sufrir un cambio desproporcionado por la existencia de valores extremos en el conjunto. Nos permite determinar con mayor grado de precisión dónde se sitúan los valores de una distribución de frecuencia en relación con la media. si deseamos comparar el nivel académico de dos estudiantes de diferentes universidades. ya sea porque son de naturaleza diferente (escalas de medidas diferentes). 72 . carece de unidades de medida y permite comparar dos o más cantidades que en un principio no son comparables porque aluden a conceptos diferentes. Docente de la Universidad A x = 76 Docente de la Universidad B x = 82 s = 10 x = 84 z= 84 76 10 0. el coeficiente de variación es. Otro Docente de la Universidad B obtuvo 90 puntos.5. en el que la nota media fue 76. CV S |X| CV es apropiado en poblaciones donde los datos son positivos. Si 0<CV<1. los datos provienen de una población homogénea Si CV>1. en razón de su carácter adimensional. Coeficiente de variación Muestral de Pearson Las medidas de dispersión anteriores dependen de las unidades de medida. los datos provienen de una población heterogénea. para comparar muestras con medias desiguales. en cambio. ¿ Cual de los Docentes presenta mejor nivel de conocimientos de sistemas de tributación?. También para decidir cual muestra es más homogénea o menos variable 73 .5 Sobresalió más el Docente de la Universidad A. una medida de dispersión relativa y adimensional. siendo la media 82 y la desviación típica 16.Estadística para la toma de decisiones Dr. y la desviación típica 10.8 s = 16 x = 90 z= 90 82 16 0. Cleto De La Torre Dueñas Ejemplo: Un Docente de la Universidad A obtuvo 84 puntos en sistemas de tributación . El coeficiente de variación es útil.5. donde las unidades de medida de las observaciones son diferentes. ¿Cómo elegir entre las medidas de dispersión?. En general la mejor manera de verlo es por la representación gráfica. es adimensional y se define como sigue: 74 . Sólo debes usar el rango cuando dispones de pocas medidas o cuando todo lo que necesitas conocer es la dispersión general de las medidas. Utiliza el coeficiente de variación cuando quieras tener una idea de la variabilidad relativa de dos o más variables cuyas medias son muy diferentes en magnitud.4 MEDIDAS DE FORMA Miden la mayor o menor cantidad de datos que se agrupan en torno a la moda y Hacen referencia a la forma de la distribución. Esto se ve facilitado por su carácter adimensional. La amplitud intercuartil es el doble del valor anterior. asimetría a la derecha o a la izquierda. simétrica. no depende de las unidades en que se mida la media 3.Recorrido o rango Es la diferencia entre el mayor y menor valor de una muestra.La medida de dispersión más útil es la desviación típica. 2Q = IQR = (Q3 – Q1). R x max x min Rango semiintercuartílico y amplitud intercuartil El rango semiintercuartílico es la mitad de la diferencia entre el tercer y primer cuartil. es decir. Q = (Q3 – Q1)/2. El coeficiente de asimetría de una variable mide el grado de asimetría de la distribución de sus datos en torno a su media. Los más utilizados son: Coeficiente de asimetría de Pearson. pero si no la tenemos existen coeficientes que nos indican la forma de la distribución. se llama Mesocúrtica K K 0 . se determina mediante: K P75 P25 P90 P 10 0. asimetría a la izquierda negativa.Estadística para la toma de decisiones Dr. entonces la media menor que la moda. se llama Platicúrtica 75 . distribución simétrica 0 .5 Este coeficiente puede ser: K 0 . entonces la media mayor que la moda. la curva es más aplastada que la normal. entonces la media igual que la moda. la curva es igual que la normal. Cleto De La Torre Dueñas Ap x Mo S Este coeficiente puede ser: Ap Ap 0 . asimetría a la derecha positiva Ap 0 . Curtosis. hace referencia al mayor o menor apuntamiento que tiene una distribución de frecuencias respecto a una distribución Normal. por lo tanto sólo se estudia en comparación con la campana de Gauss. la curva es más puntiaguda que la normal se llama Leptocúrtica 0 . 1) La siguiente tabla muestra los coeficientes de inteligencia de 480 trabajadores de una empresa.. b) Su desviación típica.I. para un 25% de los trabajadores de la empresa . precisamente para aquellos que tengan menor C.I. para ello se debe seleccionar a un grupo de trabajadores con mayor C. c) Si el gerente de la empresa afirma que exactamente la mitad de los 74 9 78 16 82 28 86 45 90 66 94 85 98 72 102 106 110 114 118 122 126 54 38 27 18 11 5 2 trabajadores de la empresa tienen un C. superior al del trabajador Juan. medio de los trabajadores.EJERCICIOS RESUELTOS. ¿Qué C.I.I. deberá tener un trabajador como mínimo para ser considerado dentro de ese grupo de elegidos? e) Se van a preparar unas clases de apoyo en gestión empresarial .I. tiene Juan? d) Supongamos que se desea realizar un estudios sobre mercadotecnia .I. ¿Hasta que trabajador de qué C. pero la empresa solo puede utilizar al 15% de los trabajadores. C. deberemos considerar en estas clases? SOLUCION: La variable de estudio es el cociente intelectual (X) 76 .I fi 70 4 Calcule: a) El C.I. ¿qué C. 9958 1 a) Media x f 1 x1 f 2 x2 .6771 0. Cleto De La Torre Dueñas xi 70 74 78 82 86 90 94 98 102 106 110 114 118 122 126 1470 fi 4 9 16 28 45 66 85 72 54 38 27 18 11 5 2 n=480 fixi 280 666 1248 2296 3870 5940 7990 7056 5508 4028 2970 2052 1298 610 252 46064 fixi2 19600 49284 97344 188272 332820 534600 751060 691488 561816 426968 326700 233928 153164 74420 31752 4473216 Fi 4 13 29 57 102 168 253 325 379 417 444 462 473 478 480 Hi 0.0604 0.8688 0. n xi S2 i 1 x n 2 n fi i 1 fi xi2 n x2 4473216 480 95..0083 0..96 2 110..2125 0.925 0.88 s 110. n=480 ( Par) x Me n 2 x 2 n 1 2 x 480 2 x 2 480 1 2 x 240 2 x 241 94 94 2 94 77 .9854 0.Estadística para la toma de decisiones Dr.7896 0.88 10.0271 0.1188 0.9625 0.35 0.5271 0.96 b) Varianza y desviación.52 c) Mediana. n fkxk 46064 480 95.. d) Percentil 85 P 106 85 e) Percentil 25 P25 90 2) Una empresa contrata los servicios de un corredor de bolsa. SOLUCION: XA 57 55 54 52 62 55 59 394 XB 80 40 62 72 46 80 40 420 78 XA2 3249 3025 2916 2704 3844 3025 3481 22244 x B2 6400 1600 3844 5184 2116 6400 1600 27144 . 2 55 40 3 54 62 4 52 72 5 62 46 6 55 80 7 59 40 a) Halle e interprete la media. Acción 1 A B 57 80 Utilidades en miles de dólares. b) Estadísticamente ¿Cuál de las acciones es más recomendable para la empresa que esta interesado en una mayor utilidad? ¿Cuál de las acciones es más recomendable para la empresa que esta interesado en un menor riesgo de inversión? Fundamente su respuesta. mediana y moda de las utilidades. Los resultados de las utilidades de estas acciones en los últimos 7 meses en miles de dólares esta dado en el cuadro siguiente. para decidir su inversión en una de las dos acciones A y B. 28 MeA MeA MoA xn 2 1 .... n xB x1 x 2 . 79 . para n impar n=7 xn 2 1 x7 2 1 x4 55 55 Estadísticos de B.. para n impar n=7 xn 2 1 x7 2 1 x4 62 40 MoB 2 80 b) Calcular la varianza n xi 2 SA i 1 x 2 n xi2 i 1 n n 2 xA 22244 (56.28 2 n 0..057 xi2 2 SB i 1 i 1 n S | XB | n 277..277 La información se ilustra en el grafico siguiente.28) 2 7 10..7 CVB 0.7 60 2 xB 27144 7 602 277..Estadística para la toma de decisiones Dr.27 56. xn n xi i 1 n 394 7 56. Cleto De La Torre Dueñas a) Estadísticos de A.27 CVA n S | XA | xi x 10. n xA x1 x 2 . xn n xi i 1 n 420 7 60 MeB MeB MoB1 xn 2 1 . 3> [3.00 40. [0..00 50. 7> [7. 5> [5. 2> [2. la desviación típica y coeficiente de variación. 8> [8.00 70.00 Utilidad 60. 1> [1.00 A B Acción 3. varianza. se selecciono aleatoriamente a 24 trabajadores. 9> Número de trabajadores 2 2 3 6 7 1 1 1 1 a) Halla la media. 4> [4.80. 6> [6.Con el fin de realizar un estudio sobre las retenciones económicas de quinta categoría a los trabajadores de una empresa. 80 . obteniéndose las siguientes cantidades de retención económica en cientos de soles. Retención Económica. 5 7. 6> [6. fi mi x n 92 24 fi 2 2 3 6 7 1 1 1 1 24 mi 0.66 Desviación.5 4.5 5.83 Varianza.Estadística para la toma de decisiones Dr.5 5.25 72.66 1.5 18. desviación y coeficiente de variación.91 3. CV 3. 4> [4. mi2 fi S2 n x2 440 24 3.5 141.5 8. 5> [5.5 92 mi2fi 0.25 56.83 3. SOLUCION: I [0.83 0.5 1.833 6 81 .25 440 Fi 2 4 7 13 20 21 22 23 24 a) Media.5 21 31. s Coeficiente de Variación.25 42.5 40.5 4.5 mifi 1 3 7.5 2. varianza. Cleto De La Torre Dueñas b) Mediana c) Moda.91 S |X| 1.75 73.75 30.5 3. 1> [1.5 6.5 8. 7> [7. 9> Total Media.5 7. 8> [8.498 Mediana Me 3 12 7 *1 3. 3> [3. 3. 2> [2.5 6. 5 124 38 587 mi2fi 62.5 7.14 a. 0-5 5-10 10-13 13-18 18-20 10 15 25 8 2 Nro de administradores riesgo de inversión . Nivel de conocimientos de riesgo de inversion. SOLUCION: Intervalo 0-5 5 -10 10-13 13-18 18-20 fi. P10 y P90 d) Coeficiente de curtosis y de asimetría. varianza y la desviación. a) Calcule la media.5 843.5 287.25 1922 722 6856. Q3.75 3306.5 11. b) Determine la mediana y la moda c) Determine e interprete Q1. 10 15 25 8 2 60 82 Fi 10 25 50 58 60 mi 2. respecto a obteniendo los siguientes resultados.Moda Mo Li 1 A 1 2 1 7 6 1 1 7 1 6 Mo 4 1 1 6 *1 4.5 . El colegio de administradores aplico un test de conocimientos en una escala de 0 a 20 a 60 profesionales del área.5 19 56 mifi 25 112.5 15. 63 4.782 18.5 60 9.11 10 17 c) Determine e interprete Q1.Estadística para la toma de decisiones Dr.31 b) Mediana y moda Mediana Me Li n Fk 2 fK 1 A Determinamos n 2 60 2 30 Me Li n Fk 2 fK 1 A 10 30 25 3 10. Cleto De La Torre Dueñas a) Media y varianza Media. mi2 fi S 2 n x2 6856. Q3. P10 y P90 83 . fi mi x n 587 60 9.6 25 Moda Mo Li 1 A 1 2 1 25 15 10 1 25 8 17 Mo Li 1 A 10 1 2 10 3 11.78 Varianza.63 Desviación: s 18. Pi Li i.n Fk 4 fK 1 A 10 45 25 3 12.4. Qi Li i.n Fk 100 fK 1 A Percentil 10 P 10 Li 10.n Fk 4 fK 1 A Cuartil 1 Q1 Li 1.n Fk 4 fK 1 A 5 15 10 5 6. Para obtener los cuarteles se tiene la relación.4 25 El nivel de conocimientos máximo de riesgo de inversión del 75% de los administradores es de 12.  Para obtener los percentiles se tiene la relación.67 Cuartil 3 Q3 Li 3.n Fk 100 fK 1 A 0 6 0 5 3 10 El 10% de los administradores tienen nivel de conocimientos de riesgo de inversión entre 0 a 3 84 .67 15 El 25% de los administradores presentan nivel de conocimientos de riesgo de inversión a 6. 11 -0.5 3 Si k 0 .5 8 d) Coeficiente de Asimetría. 40[ [40.5 -0. 7 8 10 20 5 [0. mediana y moda.78 11. Varianza. Las utilidades de empresas dedicadas al rubro de alimentos.n Fk 100 fK 1 A 13 54 50 5 15.31 Puesto que Ap < 0  la distribución es asimétrica negativa o a izquierdas (desplazada hacia la izquierda). Cuartel 1. Ap x Mo s 9. Coeficiente de curtosis de fisher.Estadística para la toma de decisiones Dr. entonces la distribución es platicúrtica.67 0. en una región del país presenta el siguiente comportamiento: Utilidades en miles de soles. Decil 6 y Percentil 85.308 4. EJERCICIOS PROPUESTOS 1.70[ [70. Cleto De La Torre Dueñas Percentil 90 P90 Li 90. coeficiente de variación. K Q3 Q1 P90 P 10 0.110[ [110. Número de empresas Calcule e interprete: La media aritmética.0416 15.120] 85 .5 12.4 6. 90[ [90. 4. Una empresa constructora tiene 2 secciones A y B. ¿ Puede admitirse que el porcentaje de deudas de las empresas es independiente de su antigüedad?.2. con los siguientes resultados: Deudas 0-15 15-30 30-50 50-70 Empresas antiguas 19 13 7 4 Empresas Nuevas 29 10 11 32 En base a los resultados. a) El Sindicato se declara satisfecho en sus negociaciones si el sueldo promedio final aumenta por lo menos en un 20% respecto de su valor actual. ¿Se logra esto aceptando la proposición del Directorio? Justifique su respuesta. b) El Sindicato pretende con su proposición aumentar la homogeneidad de los sueldos de sus afiliados ¿Se logra este objetivo aceptando la proposición del Directorio? Fundamente su respuesta. el sindicato solicita un reajuste de 25% más un incentivo de 10 dólares. Las distribuciones de ingresos diarios de sus empleados son los siguientes: 86 .Una muestra de pequeñas empresas se clasifica en función de su antigüedad en el mercado y del porcentaje de deudas sobre el capital que presentan.. c) Si en la Empresa laboran 500 funcionarios ¿En qué porcentaje aumentó la planilla de sueldos respecto a la planilla inicial?. 3.En una empresa donde los salarios tienen una media de 700 dólares y una desviación estándar de 150 dólares. Fundamente su respuesta. El Directorio acoge parcialmente la petición rebajando los salarios solicitados en un 10%. FIVENEZ presentaba tasas de retorno a lo largo de ese período de 12.Estadística para la toma de decisiones Dr. Hace poco el consultor estaba interesado en las tasas de rendimiento que habían ofrecido dos fondos de inversión diferentes a lo largo de los 5 últimos años. mientras que Corporación Dinámica había producido 13. 5. Cleto De La Torre Dueñas Sección A Ingresos ($) 80-100) 100-120) 120-140) 140-160) 160-180) 180-200) Frecuencia 30 80 40 10 4 1 Sección B Ingresos ($) 60-90) 90-120) 120-150) 150-180) 180-210) 210-240) 240-270) Frecuencia 10 20 50 20 15 10 4 Calcular la media aritmética y varianza de la sección A y B. 10. ellos deberá elegir el consultor para su cliente? ¿Cuál de 87 .9 y 11%. Un cliente se puso en contacto con el consultor expresó su interés por uno de estos fondos de inversión. 13. 12. Un consultor de una empresa de planificación financiera que asesora a quienes quieren establecer sus carteras de inversión personales. 10. y 6%. Compare los ingresos. 14. Fábrica A Fábrica B Sueldo 45 – 55) 55 – 65) 65 – 75) 75 – 85) 85 – 95) fi 18 24 26 20 12 sueldo 45 – 55) 55 – 65) 65 – 75) 75 – 85) 85 – 95) fi 12 28 30 22 8 a) ¿En cuál fábrica hay mayor dispersión relativa? b) Un obrero que gana 140 mensuales. ¿Dónde estaría mejor remunerado con respecto a sus compañeros? c) ¿Cuál de las dos distribuciones es más simétrica? 88 .6.En las siguientes tablas se registran los sueldos quincenales (en dolares) de 50 obreros de dos fábricas.. obtenemos. observaciones del tipo (xi. . esta forma de presentaciones se denomina tablas de contingencia.1 CUALITATIVA-CUALITATIVA. Cuando las variables de estudio son cualitativas (categóricas) o cuantitativas discretas con poca modalidades. . yi). X e Y. El análisis de la relación de dos variables. Dada una variable bidimensional ( X. se cumple k l fij i 1 j 1 n 89 . . yj) es el número de veces que dicho valor aparece en la muestra. Cleto De La Torre Dueñas CAPITULO IV DISTRIBUCIONES BIDIMENSIONALES Si resumir la información de una variable es de por si interesante. consideramos una muestra de tamaño n en la que X toma k valores distintos. mediante pares ordenados (xi. La frecuencia absoluta de un valor (xi. xk. Y ). . Se representa por fij . 4. yl. . yj). e Y toma l valores distintos. x1.Estadística para la toma de decisiones Dr. y1. . por tanto. . Las tablas de contingencia son de doble entrada organizada por filas y columnas y donde se presenta la distribución de frecuencias conjuntas de las dos variables. en investigación lo es mucho más el poner de manifiesto la posible relación entre dos de ellas. depende del tipo de variables y Según sean los tipos de cada una de ellas se usa técnicas estadísticas diferentes. se suele presentar las observaciones de las variables X e Y. f1l f2l .. . j n Una tabla de doble entrada de una variable bidimensional sigue la estructura que se presenta a continuación.. Y X x1 x2 . f. .. Frecuencia absoluta marginal de xi. III y IV).. . j f.La frecuencia relativa de un valor (xi. yl ni. fkl f. . Puede ser de frecuencias absolutas o relativas.... f1 j fi .El gerente de ventas de la firma A desea determinar el comportamiento de las ventas de cuatro productos (I.. . f12 f22 .. h.2 ... en la que tienen cabida las frecuencias marginales (representadas en la última fila y última columna).. j hi . fk2 f. se representa por hij hij fij .. fk.. II. fi1 fi 2  fil l fij j 1 Frecuencia relativa marginal de xi. fi..l f1.. n y1 y2 ...... n se cumple: k l hij i 1 j 1 1 Distribuciones marginales Nos indican el comportamiento aislado de cada una de las variables X e Y que dan lugar a una variable bidimensional.j fk1 f.. yj) es el cociente de la frecuencia absoluta fij entre el tamaño de la muestra n.. xk n... 1. n f 2 j  f kj k fij i 1 Frecuencia relativa marginal de yj... en función de la clase de clientes 90 .1 f11 f21 . Ejemplos. Frecuencia absoluta marginal de yj.. f2... Cleto De La Torre Dueñas clasificados en cuatro grupos.0% 91 .0% 315 100.0% 130 13.5% 15 13.0% III 55 34.1% 215 21.2% 30 9.8% 130 41.5% Total 160 100.Estadística para la toma de decisiones Dr.0% 80 19.0% 1000 100.0% 410 100.8% 155 37. Una muestra aleatoria de las ventas suministro la siguiente información. Grupo de clientes Profesionales Comerciantes Obreros Amas de casa I 30 155 130 35 II 35 50 30 15 Producto III 55 125 105 20 IV 40 80 50 45 ¿Las ventas de los cuatro grupos son homogéneas? Solución Producto Grupo de clientes Profesionales Comerciantes Obreros Ama de casa Total I Frecuencia Porcentaje Frecuencia Porcentaje Frecuencia Porcentaje Frecuencia Porcentaje Frecuencia Porcentaje 30 18.0% 115 100.0% II 35 21.5% 50 15.5% 105 33.4% 305 30.4% 350 35.3% 35 30.9% 50 12.3% 20 17.9% 45 39.4% 125 30.5% IV 40 25. es decir que. por ejemplo en un experimento donde hacemos mediciones numéricas en dos o más grupos. Los siguientes datos muestran las tasas de rendimiento utilizando 3 diferentes niveles de apalancamiento financiero y un nivel de control (deuda cero) de empresas seleccionadas al azar: 92 .160 140 120 100 80 60 40 20 0 Profesionales Comerciantes Obreros Amas de casa I II III IV 4. en cada una de las muestras y se comparamos los Ejemplo La estructura financiera de una firma se refiere a la forma en que se dividen los activos de la empresa por debe y haber. Supongamos que tenemos datos numéricos para varias categorías. lo que se realiza es un estudio descriptivo de la variable numérica resultados. En un estudio financiero se afirma que el apalancamiento financiero puede utilizarse para aumentar la tasa de rendimiento sobre la inversión.2 CUALITATIVA-CUANTITATIVA. y el apalancamiento financiero se refiere al porcentaje de activos financiados por deuda. En estos casos. los accionistas pueden recibir rendimientos más altos con la misma cantidad de inversión gracias a su uso. 8 4.05 37. alto y control diferentes? Solución.07 Variance CoefVar Median 25.6 Bajo 2 7.840 7.4 1. medio.200 6. Cleto De La Torre Dueñas Tasas de Rendimiento Control 4.18 4.2 1.8 5.2 4 Medio 7 4.900 3.6 2 6.05 61.8 3.80 55.9 6.2 11 ¿Son las tasas medias de rendimiento en los niveles de apalancamiento financiero bajo.468 7.20 4.8 Alto 7.6 6 6.04 12 10 Tasas de rendimiento 8 6 4 2 Alto Bajo Control Nivel de apalancamiento Medio 93 . Nivel de Apalancamiento Mean Alto Bajo Control Medio 8.68 3.Estadística para la toma de decisiones Dr.8 9.56 7.140 3.13 4.158 5.5 11. y si es negativa. hay asociación lineal positiva. y) sxy fi xi yi n x. La forma mas sencilla de estudiar la posible asociación entre estas variables es el diagrama de dispersión (Nube de puntos). entonces el interés ahora será el análisis de regresión. Análisis de dos variables cuantitativas y establecimiento de una relación entre ellas. no nos permite cuantificar el grado de asociación lineal ni comparar la 94 . no existe relación entre las variables o si existe es marcadamente no lineal. Media y varianza La información de las dos variables X e Y se puede resumir usando la media y la varianza como se muestra a continuación: Media de la variable X: Media de la variable Y: Varianza de la variable X: s 2 x x fi xi n y fi yi n fi xi2 n fi yi2 n x 2 2 Varianza de la variable Y: s y y 2 La covarianza Es una medida de la asociación lineal existente entre dos variables. Si reconocemos una tendencia. hay asociación lineal negativa. y Si la covarianza está muy próxima a cero. Sin embargo. si es positiva.4. como la covarianza depende de las unidades de medida de las variables.3 CUANTITATIVA-CUANTITATIVA. Resume la información contenida en el diagrama de dispersión. Presenta la siguiente expresión: cov( x. La correlación es tanto más fuerte a medida que r se aproxima a –1 ó 1 y es tanto más débil a medida que se aproxima a 0. Si r = -1 ó r = 1 todos los valores de la variable bidimensional se encuentran situados sobre una recta. Si 0 < r < 1 la correlación es positiva. La correlación es negativa. Para dar solución a este problema se obtiene el coeficiente de correlación. llamadas predictoras. Las variables X e Y están también en dependencia aleatoria. Regresión: conjunto de técnicas que son usadas para establecer una relación entre una variable cuantitativa llamada variable dependiente y una o más variables independientes. sin embargo algunas de ellas podrían ser cualitativas.s y dependencia aleatoria. Se mide mediante la siguiente fórmula: Su valor está comprendido entre – 1 y 1. Análisis de Regresión. Es un número que mide el grado de dependencia entre las variables X e Y. Cleto De La Torre Dueñas asociación existente entre distintos pares de variables. Ecuación que representa la relación entre las variables Y X Estimación de la línea de regresión usando Mínimos Cuadrados 95 . Modelo de regresión. Correlación. Estudia la relación o dependencia que existe entre dos variables que intervienen en una distribución bidimensional. Estas también deberían ser cuantitativas.Estadística para la toma de decisiones Dr. Coeficiente de correlación lineal. Si – 1< r < 0 se dice que las variables X e Y están también en r s xy s x . 4 12. ˆ A partir de la recta Y ˆ ˆ X podemos calcular los valores de y conocidos los de x. X 14. La fiabilidad que podemos conceder a los cálculos obtenidos viene dada por el coeficiente de correlación: si r es muy pequeño no tiene sentido realizar ningún tipo de estimaciones.8 15. Si r es próximo a – 1 ó 1.2 13.4 12 16 12.7 16 12.3 13.33 Trace un diagrama de dispersión.67 15. Se realizo un estudio sobre el conocimiento(X) y aplicación (Y) del software para la toma de decisiones. i 1 ei2 i 1 ( yi n xi )2 n n ˆ n i 1 xi yi n i 1 n xi i 1 yi S xy S xx n i 1 xi2 ( i 1 xi ) 2 ˆ y ˆx La pendiente ˆ . Ejemplos 1. 96 .4 12 15. Ajuste una recta de regresión.8 13.4 12. El intercepto ˆ .7 a) b) c) 14. Sin embargo carece de interpretación práctica si es irrazonable pensar que el rango de valores de x incluye a cero.2 14 14. indica el valor promedio de la variable de respuesta cuando la variable predictora vale 0. Si r = 1 o r = -1. las estimaciones realizadas estarán cerca de los valores reales.3 16 13.3 12.4 14.2 16.Se debe Minimizar el error cuadrático medio: n n Q . las estimaciones realizadas coincidirán con los valores reales.8 14 14.4 14.3 13.2 Y 14 14. Calcule la correlación lineal e interprete dicho valor. La información se muestra a continuación. indica el cambio promedio en la variable de respuesta cuando la variable predictora aumenta en una unidad adicional.7 15. 36 231.24 268.8 175.62 191.8801 97 . Cleto De La Torre Dueñas Solución: Scatterplot of Y vs X 16 15 14 Y 13 12 12 13 14 X 15 16 17 Resumen de calculos.8 13.208 X2 219.67 12 16 12.67 15.4 14.612 148.04 174.04 231.2 222.5289 235.6 Y 14 14.8 14 14.752 236.0089 256 177.Estadística para la toma de decisiones Dr.33 12.24 Y2 196 215.33 13.33 16 13.2 13.108 236.2089 144 256 160.4 14.76 219.36 153.33 12 209.38 220.04 207.33 X.4 12.5289 235.67 16 12.24 196 207.76 3058.5289 256 160.33 13.4 213.36 219.6889 144 2951.2 16.984 172. X 14.244 214.Y 207.956 218.8 15.8 243.2 14.96 153.67 15.6889 160.04 174.952 157.2 14 14.4 12.0089 177.8 2992.6889 177.04 196 207.4 15.8 177.2 167. 62 X r sxy sx . 98 .6 14.24 .96 0. Hace una encuesta en un grupo de firmas que tienen distintas cantidades de activos y las divide en tres grupos.69 1.11. Un asesor financiero quiere conocer las diferencias en la estructura de capital de varios tamaños de empresas en cierta industria.69 15 2 sy y 2 sxy xi yi N x.13 0.11 15 2951.96 .11 0.(13. y Recta de regresión n n n ˆ n i 1 xi yi n i 1 n xi i 1 yi 2 S xy S 2 x n i 1 x 2 i ( i 1 xi ) 0. 15 2992.88 13. 1.47 Ejercicios propuestos.91 .x y 2 sx xi N yi N xi2 N yi2 N 213.242 1. 15 209.96) 0.962 1.24). 1.33 13.208 (14.62(14.13 ˆX 5. Clasifica cada una según. 15 x 2 3058. que su deuda sea mayor o menor que el capital contable de los accionistas.91 0.s y 0. A continuación se dan los resultados de una encuesta.24 14.69 1.62 ˆ ˆ Y y ˆ ˆ x 13.24) 5. 2 21. Cleto De La Torre Dueñas Deuda Tamaño de activos de la firma (En miles de dólares) <500 500-2000 10 >2000 8 Total 25 < que el capital social > que el capital social Total 7 10 18 9 37 17 28 17 62 ¿Se puede concluir que las empresas tienen idéntica estructura de capital? 2. 3. Estimar la ecuación. Prediga el gasto general cuando se produce 50 unidades. b.5 27.2 5.Estadística para la toma de decisiones Dr. b) Que acción debería aconsejar el especialista a la empresa que prefieren menos riesgo.8 3.7 5. 4. 99 .6 6.0 4. La gerencia de la empresa ha reunido información sobre esos gastos y las unidades producidas en diferentes plantas.1 12. con frecuencia se trata de estimar los gastos indirectos basándose en el número de unidades producidas. Sus registros muestran que las tasas de rendimiento ( en porcentajes) de dos acciones para 8 meses seleccionados fueron de : Acciones A Acciones B 15. es decir 2000 el índice es 100. Sea Y el índice de precios al consumidor.2 4.5 3. Un especialista trabaja como corredor de bolsa para una empresa. si el interés es tener un rendimiento mas alto.2 12 a) En que acción invertiría la empresa.2 7.5 4. Gastos indirectos Unidades 40 42 53 35 56 39 48 30 37 40 191 170 272 155 280 173 234 116 153 178 a. tomado como base el año 1990.2 7. En la contabilidad de costos.5 2. 50 6.15 7.80 6.2 2006 128 2007 132.95 7.25 6.75 7.57? 5.20 7.3 2005 125.Año Y 2001 106 2002 111.75 6.00 7.10 6.75 6.90 6. Civil 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 24 25 26 27 27 27 27 25 23 24 26 29 25 31 26 24 26 28 25 29 F M M F M F M F M M F F M F M F F F M M C C S C D C S C S S C D C D S D C S C C 100 Inglés Sueldo A M B B A M A B B B M M A A B M B M B M 6. Una gran compañía llevó a cabo un estudio para ubicar las variables que pudieran determinar el sueldo de un egresado universitario dos años después de haberse graduado como Técnico Superior Universitario en un área Administrativa.95 6. Los datos recogidos se presentan en la siguiente tabla: (La columna del sueldo es en cientos de miles).1 2003 117.50 7. Edad Sexo E.2 2004 121.80 7.6 Predecir el índice de precios para el año 2008 ¿En que año podemos esperar que el índice de precios sea de 150.10 .80 6.90 6.40 6.70 6. x2 3630.4 5. si se produce un aumento del 20% en los salarios.0 101 . xy 2731. Cleto De La Torre Dueñas - Utilice la técnica de estadística descriptiva más apropiada para analizar cada variable individualmente.4 750 7.01 a) Calcular la recta de ajuste e interpretar las componentes en función del problema b) ¿Qué porcentaje del análisis queda explicado por la recta de regresión? Que podría Ud.Estadística para la toma de decisiones Dr.82.89. Al reunir datos sobre volumen y costo y aplicar el método de mínimos cuadrados para determinar la ecuación de regresión donde se relacionan estas variables. un contador puede estimar el costo asociado con determinada operación de manufactura. Volumen de producción (unidades) : 400 450 550 600 700 Costo total (en miles de $) :4 5. y 126. ¿cuál seria la(s) características que usted debería tomar en consideración para obtener el sueldo al que usted aspiraría al egresar? 6. Se desea estudiar la relación entre los aumentos de precios y los salarios en 8 empresas tomadas al azar. tal que se define “x: % de aumento de salarios” e “y: % de aumento de precios” x 169. Interprete lo obtenido. y2 2498.0 5.3. Se obtuvo la siguiente muestra de volúmenes de producción y costo total para una operación de manufactura. Decir al respecto? c) Estimar el porcentaje de aumento en los precios.9. es lógico estimar dado el resultado obtenido en b) ? 7. - Como futuro Técnico Superior en el área Administrativa.9 6. - Realice diagramas de cajas que le ayuden a visualizar como influye cada una de las variables en el sueldo que gana el individuo. Una aplicación importante del análisis de regresión en contabilidad es para estimar costos. c) El programa de producción de la empresa indica que el mes próximo se deben producir 500 unidades.2 7.7 8.6 3. en función del problema.6 4.3 4 4. Interprete el significado de las componentes de la recta. (c) Calcule e interprete el error estándar de la estimación. b) Calcular el coeficiente de determinación. se le dan los siguientes datos de antecedentes sobre el suministro de dinero y el producto nacional bruto (ambos en millones de dólares): Suministro de dinero 2 2. Suponga que usted tiene a su cargo el dinero de la región de Piedmont.a) Estimar la ecuación de regresión con la que se pueda predecir el costo total para determinado volumen de producción. Comentar su resultado en función de las variables en estudio.7 10 (a) Desarrolle la ecuación de estimación para predecir el PNB del suministro de dinero.5 3.8 5 Producto Nacional Bruto 5 5. ¿Cual será el costo total estimado para esta operación? 8.2 4. 102 .5 6 7 7.4 9 9.2 3. (b) ¿Cómo interpreta la pendiente de la línea de regresión?. 5. Repeticiones en situaciones análogas pueden dar resultados diferentes. El objetivo de la probabilidad es cuantificar las posibilidades que tengan ciertos eventos inciertos.1 EXPERIMENTO ALEATORIO. esto significa que es imposible predecir los resultados porque hay más de uno posible. cuya característica fundamental es la incertidumbre del resultado. En nuestra vida cotidiana asociamos usualmente el concepto de probabilidad a su calificativo probable. Es una acción que da lugar a resultados identificables y se caracteriza por:   Todos los posibles resultados son conocidos previamente. 103 . considerando probable a aquellos eventos en los que tenemos alto grado de creencia en su ocurrencia. Cleto De La Torre Dueñas CAPITULO V PROBABILIDADES El Cálculo de Probabilidades se ocupa de estudiar ciertos experimentos que se denominan aleatorios. En esta línea probabilidad es un concepto asociado a una medida del azar.Estadística para la toma de decisiones Dr.  Lo s eventos elementales solo tienen un punto muestral. por depender de la suerte o del azar. No se puede predecir el resultado del mismo antes de realizarlo. Los experimentos pueden ser aleatorios o deterministas. es decir. es aquel que ocurre siempre al realizar el experimento. 104 . Aleatorio significa relativo a todo acontecimiento incierto. no se sabe cuál de los posibles resultados aparecerá al final. El evento A los dos eventos ocurre. Espacio muestral. Es el conjunto de todos los resultados posibles del experimento y se denota por . mientras que los deterministas son aquellos que se caracterizan por el hecho de que las mismas causas producen los mismos efectos. A cada elemento de se denomina punto muestral w . esta dado por todo los puntos muestrales que no están en A 5. Un evento aleatorio es un subconjunto del espacio muestral y se denota con letras mayúsculas.  El evento seguro  El evento imposible . El evento A B ocurre cuando ambos eventos ocurren simultáneamente.  El evento complementario Ac . Intersección de eventos: Dados dos eventos A y B de un mismo espacio muestral su intersección se representa por A B y es el evento que contiene los elementos que están en A y B al mismo tiempo.2 OPERACIONES DE EVENTOS. Evento o Suceso Aleatorio. es aquel que no ocurre nunca. . es decir: w / w es un punto muestral . Unión de eventos: Dados dos eventos A y B de un mismo espacio muestral su unión se representa por A B y es el evento que contiene los elementos B ocurre si al menos uno de que están en A o en B o en ambos. .. An p A1 p A2 ...Estadística para la toma de decisiones Dr. Cleto De La Torre Dueñas Evento Complemento: El complemento de un evento A se representa por Ac y es el evento que contiene todos los elementos que no están en A.3 DEFINICIÓN CLÁSICA DE PROBABILIDAD: La probabilidad de un suceso A se calcula como el número de casos favorables al suceso A... partido por el número de casos posibles del experimento aleatorio. vi) Si A vii) P( A \ B) p( A) p( B) P( A) P( A B) . p A B p A p B Como consecuencia de estos tres axiomas. El evento Ac ocurre si A no ocurre.. A. P: A i) 0 ii) p y que verifica: p(A) p( A) 1 un número A 1 iii) Si A y B son sucesos incompatibles.B viii) Si A 1 . se verifican además las siguientes propiedades: iv) v) p( Ac ) 1 p A p( ) 0 B. entonces p A1 ix) Si A. .4 DEFINICIÓN AXIOMÁTICA DE PROBABILIDAD.. p An son dos sucesos cualesquiera. B A2 . La probabilidad es una función que asigna a cada suceso A real que varia entre 0 a 1.. A n son incompatibles dos a dos. A 2 . p( A) casos favorables casos posibles 5. entonces 105 . . 5. En general. Ak) P( Ai ) P( Aj ) P( Ak ) si i k y así sucesivamente. Queremos estudiar como cambia la probabilidad de ocurrencia de A cuando se conoce que otro evento B ha ocurrido. Aj. B p( A) se dicen independientes si: p( A | B) . o bien p( B) p( B | A) Es decir. A2. la denotamos por P(A|B) P( A | B) P( A B) . Decimos que n sucesos A1. entonces A y B C son independientes. En consecuencia. y A C y B C son independientes. p(A B) =p( A) p( B ) A Independencia. An son independientes si para cada par (Ai. entonces Bc p A B 5. P(B) P( B) 0. B p( A) p A p A p B p A B son dos sucesos cualesquiera. P( A1 A2  An) P( A1) P( A2) P( An) 106 . p( A) Si A y B son independientes. P( Ai P( Ai Aj Ak ) Aj ) P( Ai ) P( Aj ) si i j j . se cumplirá que: p( A B) p( B). A C y B son independientes.5 PROBABILIDAD CONDICIONADA. si para cada trío (Ai.p A B x) Si A. Observación. En este caso habria que referirse a la probabilidad de A condicionada a B como la probabilidad de que ocurra A sabiendo que ha ocurrido B. Dos sucesos A. Aj). .. ...... ... forman una partición de un espacio muestral y su unión es ... La probabilidad de un suceso B cualquiera es: n p ( B) i 1 p( Ai) p( B | Ai) p ( B) p( A1 ) p( B A1 ) p( A2 ) p( B A2 ) .. que los eventos Ai son mutuamente excluyentes A1 A2 … An Si A 1 . A n son un sistema completo de sucesos tal que : i) A1  A2 ii)  Ai n i j ( disjuntos dos a dos) i 1 iii) p( Ai ) 0 . A se verifica: P( A1 A2  An) P( A1) P( A2 | A1) P( A3 | A1 A2) P( An | A1 A2  An 1) Teorema de la probabilidad total.. A3. A 2 ... Las probabilidades apriori o previas se conocen antes de obtener información 107 . An.. esto es. a partir de probabilidades previas..n .. . A2.Estadística para la toma de decisiones Dr... Cleto De La Torre Dueñas Teorema de la probabilidad compuesta.. se llama regla Bayesiana.... Dados n sucesos A 1 ... p( An ) p( B An ) Teorema de Bayes.. A 2 . i 1... El procedimiento que se utiliza para encontrar probabilidades posteriores. Si suponemos que los eventos A1. ... . 1) SUNAT realiza un estudio respecto a tres cuentas de una empresa para confirmar o descartar la presencia de irregularidades en el sistema de cobro de impuestos. Si A 1 . a) Cual es el espacio muestral. ¿Cuál es la probabilidad de que fue generado por el evento A1 (que es una causa posible ) o por el A2 (otra causa posible)?. A 2 . i = 1. p( An ) p( B ) A2 An Problemas Resueltos. si el evento B ha ocurrido.... i 1. p( Ai ) p( B | Ai) 1 p( Ai | B) p( A1 ) p( B A1 ) p( Ai ) p( B | Ai) p( A2 ) p( B ) . Esto es. .. 108 . El teorema de Bayes consiste en un método para encontrar la probabilidad de una causa específica cuando se observa un efecto particular.n ..alguna del experimento en cuestión. Las probabilidades aposteriori se determinan después de conocer los resultados del experimento... entonces para un suceso B cualquiera se verifica: p( Ai | B) p( Ai B) p( B) p( Ai) p( B | Ai) n i .... n....... A n son un sistema completo de sucesos tal que p( Ai ) 0 ... N1P N3 . D PP N3 . PN2 P . PN2 P . N1N2 N3 1 2 1 2 3 1 1 3 2 3 2 3 b) Sea el evento A: Se presenta dos irregularidades A PP N3 . PP P . N1P P 1 2 1 3 2 3 p( A) n( A) n( ) 3 8 c) Sea el evento B: Primera cuenta presenta irregularidades y el último no presenta. N1P N3 . Cleto De La Torre Dueñas b) ¿Cual es la probabilidad de que dos de las cuentas irregularidades. d) Cual es la probabilidad de irregularidades Solución. N1N2 P 1 2 1 2 3 1 1 3 2 3 2 3 p( D) n( D ) n( ) 7 8 2) Un administrador de empresas con el propósito de incrementar sus utilidades. N1P P . PN2 N3 . C PP N3 . PN2 P . si la cuenta no presente irregulardades. PP P . N1N2 P . de estas en el 1% de los casos no se presentan incrementos en las utilidades. En el 40% de las sucursales. presente c) Cual es la probabilidad de que la primera cuenta presente irregularidades y la ultima no presente irregularidades. a) que por lo menos una cuenta presente PP N3 . B y C. Denotemos con P. En el resto de las 109 . diseña tres estrategias de marketing A. en el 30% de las sucursales se aplica la estrategia B y en el 2% no se presentan incrementos en las utilidades.Estadística para la toma de decisiones Dr. si la cuenta presenta irregularidades y con N. se aplica la estrategia A . PN2 N3 . N1P P . PN2 N3 1 2 1 p(C ) n(C ) n( ) 2 8 d) Sea el evento D: Por lo menos una cuenta presenta irregularidades. La filial haya empleado la estrategia C. observándose que en el 3% de las mismas no se presentan incrementos en las utilidades.02) 0. Si se selecciona aleatoriamente una filial de la empresa.3*(0. Cual es la probabilidad de que : a) b) c) No presente incrementos en las utilidades.01) 0.019 1. aplica la estrategia A B: La filial de la empresa . No presente incrementos en la utilidad y se haya aplicada la estrategia B. a) p( D) p( A) p( D ) A p( B) p( D ) B p(C ) p( D ) C p( D) 0.3*(0.006 0. A: La filial de la empresa.filiales se utiliza la estrategia C.9% b) p(B D) =p( B) p( D ) B D) =0. aplica la estrategia C D: No se presenta incrementos en la utilidad. aplica la estrategia B C: La filial de la empresa .03) 0.02) 0.4*(0. dado que no se presento incremento en su utilidad. Solución No incrementa 1% 99% A 40% 2% Estrategia 30% 98% B 3% 30% C 97% Incrementa Incrementa No incrementa Incrementa No incrementa Sean los eventos.3*(0.6% p(B 110 . ¿ Cual es la probabilidad de que la empresa pertenezca a la categoría B?.3% 3) Los siguientes datos pertenecen a 50 comercios de la ciudad de Cusco divididos en 3 categorías y clasificados según el pago de deudas bancarias. E: Pago de deudas al día.01) 0.03) 0. Cleto De La Torre Dueñas c) p(C | D) p(C | D) p(C D) p ( D) p( A) p( D | A) p(C ) p( D | C ) p( B) p( D | B) p(C ) p( D | C ) 0.6 B) n( A) n( ) n( B ) n( ) n( A B ) n( ) 16 14 50 50 111 .Estadística para la toma de decisiones Dr.03) 0.473 47. C: Comercio pertenece a la categoría C. Sean los eventos: A: Comercio pertenece a la categoría A. Pago de deudas bancarias Al día En mora A 7 9 CATEGORIAS B 6 8 C 12 8 Si se elige un comercio al azar ¿cuál es la probabilidad de que: a) esté en mora? b) pertenezca a la categoría A o B? c) pertenezca a la categoría C o esté en mora? d) pertenezca a la categoría A y esté en mora? e) Dado que el pago de sus deudas bancarias esta al día.02) 0.3*(0.3*(0.3*(0. a) p( D) b) p( A p( A B) n( D ) n( ) B) 25 50 0.4*(0. D: Pago deudas bancarias en mora. B: Comercio pertenece a la categoría B. Solucion.5 p( B) 0 50 p( A) p( A 30 50 0. 18 e) P ( B | E ) n( B E ) n( ) n( E ) n( ) n( B E ) n( E ) 8 25 4) Se hizo una auditoria a tres empresas A. 2 cuentas de la empresa B y 5 cuentas de la empresa C. para tal efecto se analiza 3 cuentas de la empresa A. 112 . y C.74 D) n(C ) n( ) n( D ) n( ) n(C D) n( ) 25 8 50 50 d) p( A D) n( A D ) n( ) P( B E ) P( E ) 9 50 0. ¿Cuál es la probabilidad de que se trate de la empresa C? Solución Sean los eventos A: Cuentas de la s empresa A. B: Cuentas de la s empresa B. C: Cuentas de la s empresa C. Se analiza una cuenta aleatoriamente y se encuentra que hay irregularidades. que se presente en B es de 2/3 y que se presente en C es de 1/7. B. La probabilidad de que se presenten irregularidades en las cuentas de la empresa A es de 1/3.c) p(C p(C D) D) 20 50 p(C ) p ( D) 37 50 p(C 0. E: La cuenta presenta irregularidades. 20% se le sugiere que paguen vía telefónica y al restante 10% se le envía una carta.65 respectivamente. al revisar una factura del segundo grupo tenga un error? 2. ella sabe que 70% de los deudores son visitados personalmente. ¿Cuál es la probabilidad de que. Cleto De La Torre Dueñas 1/3 E A 3/10 D 2/3 E 2/10 B D 1/7 C D 5/10 E p(C | E ) p(C E ) p( E ) p( A) p( E | A) p(C ) p( E | C ) p( B) p( E | B) p(C ) p( E | C ) p(C | E ) 3 1 * 10 3 3 1 2 2 5 1 * * * 10 3 10 3 10 7 21 32. De los datos que se tiene registrados. Una corriente de aire hace que las facturas caigan de la mesa y.Estadística para la toma de decisiones Dr..8% 64 Problemas Propuestos. una del primer grupo se confunde en el segundo.-Un auditor tiene sobre su mesa dos grupos de 20 facturas cada uno. 1. La señorita Campos acaba de 113 .75 0. En el primer lote hay dos facturas con errores de cálculo y en el segundo tres.María Campos. y 0. al recogerlas. gerente del departamento de crédito de un banco. Las probabilidades de recibir alguna cantidad de dinero debido a los pagos de una cuenta con estos 3 métodos son 0. sabe que la compañía utiliza 3 métodos para conminar a pagar a las personas con cuentas morosas.60. En un control de recepción de artículos se selecciona una pieza al azar y es defectuosa. siendo defectuoso el 3% de las mismas.. Las restantes piezas provienen del 3er proveedor. Por correo 3. Tiempo Calidad de la escuela 421 Costo o comodidad 393 76 Otros Totales 890 114 . Personalmente b.recibir el pago de una de las cuentas vencidas.. Si U. Motivo Tipo est. V y W cubren respectivamente el 30%. Calcular la probabilidad de que la petición de pago se haya hecho: a. V y W quienes toman productos de la bodega y los ensamblan para la subsiguiente verificación y empaquetado. En una encuesta entre alumnos de maestría en administración se obtuvieron los datos siguientes acerca de “el principal motivo del alumno para solicitar su ingreso a la escuela donde está matriculado”. el 40% y el 30% de todos los pedidos. ¿Cuál es la probabilidad de que si se encuentra un error en un pedido. U comete un error en un pedido (toma un producto equivocado o la cantidad equivocada del producto) una de cada 100 veces. 4. Por teléfono c. el 2do proveedor suministra 30% de las piezas y de ellas es defectuoso el 2%.Una empresa compra cierto tipo de pieza que es suministrada por 3 proveedores: el 45% de las piezas son compradas al 1er proveedor resultando defectuoso el 1%. V comete un error en un pedido 5 veces de cada 100 y W se equivoca tres de cada 100.Una compañía de ventas por correo tiene tres empleados de almacén denominados U. Calcular la probabilidad de que la haya suministrado el 2do proveedor. éste haya sido cometido por V? 5. Si un alumno es de tiempo completo. Sea A el evento en que el alumno es de tiempo completo y sea B el evento que el alumno menciona que la calidad de la escuela es el 1er motivo de su solicitud. Antes de que un libro sea lanzado al mercado se recogen las reacciones de un grupo de personas a las que se les permite leer el libro previamente. ¿Cuál es la probabilidad de que las ventas sean altas? d) Si las ventas son bajas ¿Cual es la probabilidad de que las opiniones hayan sido desfavorables? e) ¿Cuál es la probabilidad de que las opiniones sean favorables y las ventas sean altas? 115 . moderadas o bajas de acuerdo a las noemas del mercado. ¿Cuál es la probabilidad de que la calidad de la institución sea el principal motivo para elegir su escuela?. ¿Cuál es la probabilidad de que la calidad de la escuela sea el motivo para elegirla? c. Cleto De La Torre Dueñas completo Tiempo parcial Totales 400 821 593 986 46 122 1039 1929 a. Si un alumno es de tiempo parcial. ¿Son independientes los eventos A y B?. Los resultados se muestran en la siguiente tabla: Reacciones Ventas Altas Moderadas Bajas 173 88 42 101 211 113 61 70 141 Favorables Neutral Desfavorables a) ¿Cuál es la probabilidad de que las ventas sean altas? b) ¿Cuál es la probabilidad de que las reacciones sean favorables? c) Si la reacción del grupo es favorable?. b. Justifique su respuesta. Posteriormente a las ventas del libro se les asigna el calificativo de altas. 6.Estadística para la toma de decisiones Dr. B y C. Justifique. 7. Compra de productos Frecuencia en las visitas Frecuentes No Frecuentes 0. mientras que los algoritmos B y C son usados el mismo número de veces. Un proceso se puede ejecutar con uno de tres algoritmos posibles.19 0.07 0.f) ¿Cuál es la probabilidad de que las ventas sean favorables o desfavorables?.12 0. d) ¿Cuál es la probabilidad de que un cliente realice compras ocasionales? e) ¿Cuál es la probabilidad de que un cliente no realice nunca compras del producto? f) ¿Cuál es la probabilidad de que un cliente visite el establecimiento frecuentemente o compre el producto regularmente? 8.08 Regular Ocasional Nunca a) ¿Cual es la probabilidad de que un cliente visite frecuentemente el supermercado y compre regularmente el producto alimenticio? b) ¿Cuál es la probabilidad de que un cliente que nunca compra el producto visite el supermercado frecuentemente? c) ¿Son los sucesos “Nunca compra productos alimenticios” y “Visita el mercado frecuentemente” independientes?. En un estudio realizado para un supermercado se clasifican los clientes en aquellos que visitan el establecimiento de una manera frecuente u ocasional y de acuerdo a la frecuencia en que adquieren cierto alimento. En el 20% de los casos se emplea el algoritmo A. En algunas ocasiones 116 . ¿Son esos sucesos mutuamente excluyentes? Justifique g) ¿Son los sucesos “Opiniones desfavorables” y “Ventas Bajas” independientes? Justifique. digamos A.48 0.06 0. En la siguiente tabla se presentan las proporciones correspondientes a cada uno de los grupos. 000 empleos. una ejecución ¿Qué probabilidad hay que no tenga retraso en su ejecución y corresponda al uso del algoritmo A o C? Entre las ejecuciones que no han sufrido retraso en su ejecución. Con esa información responda a las siguientes cuestiones: a) Si se selecciona al azar una unidad producida.1. de 0. ¿cuál es la probabilidad de cada uno de los tres niveles de inflación considerados? 10. ¿Cuál es el porcentaje de las que corresponden al uso de los algoritmos A o C 9.25 y por encima del 3% con probabilidad 0.000 empleos.5 y 0.75.Estadística para la toma de decisiones Dr. cada uno de ellos en calidad extra y comercial. se sabe que se han creado más de 700. A su vez esos productos se fabrican en las siguientes proporciones: 45%. La probabilidad de producir una unidad de calidad extra en cada uno de esos productos es: 0. entre el 2% y el 3% con probabilidad 0.Las previsiones sobre la inflación de un determinado país para el próximo año la sitúan por debajo del 2% con probabilidad 0. 35% y 20%.Una fábrica produce tres productos. respectivamente. Cleto De La Torre Dueñas en que se realiza el proceso se producen atrasos.. Si la probabilidad de crear más de 700.65. siendo estos porcentajes del 15% en el caso en que se aplica el algoritmo B y el 5% en el caso en que se usa el algoritmo C.7 con inflación baja. calcule: a) La probabilidad de que se creen más de 700.000 empleos es de 0. 0. ¿de qué producto es más probable que sea? 117 .4 cuando ésta se sitúa entre el 2% y el 3% y nula en otro caso. al azar.8. 2 y 3. ¿cuál es la probabilidad de que sea de calidad comercial? b) Si se selecciona al azar una unidad producida y es de calidad comercial. Esto ocurre el 10% de las ocasiones en que se usa el algoritmo A. a) ¿En qué porcentaje de las ejecuciones del proceso no se producen atrasos? b) ¿Qué porcentaje de los atrasos de las ejecuciones del proceso son atribuibles al algoritmo B? c) Elegida. respectivamente. b) Si antes de conocer el dato de inflación anual. 1.. ¿Cuál es la probabilidad de que todos estén al día con los impuestos? 12.11. ésta corresponda a operaciones en descubierto a tasa mayor. A atiende distintos tipos de consultas. ¿cual es la probabilidad de que el cliente la acepte? 118 . La mitad de los clientes que no aceptan indica que la tasa ofrecida es mayor a la normal. a) Calcular la probabilidad de que si se recibe una consulta.Los siguientes datos pertenecen a 50 comercios de la ciudad de Cusco divididos en 3 categorías y clasificados según tengan o no deudas impositivas: Impuestos Al día En mora Categoría A 7 9 Categoría B 6 8 Categoría C 12 8 Si se elige un comercio al azar ¿cuál es la probabilidad de que: a) esté en mora? b) pertenezca a la categoría A o B? c) pertenezca a la categoría C o esté en mora? d) Suponga que ahora se eligen 3 comercios al azar.. Se observa que sólo 30% de los clientes aceptan las condiciones del banco: el 35 % a la tasa normal y el resto a una tasa mayor. b) Si la última consulta sobre descubierto se ofreció a tasa mayor. de las cuales una parte corresponde a autorizaciones de giros en descubierto..El personal del Bco. 6. entonces X es una v. en un numero real. que transforma cada elemento del espacio muestral . Si X es una v.a Continua. X:  X Al conjunto de posibles valores de X se le llama rango de X (Rx)  Si Rx es finito o enumerable (rango discreto).a Discreta. Función de Probabilidad.CAPITULO VI VARIABLE ALEATORIA Y DISTRIBUCIONES DE PROBABILIDAD.1 Definiciónes Una variable aleatoria (v.a) X es cualquier función. tal que x Rx PX ( x) 1 Función de densidad 119 . la función de probabilidad de X viene dada por: PX x P X x P /X x .  Si Rx no es enumerable (rango continuo). entonces X es una v.a discreta. ESTADISTICA Si X es una v.a continua, la función de densidad b de X es una aplicación fX :  0, tal que P a X b a f X ( x)dx ,tal que f X ( x)dx 1 Función de distribución La función de distribución de una v.a X esta dada por: FX ( x) P( X x) P( / X( ) x) Propiedades.  F es continua por la derecha y es creciente  Si X es una v.a discreta , entonces P a  Si X es una v.a continua , entonces P a  Si X es una v.a continua , entonces F ' ( x)  limx X X b b F b F b f ( x) F a F a P X a dF ( x) dx FX ( x) 0 y limx FX ( x) 1 Definición.La esperanza o media de una variable aleatoria X, denotada por E ( X ) o X se define según sea la variable discreta o continua, mediante: x.P X E X x Rx x , si X es discreta x. f ( x)dx, si X es continua x Rx Propiedades:  El valor esperado de una constante es dicha constante  E a bX a bE X Definición.La varianza de una variable aleatoria X cuya media o esperanza es como V X 2 X X , se define E X 2 X E X E X 2 E X 2 E2 X Propiedades. 120 CLETO DE LA TORRE  La raíz cuadrada de la varianza se llama desviación estándar.  2 X E X 2 2 X  V aX b a2V ( X ) Desigualdad de Chebyshev. Si X es una variable aleatoria, entonces para cualquier k P X X se cumple k X 1 1 k2 Ejercicio resuelto. 1. Sea X la variable aleatoria definida como la suma de los valores que aparecen al lanzar dos dados. a) Determine la distribución de probabilidad. b) Calcule la probabilidad P(5<X<8) c) La media y su varianza. Solución. a) Resultados en 1 2 3 4 5 6 los dos dados 1 2 3 4 5 6 2 3 4 5 6 7 3 4 5 6 7 8 4 5 6 7 8 9 5 6 7 8 9 10 6 7 8 9 10 11 7 8 9 10 11 12 X: Suma de los valores de los dos dados Rx P(X) 2 3 4 5 6 7 8 9 10 11 12 1/36 2/36 3/16 4/16 5/36 6/36 5/36 4/36 3/36 2/36 1/36 121 ESTADISTICA b) c) p(5 X 8) p(6) p(7) 5/ 36 6 / 36 11/ 36 Media E X x Rx x.P X 4 36 5 36 x , si X es discreta 6 36 5 36 4 36 3 36 2 36 1 36 E X E X 2 1 36 252 36 3 2 36 4 3 36 5 6 7 8 9 10 11 12 Varianza. 2 X E X 2 E2 X E X2 E X2 1 36 1974 36 22 32 2 36 42 3 36 52 4 36 62 5 36 72 6 36 82 5 36 92 4 36 102 3 36 112 2 36 122 1 36 2 X E X 2 E2 X 1974 36 252 36 2 6.2 DISTRIBUCIONES IMPORTANTES. Existen, como en el caso de la última variable ejemplificada, otras variables cuyas funciones de probabilidad o densidad resultan ser modelos de mucha utilidad para una serie de aplicaciones. Nosotros citaremos brevemente algunos de los modelos de mayor importancia.  DISTRIBUCIONES DISCRETAS. Un experimento de Bernoulli, es un experimento aleatorio con solo dos posibles resultados: Éxito y Fracaso. Sea p = P (Éxito). Distribución Binomial. La distribución binomial aparece cuando se dan las condiciones siguientes: -Tenemos un experimento aleatorio simple, con una situación dicotómica, es decir Éxito y Fracaso. - Repetimos este experimento simple n veces de manera independiente. 122 CLETO DE LA TORRE X = Número de Éxitos en n experimentos independientes de Bernoulli. Función de Probabilidad: PX x Valor esperado: Notación: X X n Cx p x 1 p n x , si x 0,1,2,..., n 0 2 X , en otro caso. np. Varianza: np 1 p . B(n, p). Distribución de Pascal o Binomial Negativa. Notación: X BN(r, p). X = Número de ensayos (experimentos independientes de Bernoulli) hasta conseguir el r-ésimo Éxito. Función de Probabilidad: PX x Valor esperado: 1 Crx 1 1 p x r pr , si x r , r 1, r 2,... 0 , en otro caso. 2 X X r . Varianza: p r1 p p2 . Nota: Si r = 1, X se dice que es una variable aleatoria con distribución geométrica de parámetro p, y se le denota por X G(p). Distribución Hipergeométrica. Notación: X H(N, M, n). Considérese una población de N elementos, M de los cuales son de un tipo A, y supongamos se extraen sin reemplazo una muestra de n elementos de esta población. Entonces: X = Número de elementos de tipo A en la muestra. Función de Probabilidad: M N C x Cn xM PX x N Cn , si x 0,1,2,..., n 0 Valor esperado: X , en otro caso. 2 X n M . Varianza: N 123 n M M 1 N N N n . N 1 Varianza: 2 124 2 X b a2 .2. b .ESTADISTICA Notas: b 1. en otro caso. Esta distribución se da cuando la variable aleatoria X puede tomar indistintamente cualquier valor en el intervalo a. si a > b. Notación: X U a. b 0 . t . Función de Probabilidad: x PX x Valor esperado: e x! 0 2 X . .  DISTRIBUCIONES CONTINUAS. p M . X . si x a. Función de densidad: 1 fX x b a . X 2. Valor esperado: X a b . En PX se esta usando la convención que Ca 0. si x 0. entonces B n. en otro caso.. Distribución Uniforme. o el número de pacientes que llegan a un servicio en un intervalo de tiempo dado) o bien en un recinto físico (como el número de fallos en un metro de alambre de hierro producido. La distribución de Poisson aparece en situaciones en las que se cuenta el número de apariciones de un determinado suceso o bien en un intervalo de tiempo dado (como el número de partículas emitidas en un segundo por un material radioactivo.b . N Distribución de Poisson... Si la elección de la muestra fuera con reemplazamiento. 12 . Varianza: . X = Número de eventos en 0.1. 2). se sabe que por estudios anteriores que el 25% de las facturas presentan algún tipo de error. =0y = 1.. Z normal X N ( . Calcular la probabilidad de que: a) Exactamente 4 facturas presenten error.25 A = La factura no presenta error. vale decir. 2) puede convertirse con una v. Toda v.Un auditor analiza 10 facturas. aleatoria con distribución normal estándar. 0. P ( A ) = 0. c) Todos presenten error. Notación: X Función de densidad: N( . Varianza: 2 .a. b) Ninguno de las facturas presenten error. 1).CLETO DE LA TORRE Distribución Normal.a. e) A lo sumo 3 presenten error. P (A) = 0. fX x Valor esperado: Nota: Cuando X 1 2 2 X 1 e 2 2 2 x 2 . a X se le denota por Z y se le llama una variable N (0. d) Por lo menos 8 presenten error.25 ) Sea X la variable aleatoria que representa el número de facturas presenta error 125 .75 Se trata de una distribución Binomial de parámetros B (10. normal estándar (estandarizarse) a través de la transformación: Z X EJERCICIOS RESUELTOS 1. f) Calcular la Media y varianza Solución Consideremos los sucesos A = La factura presenta error. 25)10 (0.0563 c) P(Todo presenten errores) = P X 10 10 (0.25)9 (0.5 np(1 p) 10(0.75)10 0 f) Media y Varianza np 10 (0.25)8 (0.25) 2 10 (0. b) Todos utilizan estrategias c) Al menos 2 utilizan marketing Solución Consideremos los sucesos: A = Utilizan software.75)9 1 10 (0.75) 1.7759 2.25)0 (0.75)0 10 0 d) P(Por lo menos 8 presenten error) = P X 8 PX 8 PX 9 PX 10 10 (0.25)3 (0.3 126 .75)10 0 0.25)(0. P(A) = 0.25)2 (0.25)4 (0.75)8 2 10 (0. determinar la probabilidad de que.- El treinta por ciento de los administradores de supermercados utilizan estrategias de marketing.25)0 (0.75)2 8 10 (0. Si se selecciona siete administradores.1460 b ) P (Ninguno presenten errores) = P X 0 10 (0.ESTADISTICA a) P(Exactamente 4 facturas presenten errores) = PX 4 10 (0. a) Ninguno de los 7 utiliza estrategias de marketing.875 2.75)6 4 0.005 e) P( A lo sumo 3 presenten error ) = P X 3 PX 0 PX 1 PX 2 PX 3 10 (0.25)1 (0.75) 0 9 0.75)7 3 0. a) Cual es la probabilidad de que un gerente tenga ingresos menores a $ 64 b) Cual es la probabilidad de que un gerente tenga ingresos de $57 a más ? c) Cual es la probabilidad de que un gerente tenga ingresos mayores de $63? d) Cual es la probabilidad de que un gerente tenga ingresos entre $57 a $65 ? e) Cual es la probabilidad de que un gerente tenga ingresos menores de $50? f) Cual es la probabilidad de que un gerente tenga ingresos entre $64 a $70 ? g) Si en total hay 200 gerentes en esa ciudad. P ( A ) = 0.CLETO DE LA TORRE A = No utilizan software.7)6 1 2 0 PX 1 1 0.3)1 (0.6705 3.3)0 (0.0824 7 0. .0002 7 (0.. X: Ingreso de los gerentes.El Ingreso medio diario de los gerentes de empresas en una ciudad es 60 dólares y la desviación típica es $6 . 0. a) P X b) P X c) P X 0 7 (0.7 Por tanto se trata de una distribución Binomial de parámetros B (7.3) Sea X la variable aleatoria que representa el número de administradores que utilizan estrategias de marketing.67) 127 .7)7 0 7 (0. 60 (Media poblacional) 6 (Desviación) a) P( X 64) P( X 64 ) P( Z 64 60 ) 6 P( Z 0. Suponiendo que los ingresos están distribuidos normalmente.3)0 (0.7)0 7 1 PX 1 1 PX 0.7)7 0 7 (0.Cuantos cabe esperar que presenten ingresos mayores a $57 y menores de $64? Solución.3)7 (0. ESTADISTICA (0.5 0.29373=0.519% 128 .5) (0.24857=0.5 0.854% d) P(57 X 65) X P( 57 X 65 ) P( 57 60 6 Z 65 60 ) 6 P( 0.30854=30.67 0.5 0.5=0.5) 0.83) (0.19146+0.146% c) P( X 63) P( X 63 ) P( Z 63 60 ) 6 P( Z 0.83) 0.5) 0.48519=48.5) (0.50) (0.19146=0.19146+0.5) z= 0.5 0 0.5 (0.5) 0 z=0.67) 0.50 0.5 (0.74857=74.857% b) P( X 57) P( X 57 ) P( Z 57 60 ) 6 P( Z 0.67) 0 z=0.69146=69.5 (0. 5 0.167 0 z= 0.83 P( Z 0.67) 0.4325=43.167) 0.45254-0.67 X 1.67 (0.5) (0.20397=20.67) (1.67) ) P( 57 60 6 Z 64 60 ) 6 .0675=0.167) P( 64 60 6 Z 70 60 ) 6 z=0.83) e) P( X 50) P( X 50 ) P( Z 50 60 ) 6 (0.67) (0.397% g) P(57 X 64) P( 57 X 64 129 0 0 z= 0.24857=0.25% f) P(64 X 70) P( 64 X 70 ) P(0.167) 0.67 z=1.5 (0.50 z=0.CLETO DE LA TORRE (0.67) (1. Si los salarios tienen una distribución normal.5 X 0.67) (0.003% Cabe esperar el 44. ¿Cuál es la probabilidad de que realice: a) Más de 9 errores? b) Por lo menos 9 errores? 2.La empresa de asuntos financieros Tax Service se especializa en las devoluciones de importes de impuestos federales.9 y $11.24857=0..44003* 200 88 EJERCICIOS PROPUESTOS 1. Una reciente auditoría de las declaraciones indicó que se cometió un error en el 10% de las que manifestó el año pasado.003% de los gerentes.El volumen de acciones negociadas en la Bolsa es normal con una media de 646 millones de acciones y una desviación de 100 millones de acciones..ESTADISTICA P( 0. a) ¿Cuál es la probabilidad de que el volumen negociado sea menor de 400 millones? 130 .9? b) Reciba salarios inferiores a $11? c) Reciba salarios superiores a $12.67) 0.9 por hora y la desviación estándar de $0. ¿Cuál será el salario máximo que deberá ganar un trabajador para ser beneficiado con el aumento? 3.19146+0.. es decir 0.5) (0.95? d) ¿Cuál debe ser el salario menor que gana un trabajador que se encuentra entre el 10% de los trabajadores que más ganan? e) Si el dueño de la industria va a aumentarle el salario al 15% de los trabajadores que menos ganan. Suponiendo que tal tasa continúe en este periodo anual y elabore 60 declaraciones.Los salarios de los trabajadores en cierta industria son en promedio $11. ¿Cuál es la probabilidad de que un trabajador seleccionado al azar: a) Reciba salarios entre $10.44003=44.4. Se toma una muestra de 12 trabajadores de una gran empresa para estudiar su actitud frente a un cambio en el método de trabajo.CLETO DE LA TORRE b) ¿Cuál es la probabilidad de que el volumen negociado de acciones oscile entre las 400 y las 600 acciones? c) Si la Bolsa quiere emitir un boletín de prensa sobre el 5% de los días más activos ¿Qué volumen publicará la prensa? 4. Si el 60% de todos los trabajadores de la empresa están a favor del cambio... a) ¿Cuál es la cantidad esperada de desempleados? b) ¿Cuál es la varianza y la desviación estándar de los desempleados? c) ¿Cuál es la probabilidad de que al menos 3 estén desempleados? d) ¿Cuál es la probabilidad de que haya entre 3 y 5 desempleados? 6. ¿Cuál es la probabilidad de que menos de 5 de los miembros de la muestra estén a favor? 5.La tasa real de desempleo es de 15%. En una muestra de 8 poseedores de esa tarjeta: a) ¿Cuál es la probabilidad de que de 4 a 6 clientes paguen sus cuentas antes de incurrir en el pago de intereses? b) ¿Cuál es la probabilidad de que 3 clientes o menos paguen sus cuentas antes de incurrir en pago de intereses? 7..Se sabe que el 30% de los clientes de una tarjeta de crédito a nivel nacional dejan en cero sus saldos para no incurrir en intereses morosos.Sabiendo que la recaudación diaria de cierto comercio minorista se distribuye normalmente con un monto promedio de $830 y un desvío estándar de $125: a) ¿Cuál es la probabilidad de que mañana se recaude menos de $885? b) ¿Cuál es la probabilidad de que mañana se recaude más de $600? c) ¿En qué porcentaje de los días se recauda entre $700 y $800? d) ¿En qué porcentaje de los días se recauda entre $900 y $1500? 131 .. Suponga que se seleccionan al azar 15 personas en posibilidad de trabajar. ESTADISTICA e) ¿Cuál es el monto no superado en el 20% de los días? f) ¿Cuál es el monto sólo superado en el 30% de los días? 8.500 unidades . dichos costos son variables aleatorias independientes que pueden considerarse normalmente distribuidas: . y desvío estándar de 1.5 $/gramo.el costo de materiales (x) con media 180$/m y desvío estándar de 2$/m . con un desvío típico de 20 días (sin considerar los incobrables y clientes en gestión judicial) y que la variable “días de cobranza” se distribuye normalmente. sus condiciones de pago. mientras que el 7% de los meses las ventas superan las 1800 unidades. a) ¿Cuál es la probabilidad de que el costo del producto de una unidad supere los $ 122? b) ¿Cuál es la probabilidad de que el costo de un pack de 25 unidades supere los 2950$? 132 2 2 2 .el costo del producto (y) con media 20$/gramo.07 m /unidad) y el costo del producto en sí mismo (5 gramos/unidad).-Las ventas mensuales de un producto tienen distribución normal. b) ¿Cuál es la probabilidad de que las ventas mensuales sean de 1600 unidades? c) ¿Cuál es la venta garantizada el 90% de los meses? 9. En cierta industria se determinó que en el último año las cobranzas se realizaron a los 120 días fecha factura en promedio.El costo de un producto que se procesa en forma automática está formado por el costo de los materiales del envase (0.La creciente recesión económica lleva a las empresas a modificar.. tomándose como unidad el envase de presentación. .. Se sabe que el 15% de los meses se venden menos de 1. Debido a ciertas fluctuaciones. a) Si no varían las condiciones económicas ni comerciales para el año próximo ¿cree que es muy probable que en la industria estudiada lleguen a cobrar a más de 150 días? b) ¿En cuántos días como máximo se espera cobrar el 85 % de las operaciones ? c) Si la última cobranza se efectivizó en un plazo inferior al promedio de días. ¿cuál es la probabilidad de que la empresa haya cobrado después de los 100 días ? 10. entre otras cosas. a) Definir la variable aleatoria e identificar sus parámetros. usualmente se distingue el significado de los términos universo y población. 7. Consideraremos el problema particular del muestreo de una población finita (colección finita de mediciones). unidades. seres y objetos. Para un buen entendimiento del problema de muestreo. indicando con el primero un conjunto de elementos. El objetivo de la estadística es hacer inferencias acerca de una población con base en la información contenida en una muestra. En lo referente al muestreo. Este mismo objetivo motiva el estudio del problema de muestreo.CLETO DE LA TORRE CAPITULO VII INTRODUCCION AL MUESTREO 7. 133 . Población (UNIVERSO): Es una colección finita o infinita de individuos o elementos. En el muestreo. y con el segundo un conjunto de mediciones de los mismos.2 DEFINICION DE TÉRMINOS. ciertos aspectos técnicos comunes a las encuestas de muestreo. REVISIÓN DE CONCEPTOS. la inferencia consiste en la estimación de un parámetro de población. tal como una medida.1 INTRODUCCION. introduciremos enseguida. No necesariamente se refiere a una colección de organismos vivientes. individuos. un total o una proporción con un límite para el error de estimación (precisión). el estimador se denotará con ˆ . Unidad de Muestreo: Es una colección de uno o más elementos de la población. Unidad Reportante: Es la que suministra la información estadística requerida o de la cual la información la información puede ser convenientemente averiguada. Parámetro: Es un valor numérico de la población usualmente desconocido que representa cierta característica de la población. y debe excluir unidades de cualquier otra población. usado para estimar un parámetro. ya que estas dos componentes están interrelacionadas. Estimación: Es el valor que toma el estimador en los datos de la muestra. Marco de Muestreo: Se presenta en forma de lista o mapa de las unidades de muestreo que conforman la población. Error de Estimación: Es la diferencia absoluta entre el parámetro y su estimador. es imposible conocer con exactitud el 134 . El marco muestral debe contener todas las unidades de muestreo que conforman la población bajo estudio. si un parámetro se denota con . Como se puede apreciar. Las unidades de muestreo cubren toda la población. es decir | | .ESTADISTICA Una tarea importante para el investigador es definir cuidadosa y completamente la población antes de recolectar la muestra. Muestra: Es un subconjunto de la población. Una unidad de muestreo debe ser claramente definida. La definición debe contener una descripción de los elementos que serán incluidos y una especificación de las mediciones que se van a considerar. identificable y observable. Forma el material básico para la selección de la muestra. Estadístico: Es una función real de la muestra aleatoria. Una muestra puede ser probabilística (aleatoria) o no probabilística. Puede ser controlado por un diseño cuidadoso de la muestra y es estimado en gran parte por el factor E. Si E esta expresado en las mismas unidades de la medida de la variable. infortunadamente estos errores no se pueden medir fácilmente. El intervalo anterior es llamado intervalo de confianza. y aumentan a medida que aumenta el tamaño de la muestra. Los tipos errores no muestrales que suelen presentarse son: Definición equivocada del problema. se le llama precisión relativa. Definición defectuosa de la población.96 V ( ˆ) se cumple: P(| ˆ | E) 0. error de muestreo. Marco imperfecto o desactualizado. algunos autores denominan al factor E.96 V ( ˆ) . Error de Muestreo: Este error se debe a que una muestra no produce información completa sobre una población. se le llama precisión absoluta.CLETO DE LA TORRE error de estimación. | E) Si ˆ tiene distribución aproximadamente normal. Error de no Muestreo: Son los errores que se introducen imperceptiblemente a la encuesta y estos son más difíciles de controlar. ˆ E se encuentra en con una confianza del 95%. 135 . podemos afirmar que el parámetro el intervalo ˆ E. Por esta razón.95 Limite para el error de estimación: Denotado por E es dado por E 1. Una ves estimado el límite E. al menos aproximadamente encontrar un límite E tal que: P(| ˆ Para cualquier entre 0 y 1. Si E está expresado como un porcentaje del parámetro que se está estimando. El factor E es llamado también precisión. pero podemos. entonces para E 1. que es un individuo de la población en estudio seleccionado para la muestra. El sesgo de respuesta. La función de la encuesta es la medición del comportamiento. Sin embargo.ESTADISTICA - La no respuesta. estratificado y sistemático. Diseño pobre del instrumento de medición. Diseño de la encuesta Pasos a seguir:  Definir los objetivos  Determinar el marco  Diseñar el procedimiento de muestreo  Diseñar el cuestionario  Diseñar y realizar el trabajo de campo  Codificar.3 ENCUESTA. entre las principales se tiene muestreo: aleatorio simple. 7. 136 . depurar y analizar las respuestas  Redactar el informe Diseño de la muestra El diseño de la muestra incluye:   La elección del procedimiento de muestreo La determinación del tamaño de la muestra Existen varios procedimientos de muestreo. actitudes o características del encuestado. los errores de no muestreo pueden ser controlados mediante una atención cuidadosa en todas las etapas de la encuesta. A. el procedimiento de muestreo se llama Muestreo Aleatorio Simple (M.A. A. es seleccionado de una población de tamaño N de tal manera que cada muestra posible tiene la misma probabilidad de ser seleccionada. Tamaño de la muestra Una parte fundamental para realizar un estudio estadístico de cualquier tipo es obtener unos resultados confiables y que puedan ser aplicables. El procedimiento de selección de una Muestra Aleatoria Simple (M. por lo que la solución es llevar a cabo el estudio basándose en un subconjunto de ésta denominada muestra. puede ser de 2 formas.CLETO DE LA TORRE 7. implica algo de incertidumbre que debe 137 . generalizar los resultados hacia la población en total. desde 1 hasta N. al final. sin preposición (muestreo irrestricto aleatorio) y con reposición. Si una muestra de tamaño n. Procedimiento de selección. Usando la tabla de números aleatorios seleccionar la primera unidad para la muestra. resulta casi imposible o impráctico llevar a cabo algunos estudios sobre toda una población. posea algunas características específicas que permitan.) El M. o muestra. para que los estudios tengan la validez y confiabilidad buscada es necesario que tal subconjunto de datos. S.4 MUESTREO ALEATORIO SIMPLE Definición. Sin embargo. Como ya se comentó anteriormente. S. iii) Continuar la selección excluyendo las unidades repetidas (si es sin reposición) o incluyendo las unidades repetidas (si es con reposición) hasta completar el tamaño de muestra n.S.) consiste en: i) ii) Enumerar las unidades de la población. Esas características tienen que ver principalmente con el tamaño de la muestra y con la manera de obtenerla. El muestro. El porcentaje de confianza con el cual se quiere generalizar los datos desde la muestra hacia la población total. pues aparte de que estudiar una población resulta ser un trabajo en ocasiones demasiado grande. la fórmula del tamaño de muestra n para la estimación de p con error máximo de estimación de 100(1 . . 1.El porcentaje de error que se pretende aceptar al momento de hacer la generalización.ESTADISTICA ser aceptada para poder realizar el trabajo. estimado por S2 a partir de una encuesta anterior o 2. n 2 Z (1 / 2) * 2 2 .El nivel de variabilidad que se calcula para comprobar la hipótesis. De manera simular. Donde 2 Es la varianza poblacional 2 En la practica el valor de de una muestra piloto. Población finita. Para calcular el tamaño de una muestra hay que tomar en cuenta tres factores: . con precisión fijada por el investigador. Tamaño de muestra para Estimar . Tamaño de la muestra para estimar P.)%: n Z 2 Z (1 2 (1 / 2) / 2) y un nivel de confianza del * N * p(1 p) 2 * p(1 p) ( N 1) . y si N : 138 . . Población infinita. el tamaño de Si se desea estimar muestra necesario es dado por: n 2 Z (1 2 Z (1 / 2) / 2) 2 *N 2 2 * ( N 1) Población finita. CLETO DE LA TORRE n 2 Z (1 / 2) * p (1 p ) 2 , Población infinita. En este caso el valor de esta entre 0 y 1, el valor de P es desconocido, por lo que debe ser estimado preliminarmente a partir de una encuesta anterior, o de una muestra piloto. En última instancia el valor de P se puede sustituir por 0.5 y se obtendrá un tamaño de muestra mayor que el requerido. Recomendaciones para el uso del M. A. S. Generalmente el M. A. S. Esta orientada a encuestas de pequeña escala y raras veces a encuestas de gran escala, debido a que otros diseños proporcionan mayor o igual precisión a menor costo. En las encuestas por muestreo a gran escala, el M. A. S. es usado como parte de un diseño de muestreo mucho más complejo. El M. A. S. es muy eficiente cuando la población es homogénea. 7.5 MUESTREO ESTRATIFICADO. Una muestra estratificada es la obtenida mediante la separación de los elementos de la población en grupos heterogéneos disjuntos, llamados estratos y la selección posterior de una muestra aleatoria simple en cada estrato. Consideremos una población de tamaño N, la cual es dividida en k estratos (sub poblaciones) de tamaños Ni, i=1,2…., k, tal que N N1 N2 ... Nk N1 N2 … NK El tamaño de muestra se estima mediante: 139 ESTADISTICA k Z n 2 2 (1 2 / 2) * i 1 2 (1 Ni2 pi (1 pi ) / wi k , N Z / 2) * i 1 Ni pi (1 pi ) es wi el % de observaciones asignados al estrato i El tamaño de muestra necesario de cada estrato, se puede obtener por afijación proporcional al tamaño de cada estrato, es decir: ni n* Ni N n * wi , i 1,..., k Cuando se realiza un muestreo estratificado, los tamaños muestrales en cada uno de los estratos, ni, los elige quien hace el muestreo, Así en un estrato dado, se tiende a tomar una muestra más grande cuando: - El estrato es más grande; - El estrato posee mayor variabilidad interna (varianza); - El muestreo es más barato en ese estrato. 7.6 MUESTREO SISTEMATICO Definición.- Una muestra obtenida al seleccionar aleatoriamente un elemento de los primeros k elementos en el marco y después cada k-ésimo elemento, se denomina muestra sistemática de intervalo de selección k. El muestreo sistemático puede ser de dos formas, muestreo sistemático simple y muestreo sistemático circular. Procedimiento de selección del muestreo sistemático simple. Una muestre sistemática simple se obtiene cuando el intervalo de selección k es exactamente un numero entero. El procedimiento de selección de una muestra sistemática simple consiste: i) Las unidades del marco deben ser ordenados en magnitud de acuerdo con algún esquema de ordenación (población ordenada) es base al orden se establece la numeración desde 1 hasta N ii) Determinar el intervalo de selección k N (k exactamente un numero entero) n 140 CLETO DE LA TORRE iii) Seleccionar un numero aleatorio entre 1 y k (arranque aleatorio) sea “a” el arranque aleatorio elegido, entonces los elementos de la muestra sistemática, son los que ocupan las posiciones en el marco: a, k+a, 2k+a, 3k+a,......(n-1)k+a 141 ESTADISTICA EJERCICIOS RESUELTOS 1. Un empresario dedicado al rubro de pizzería, desea hacer una estimación del gasto que realizan las personas en pizza por semana, con 99% de confianza, suponiendo que el máximo error permitido es de un soles, además de una muestra piloto se obtuvo una varianza de 25. También se sabe la ciudad tiene 2500 ciudadanos ¿Que tamaño de muestra necesitara para investigar? Solución. N n 2500, 2 Z (1 2 Z (1 / 2) 1, / 2) 2 2 25, Z(1 2 2 / 2) 2.58 2.582 * 2500* 25 156.08 157 *N * ( N 1) 2.582 * 25 (2500 1) 1 2 2. Las compañías de auditoría generalmente seleccionan una muestra aleatoria de los clientes de una banco y verifican los balances contables reportados por el banco. Si una compañía de este tipo se encuentra interesada en estimar la proporción de cuentas para las cuales existe una discrepancia entre el cliente y el banco, ¿cuántas cuentas deberán seleccionarse del banco si esta tiene 25000 clientes, de manera tal que con una confianza del 95% la proporción muestral se encuentre a no más de 5% unidades de la proporción real?. Solución. Consideremos que no se tiene ningún estudio de este tipo, por tanto P 0.5 , del problema: N n Z 2 Z (1 2 (1 / 2) 25000, / 2) 0.05, z(1 / 2) 1.96 * NP(1 P) 2 * P(1 P) ( N 1) n 1.962 *25000*0.5(1 0.5) 1.962 *0.5(1 0.5) (25000 1) 0.05 2 378.361 379 142 La población materia de estudio. cuyo tamaño poblacional se muestra en el cuadro siguiente: Distrito A B C Total Tamaño de población. para ello usted tiene que realizar un estudio de la demanda de este producto. los distritos forman los estratos: 143 .92 196 4. El administrador de una empresa A desea hacer un estudio de investigación de mercado en cierta región.05. respecto al posicionamiento que tiene su marca. Suponiendo que en estudio realizado hace 10 años. 2000 1200 5000 8200 Considere que el tamaño de muestra es 245. Suponiendo que esta ciudad se divide en tres distritos. z(1 2 / 2) 1. Se desea lanzar un nuevo producto al mercado. Solución.CLETO DE LA TORRE 3.15) 0. En este ejemplo.15(1 0. con un nivel de confianza del 95% y un error del 5%. el nivel de posicionamiento de su marca es de 15% ¿Cual debe ser el tamaño de muestra para este estudio? Solución.962 *0. n 0. calcule el tamaño de muestra por cada ciudad. no es finita.05 195.96 1. por tanto la relación para estimar el tamaño de muestra es: n 2 Z (1 / 2) * P (1 P ) 2 Del problema se tiene los siguientes datos P 0. necesario para este estudio.15. 24 =1200/8200=0.61 1 n * wi . nA nB n* NA N NB N n * wA n * wB 0.02 unidades de la proporción real?.61*245 149. Si el volumen de ventas se puede modelizar por una distribución normal.85 36 nC n* NC N n * wC 0.. SUNAT tiene previsto realizar una auditoria a cuentas de un grupo de empresas con la finalidad de estimar la proporción de empresas que presentan desbalance financiero ¿cuántas cuentas empresas deberán seleccionarse de manera tal que con una confianza del 99% la proporción muestral se encuentre a no más de 0.ESTADISTICA Ciudad A B C Total n=245. Usando la relación. Calcular el tamaño muestral necesario para estimar su salario anual medio con un error máximo de 80 soles para un nivel de confianza del 95%.. (Por estudios anteriores se sabe que el salario anual sigue una distribución normal con desviación típica de 70 soles). 2. 1. i 1.. Se determina el tamaño de muestra para cada distritos. Una tienda se interesa en estimar su volumen de ventas diarias.76 60 n* 0.. ¿cuál debe ser el tamaño de la muestra 144 .24*245 59. k . Supóngase que el valor de la desviación típica es de 50 soles.15*245 35. Unos grandes almacenes tienen 1000 empleados en uno de sus centros.15 =5000/8200=0. ni n* Ni N Ni 2000 1200 5000 N=8200 wi =2000/8200=0. 3.39 149 EJERCICIOS PROPUESTOS. C y D). 8. encuentre el tamaño de muestra necesario para estimar proporción real de consumidores satisfechos con un cierto producto nuevo. está interesado en determinar el peso máximo promedio que puede resistir una de las bolsas para basura sin que se rompa. la provincia C el 22% y la provincia D el resto de la población regional. Gustavo. Determine el tamaño de muestra para este estudio. 5. dentro de ± 0. Se planea una investigación para determinar los gastos médicos familiares promedios por año. Elena acaba de adquirir un programa de computación que afirma escoger acciones que aumentarán su precio durante la semana siguiente con un índice de precisión de 85%. Se sabe también que la provincia A tiene el 45% de la poblacional regional.05 de la muestra de la población?. Si la desviación estándar del peso límite que puede aguantar una bolsa es de 1.CLETO DE LA TORRE para que con una confianza del 95% la media muestral se encuentre a no más de 20 soles del verdadero volumen medio de ventas? 4. Se esta realizando una auditoria respecto al incumplimiento de entrega de facturas en un región que tiene 4 provincias (A. Suponga que no tiene una buena idea del valor de la proporción. Parece ser que las bolsas que se venden en la tienda son menos resistentes que las que vende su competidor y. se rompen más a menudo. la provincia B 10%.04 nivel de confianza de 90%. 7. Para un mercado de prueba.5 Kg. gerente encargado de adquisición... suponiendo que la región tiene 12000 centros comerciales. Una tienda local vende bolsas de plástico para basura y ha recibido unas cuantas quejas con respecto a la resistencia de tales bolsas. B. determine el número de bolsas que deben ser probadas con el fin de que Gustavo tenga una certeza de 95% de que el peso límite promedio está dentro de 0.2 Kg. del promedio real. ¿En cuántas acciones deberá Elena probar el programa con el fin de estar 98% segura de que el porcentaje de acciones que realmente subirán de precio durante la semana próxima estará dentro de ±0. 6. La administración de la compañía desea tener 95% de confianza de que el promedio muestral es correcto dentro de ± $50 del promedio 145 . en consecuencia. ¿Qué tamaño de muestra se necesita? 146 .05 de la proporción de la población real de ahorradores que tienen cuantas de ahorros y de cheques en el banco. Un estudio piloto indica que la desviación estándar se puede estimar como $400.ESTADISTICA real familiar. Con base a estudios realizados en otras ciudades se supone que la desviación estándar es de 25 dólares. El Gerente de un banco desea 90% de confianza de tener un resultado correcto dentro de ± 0. Un grupo de consumidores desea estimar el monto de facturas de energía eléctrica para el mes de julio para las viviendas unifamiliares en una ciudad grande. ¿De cuántos ahorradores debe ser su cuenta? 10. El grupo desea estimar el monto promedio para le mes de julio de ± 5 dólares del promedio verdadero con 99% de confianza. ¿Qué tamaño de muestra se requiere? 9. Si X1 . donde cada Xi tiene la misma distribución de valor esperado entonces para n suficientemente grande (en la práctica n aproximadamente y varianza 2..’s independientes.. entonces aproximadamente: Z X np np 1 p 147 N (0. Teorema del limite central (TLC).. 1). En este capitulo abordaremos el estudio de la distribución normal y de otras distribuciones asociadas a funciones de una muestra al azar de esta variable.CLETO DE LA TORRE CAPITULO VIII ESTIMACION POR INTERVALOS Y PRUEBAS DE HIPOTESIS 8.. X 2 .a. p) y n es 2. 1).1 DISTRIBUCIONES MUESTRALES. . Aproximación de la Binomial por la Normal. Si X suficientemente grande. 30) se cumple que Z n X i 1 i n X / n n N (0. B (n.  DISTRIBUCION NORMAL. PROPOSICION 1. X n son n v. El porque de la importancia de la distribución normal se ilustra a través de las siguientes propiedades y distribuciones. ESTADISTICA Aquí. n2 . Una v.  LA DISTRIBUCION T DE STUDENT. entonces k n i 1 i grados de W n 1 S2 2 2 (n -1). Una v. 2 (n) son v..a. con distribución chi-cuadrado de n libertad. PROPOSICION. 3.a de X N ( . entonces 148 . 1.. 2). nk grados de libertad. entonces Pa X b 1 P a 2 X 1 b 2 Fz b 1 2 np np 1 p Fz a 1 2 np np 1 p . se recomienda utilizar la llamada corrección por continuidad: Si a aproximadamente: b son dos números naturales.. X tiene distribución chi-cuadrado con n grados de libertad.. Si Z t(n). entonces aproximadamente X N (0. para el cálculo de probabilidades.  LA DISTRIBUCION CHI-CUADRADO.a. 2 1 2 2 2.. Si X1 .. Si Z N (0. 1) y 2 N (0. PROPOSICION. Si . Sea X 2. X tiene distribución t de Student con n grados de libertad. X n es una m. 1). y se le denota por X 2 (n)... Propiedad reproductiva. X 2 ..a.a’s independientes. Si n es grande. y se le denota por X t(n). entonces k 2 i 1 2 i Es también una v.. entonces Z2 2 (1). 1). 1. 2 k son k variables aleatorias independientes con distribuciones chi-cuadrado de respectivamente n1 . a. Y entonces donde X e Y son independientes. 12)... Y2 . entonces N ( 1.a. y se le denota por X PROPOSICION. y 2 2 2(m) F /n /m F (m.a de una v.. En particular. n).a. dada una m. respectivamente. m). chi-cuadrado y F de Fisher poseen todas tablas en la que se tabulan algunos valores de su función de distribución.. F (n. 2). X tiene distribución F de Fisher con n grados de libertad en el numerador y m grados de libertad en el denominador.. entonces 2(n) 1 X F (m. se n cumple que: T X S/ n t (n -1)... de X N ( 2. Nota: La distribución normal estándar.Ym una m.. uno de los problemas que se plantearon es que el valor de la estimación es solo uno de los valores (posiblemente infinitos) 149 . 1. si X1 . m ..a. son v. X1 . m). X 2 . Si 2 1 2 1 2 2 F (n.. Una v. n). En particular.a’s independientes. t de Student.  LA DISTRIBUCION F DE FISHER. 2 2 Siendo S1 y S 2 las varianzas muestrales asociadas a las poblaciones estadísticas determinadas por X e Y. X n de X N ( . 22).CLETO DE LA TORRE T Z 2 t(n). e Y1 . F S12 2 2 2 S 2 12 F (n -1. X 2 . Si X 2.2 INTERVALOS DE CONFIANZA... X n es una v. Cuando tratamos la estimación puntual. 8.1). y en el cual se confía que esté el valor de parámetro.)% para un parámetro poblacional de una v. que indica la proporción de intervalos de todos los que se podrían construir a partir de muestras distintas. que realmente contienen al parámetro. las estimaciones serán distintas. X es un intervalo con estadísticas L1 y L2 en los extremos (IC = L1. Al hacer cualquier estimación se está cometiendo un error. 1) y vienen dado por X z1 X z1 2 n 2 n Donde z1 denota al valor de la distribución normal estándar. y seria deseable proporcionar una medida de la precisión de la estimación del parámetro. El intervalo se obtendrá a partir de un estadístico generalmente relacionado con un estimador puntual. Un intervalo de confianza (IC) al 100(1 . y una medida de la validez del intervalo es el nivel de confianza. se obtiene usando como X / n N (0. cuya distribución no depende del parámetro desconocido. cuando 2 es conocida. En este tema vamos a introducir el concepto de intervalo de confianza como un intervalo cuyos extremos son variables que dependen de la muestra.a. obtenido al extraer una muestra concreta. Definición. Intervalo de confianza para la media  El IC al 100(1 pivote a Z )% para .ESTADISTICA del estimador. 150 . de forma que si extraemos dos muestras distintas. L2 ) tal que P L1 L2 1 . X es el valor de 2 la media muestral. n . n 1) 2 1 /2 /2 t(1 Donde t1 2 n t(1 n 1 denota al valor de la distribución t de Student con n – 1 grados de xi x 2 libertad y la varianza muestral dado por S 2 i 1 n 1 Intervalo de confianza para la varianza El IC al 100(1 . 2 se obtiene usando como pivote a W n 1 S2 2 2 (n - n 1 S2 2 1 2 n 1 S2 2 2 n 1 2 n 1 151 .)% para 1) y vienen dado por : 2.CLETO DE LA TORRE 1 /2 /2 Z(1  El IC al 100(1 pivote a T )% para . cuando 2 Z(1 es desconocida se obtiene usando como X S/ n X t (n -1) y vienen dado por t(1 S n X t(1 S . n 1) 2 . n2 1 y vienen dado por S12 f 2 S2 Donde / 2.)% para pivote a z 1 2 1 2 . cuando 2 1 y 2 2 es conocida se obtiene usando como X1 X2 ( 2 1 1 2 2 2 ) y vienen dado por: n1 n2 152 . El IC al 100(1 . S12 y S2 son las varianzas de dos muestras aleatorias independientes de tamaños n1 y n2 Intervalo de confianza para la diferencia entre dos medias. n1 1 denotan a los valores en la distribución 2 F. n2 1. n2 1. n1 1 2 1 2 2 S12 f 2 1 S2 / 2. n1 1 f / 2. se obtiene usando como pivote a F S12 / 2 S2 / 2 1 2 2  F n1 1. n2 1. n1 1 y f1 / 2.ESTADISTICA 1 2 ( /2) 2 (1 /2) Donde 2 2 n 1 y 2 1 n 1 denotan 2 a los valores en la distribución chi- cuadrado con n – 1 grados de libertad y la varianza muestral dado por: n xi S2 i 1 x 2 n 1 Intervalo de confianza para la razón de dos varianzas El IC al 100(1 )% para 2 1 2 1 / 2 2 / 2 2 . n2 1. se obtiene usando como pivote a Z ( p1 p2 ) ( p1 p1 1 p1 n1 p2) N (0.CLETO DE LA TORRE ( X1 X 2 ) z(1 / 2) * 2 1 2 2 n1 n2 1 2 ( X1 X 2 ) z(1 / 2) * 2 1 2 2 n1 n2 Intervalo de confianza para la proporción p El IC al 100(1 . p2 1 p2 n2 y vienen dado por: ( p1 p2 ) z1 * 2 p1 1 p1 n1 p2 1 p2 n2 ( p1 p2 ) ( p1 p2 ) z1 * 2 p1 1 p1 n1 p2 1 p2 n2 RESUMEN DE INTERVALO DE CONFIANZA.)% para p1 p2 p2 .)% para p . 153 . y vienen dado por: p z1 2 p1 p n p p z1 2 p1 p n Intervalo de confianza para la diferencia entre dos proporciones p1 El IC al 100(1 . se obtiene usando como pivote a Z p p p1 p n N (0. 1). 1). n1 + n 2 -2) Sp La diferencia de Medias 2 1 2 2 y desconocidos n2 1 n1 n2 2 / 2. n ( X1 X2) z(1 / 2) * 2 1 2 2 n1 n2 2 S2 n2 ( X1 X2) z(1 / 2) * 2 1 2 2 n1 n2 2 S2 n2 --Nota: Si las poblaciones no son normales pero n1 30 y n2 30 ( X1 X2) z(1 / 2) * S12 n1 ( X1 X2) z(1 / 2) * S12 n1 La diferencia de Medias Asumiendo que: desconocidos 2 1 2 2 y ( X1 ( X1 X 2 ) t0 * S p n1 1 2 S1 X 2 ) t0 * S p 1 n1 2 S2 1 n2 1 n1 1 n2 to t(1 / 2. n 1) -Nota: Si la población no es normal 2 2 es X t(1 X 2 t(1 2 S . n1 1 S12 f 2 1 S2 p z1 / 2. v ) * ( X1 X 2 ) t(1 2 S1 n1 2 / n )2 ( S1 1 n1 1 S12 n1 2 S2 ( X1 n2 X 2 ) t(1 / 2. n1 1 La proporción 2 p1 p n 2 p1 p n 154 . n2 1. n2 1. n 1) Limite Superior X X S n conocido 2 z1 z1 2 n S n . v ) * S12 n1 2 S2 n2 v La varianza ( 2 S1 2 ) n1 2 ( S 2 / n2 ) 2 n2 1 n 1 S2 2 1 n 1 S2 2 2 n 1 2 n 1 La razón de varianzas. S12 f S22 p z1 / 2.ESTADISTICA Intervalos de confianza de: La Media Si se asume pero n 30 La Media Si se asume que desconocido La diferencias de Medias 2 1 y 2 2 Conocidos 2 2 Limite inferior X X z1 z1 n S n . CLETO DE LA TORRE La diferencia de proporciones ( p1 p2 ) z1 * 2 p1 1 p1 n1 p2 1 p2 n2 ( p1 p2 ) z1 * 2 p1 1 p1 n1 p2 1 p2 n2 EJERCICIOS RESUELTOS 1. obteniéndose un pago medio de 256 soles y un desvío de 32 soles. obteniéndose un monto medio de 5900 soles y una desviación típica de 94 soles.34 Z(1 5900 1. Obtener un intervalo de confianza (al 95%) para el monto medio de recaudación diaria.. Se realizo un estudio en 30 minimercados sobre el pago por derecho de impuestos.96 94 250 94 250 5911. t(1 2 . Solución. X 5900.En una muestra de 250 empresas se estimo el monto de recaudación en un día. n 1) 2. n 250. Solución.96 5888.65 2. 94. s 32.96 2 Reemplazando en la relación X z1 2 n X z1 2 n 1 /2 /2 Z(1 5900 1. X 256. n 30.045 155 . Encontrar el intervalo de confianza para el 95%. z1 1. Utilizando un intervalo de confianza del 95% ¿ Se puede aceptar que los dos sistemas presentan similar eficiencia ? Solución. Un investigador entrevisto a 200 profesionales sobre el conocimiento que estas tienen de la inversión en la bolsa de valores de Lima.7 1. Construir un intervalo de confianza del 95% para la proporción de profesionales que conocen aspectos de inversión de BVL. Sistema A p1 75 250 0.7 1. p 140 200 0.ESTADISTICA Reemplazando en la relación X t(1 .7) 200 0. n 1) 2 S n X t(1 .7) 200 0. 0.045 32 30 244.96 4. Solución. el sistema B a 200 empresas.7(1 0. 256 2.3 .9 3. n 1) 2 S 32 . n1 250 Sistema B 156 . n=200 p z1 2 p p z1 p 2 p1 p n 0. se utiliza para controlar a 250 empresas.96 SUNAT con el propósito de incrementar la recaudación fiscal.96 .7 .7(1 0. Después de un periodo de vigilancia de los sistemas se observo que 75 empresas vigiladas con el sistema A no entregan boletas o facturas A y 80 vigiladas con el sistema B también incumplieron con la entrega de facturas. El sistema A. z1 p1 p n 2 1. de los cuales 140 afirman que conocen adecuadamente. diseña dos sistemas (A y B) de control para cumplimiento de entrega de facturas o boletas.045 n 30 256 2.05 267. con tal fin se selecciona aleatoriamente un grupo de 50 cuentas de la provincia A y 40 c de cuentas de la provincia B.011 El intervalo contiene solo valores negativos. observándose que en promedio en la ciudad A se genera una utilidad de 13 miles de soles y 15 miles de soles en la ciudad B y las desviaciones estándar de la ciudad A y B respectivamente son 3 y 4 miles de soles.3 1 0.3 0. n1 50 Ciudad B x2 15.4 1 0.3 250 0.18 ( p1 p2 ) -0. Ciudad A x1 13.4 200 ( p1 p2 ) (0.96* 0.4) 1.96* 0.4) 1. Se realizo un estudio sobre las utilidades que presenta una empresa en dos provincias del Perú .3 250 0.4 1 0. n2 40 z1 1.96 2 ( X1 X 2 ) z(1 / 2) * 2 1 2 2 n1 n2 1 2 ( X1 X 2 ) z(1 / 2) * 2 1 2 2 n1 n2 157 .4 200 -0. Utilizando un intervalo de confianza del 95% para la diferencia de medias ¿Podemos concluir que las utilidades de la empresa en la ciudad B es mayor que la de A? Solución. n1 200 z1 1. entonces.96 2 ( p1 p2 ) z1 * 2 p1 1 p1 n1 p2 1 p2 n2 ( p1 p2 ) ( p1 p2 ) z1 * 2 p1 1 p1 n1 p2 1 p2 n2 (0. p1 p2 De la relación anterior se concluye que el sistema de control A presenta menor 5.3 0.3 1 0. 1 3. 2 4. ( p1 p2 ) 0 nivel de eficiencia que el sistema B.CLETO DE LA TORRE p2 80 200 0.4 . Se obtuvo la siguiente información (en dólares): 150. obtener los intervalos de confianza a un nivel de 95 % para la cantidad media real. s2 A 29043. 184. 174. 146. 142. 2.96* 9 16 50 40 3. 163. 163. 189. 152. 168. xB 23468. EJERCICIOS PROPUESTOS 1. De las distintas convenciones que se llevan a cabo en la ciudad. La Cámara de Comercio de la ciudad A afirma que el ingreso medio de una familia de esta ciudad es de 500$ más que el ingreso medio de una familia de la ciudad B. (Suponer que las poblaciones son independientes). s2 A 22919. En una muestra aleatoria de personas que visitan un famoso centro turístico. 135. y encarga un estudio sobre el tema. una en cada ciudad. Calcular un intervalo de confianza del 95% para la proporción poblacional. La Cámara de Comercio de B discute esto.50 0 . 175.221 41948. 155. 148. normal. y se obtienen los resultados siguientes : Ciudad A: nA Ciudad B: nB 514. se seleccionaron 16 personas y se les preguntó la cantidad que gastaban por día. 158 . 134. preguntaban al auditor anterior cuál había sido la razón del cambio de auditor.337 Calcular el intervalo de confianza para la diferencia de los ingresos medios reales a un nivel del 99%. Conclusiones. La Cámara de Comercio de una ciudad está interesada en estimar la cantidad media de dinero que gasta una persona que asiste a convenciones por día. Se toman dos muestras.a. 84 de 250 hombres y 156 de 250 mujeres compraron recuerdos de su visita.ESTADISTICA (13 15) 1.96* 9 16 50 40 1 2 (13 15) 1.49 Como 1 1 2 0. 3. Construya un intervalo de confianza con un nivel del 95% para la diferencia entre las proporciones reales de hombres y mujeres que compran recuerdos. Si se supone que la cantidad de dinero gastado en un día es una v. De una muestra de 134 auditores empleados en grandes empresas de auditorias. 158. 4. entonces 1 2 2 . 82 de ellos declararon que siempre que recibían un nuevo encargo de auditoria. x A 627. 3 h. Una muestra de 70 ejecutivos de una empresa fue investigada con respecto al pobre desempeño que ésta tuvo en noviembre. ¿Qué tipo de estimación de intervalo podrá usted dar para dar el número absoluto de cuentas que cumplen con los requisitos de excelencia.2 minutos. Un investigador de mercado de una compañía de productos electrónicos desea estudiar los hábitos televisivos de los residentes de una pequeña ciudad.Basándose en el inciso anterior. 7. 159 . dado un nivel de confianza igual a 0. b. con una desviación estándar de 3. Jesús es un corredor de la Bolsa de Valores y tiene curiosidad acerca de la cantidad de tiempo que existe entre la colocación de una orden de venta y su ejecución.. Ayude a Jesús en la construcción de un intervalo de confianza de 95% para el tiempo medio para la ejecución de una orden 6. El dueño de una empresa investigó aleatoriamente 150 de las 3000 cuentas de la compañía y determinó que 60% de éstas estaban en una posición excelente.95. manteniendo el mismo nivel de confianza de 95%? 8..CLETO DE LA TORRE 5. 65% de los ejecutivos creía que la disminución en las ventas se debió al alza inesperada de la temperatura. Los resultados son los siguientes: Tiempo frente al televisor: x = 15. Encuentre el límite de confianza para esta porción. a. b) Establezca un intervalo de confianza de 95% para la proporción de participantes que ven las noticias al menos 3 noches por semana. Jesús hizo un muestreo de 45 órdenes y encontró que el tiempo medio para la ejecución fue de 24.3 minutos. s = 3. 27 participantes ven las noticias al menos 3 noches por semana a) Establezca un intervalo de confianza de 95% para el promedio semanal de tiempo que ven televisión en esta ciudad. lo cual trajo como consecuencia que los consumidores retardaran la adquisición de productos de invierno.Encuentre un intervalo de confianza de 95% para la proporción de cuentas que están en posición excelente. Selecciona una muestra aleatoria de 40 participantes y les pide que mantengan un registro detallado de lo que ven en televisión durante una semana.8 h. se supone que la variación salarial es la misma en las dos sucursales y que los salarios siguen una distribución normal.50 $ por hora. 10. 11 .035 de la proporción real de los que ven las noticias al menos 3 noches por semana si no disponía de estimaciones anteriores? e) Con base en (c) y (d). 31 a) Calcular un estimador puntual para la proporción de empleados que trabajan más de 20 horas b) Calcular un estimador puntual para el número medio de horas extras que trabajan los empleados. 23 . Hay un desacuerdo considerable sobre el nivel salarial medio de los trabajadores de la sucursal A y B. Los salarios fueron establecidos por el antiguo convenio colectivo firmado hace tres años y se basa en la estricta antigüedad.ESTADISTICA c) ¿Qué tamaño de muestra necesita si desea tener 95% de confianza de que su resultado es correcto dentro de ± 2 horas y supone que la desviación estándar de la población es igual a 5 horas? d) ¿Qué tamaño de muestra necesita si desea una confianza de 95% de estar dentro de ± 0. s2 =93. Se toma una muestra de 12 empleados de una planta productora. Como los salarios están muy controlados por el convenio colectivo. 28 .¿ qué ajustes habrá que hacer. 36 .10 A 2 Sucursal B nA 19. Con los datos que se dan a continuación. Pero se piensa que hay diferencia entre los niveles salariales medios a causa de las diferentes estructuras de antigüedad entre las dos sucursales. en caso de ser necesario?. 18 . el número de horas extra que estos empleados hicieron durante el último mes fueron: 22 . El negociador del convenio colectivo por parte de la dirección le pide que elabore un intervalo de confianza del 98% para la diferencia entre los niveles salariales medios. Si existe una diferencia entre las medias.16 . Las negociaciones salariales entre su empresa y el sindicato que representa a sus trabajadores están al borde de la ruptura. xA =17. 26 . ¿qué tamaño de muestra debe seleccionar si sólo realiza un estudio? 9. habrá que hacer ajustes para elevar los salarios más bajos hasta el nivel de los más altos. 41 . sA =87.10 160 .53 $ por hora. xA =15. 29 . 12 . Sucursal A nA 23. CLETO DE LA TORRE 161 . El diseño de la investigación debe permitir probar la veracidad de sus ideas sobre la población en estudio. Esta hipótesis nula es la que se somete a comprobación. Si la hipótesis estadística identifica por completo la distribución. Aceptar Ho Ho verdadera Ho falsa Decisión correcta Error Tipo II Rechazar Ho Error Tipo I Decisión correcta Denominamos nivel de significación ( ) de un contraste a la máxima probabilidad de cometer un error del tipo I que estamos dispuestos a sumir. y es la que se acepta o rechaza. y si no la especifica recibe el nombre de “hipótesis compuesta”. como la conclusión final de un contraste.4 PRUEBAS DE HIPOTESIS En muchas situaciones el investigador tiene alguna idea o conjetura sobre el comportamiento de una o más variables en la población. Hipótesis alternativa (denotada como Ha). basándonos en la información suministrada por una muestra. Esta hipótesis puede ser simple o compuesta. La idea o conjetura es una hipótesis y el procedimiento de toma de decisión sobre la hipótesis se conoce como prueba de hipótesis. Una hipótesis estadística es una conjetura sobre el comportamiento probabilística de una población. Hipótesis nula (denotada como H0). recibe el nombre de “hipótesis simple”. Se denomina hipótesis alternativa aquella hipótesis contra la cual queremos contrastar la hipótesis nula. o debe rechazarse. 162 . El contraste de hipótesis tiene por finalidad decidir si una conjetura puede considerarse cierta.ESTADISTICA 8. en base a los datos de la muestra. Podemos cometer dos tipos de error: rechazar la hipótesis nula siendo ésta cierta (error de tipo I) y aceptar la hipótesis nula cuando esta es falsa (error de tipo II). 3. la hipótesis nula la tomamos a partir de la información proporcionada por la muestra (estadístico de prueba). 0 ó Ha : 0 2. Para Ha : 0 163 . la región crítica en la que se rechaza la hipótesis nula (tiene probabilidad que se acepta la hipótesis nula. si H 0 es cierta) y la región de aceptación. Nivel de significación del contraste es la probabilidad de cometer un error del tipo I. 1.CLETO DE LA TORRE La decisión de rechazar. es pues. Estas variables se medirán mediante una variable denominada estadígrafo de contraste. 4. Estadístico de prueba. Realizamos una partición del espacio muestral en dos regiones. Formulación de hipótesis. Los pasos que son convenientes seguir para realizar el contraste de hipótesis son: 1. 3. o no. en la Antes de definir los pasos de una prueba de hipótesis se define algunos conceptos básicos. H0 : 0 Vs Ha : 0 ó Ha : . y se acepte en caso contrario. Determinar la región crítica. un mecanismo mediante el cual se rechaza la hipótesis nula cuando existan diferencias significativas entre los valores muestrales y los valores teóricos. y que para cada muestra tomará un valor particular. La forma de la región crítica depende de la hipótesis alterna. El contraste de hipótesis. La región crítica es el conjunto de valores del estadístico de contraste que nos induce a rechazar la hipótesis nula PASOS DE UNA PRUEBA DE HIPOTESIS. es decir. que sigue una distribución determinada conocida. A continuación se dan una serie de regiones de aceptación para ciertos contrastes de hipótesis con nivel de significación . de rechazar la hipótesis nula siendo cierta. y se acostumbra a denotar por 2. Elegir el nivel de significación. H0 R.R. H0 La región de rechazo de la hipótesis nula es la sombreada. H0 Z(1 R. H0 R. Se rechaza H0 cuando el estadístico de prueba toma un valor comprendido en la zona sombreada y se acepta Ho cuando el valor del estadístico de prueba cae en la región de aceptación.A.R.ESTADISTICA 1 /2 /2 Z(1 R. 164 .A. H0 R.A. H0 Para Ha : 0 1 Z(1 R. H0 Para Ha : 0 1 Z(1 R. región no sombreada.R.R. PRUEBAS DE HIPOTESIS EN POBLACIONES NORMALES. Hipótesis Nula Prueba de Medias H0: Si 2 Estadística Prueba de Criterio de rechazo de H0 Hipótesis Alternativa Zc Ha : Ha : > < 0 0 0 = 0 vs: z1 2 conocido Zc X 0 / n Zc z1 -Si la población no es Ha: normal pero n 30 Prueba de Medias H0: = 0 Zc X 0 s/ n Zc Tc t1 z1 n 1 2 Ha : Ha: Ha : > < 0 0 0 vs Si se asume que : 2 Tc X S/ 0 n Tc Tc t1 t1 z1 2 n 1 n 1 es desconocido de de Ha: Ha : 2 1 1 1 2 Prueba diferencias Medias H0: 1 Zc > < Zc X1 X 2 2 1 n1 2 2 n2 2 2 Zc Zc z1 z1 = vs: Ha : Asumiendo 2 1 Zc X1 X 2 2 s1 n1 2 s2 n2 y 2 2 Conocidos --Si las poblaciones no son normales pero n1 30 y n2 30 Prueba de diferencia de Medias H0: 1 Ha : vs Ha : 1 1 2 Tc X1 X 2 Sp 1 1 n1 n2 Tc t1 2 n1 n2 2 = 2 > 2 Tc t1 n1 n2 2 165 . A continuación se presentan las pruebas de hipótesis en forma de resumen.CLETO DE LA TORRE 5. Pruebas de Hipótesis. Conclusión. Determinar las conclusiones estadísticas del contraste (aceptar o rechazar Ho). Ha : H0: 2 1 2 2 2 1 2 1 2 1 2 2 2 2 2 2 Fc F nmax 1. nmin 1 ó Fc F1 2 2 Fc vs Ha : 2 Smax 2 Smin Fc F1 n1 1. n2 1 Fc F n1 1. n2 1 Prueba proporciones de Ha : p p0 Zc p p0 p (1 p )/ n Z c z1 Zc 2 H a : p > p0 H0: p =p0 Vs H a : p < p0 z1 Zc Prueba de diferencia de proporciones Ha: p1 p2 z1 z1 2 Zc pc p1 p2 pc (1 pc ) pc (1 pc ) n1 n2 Zc Ha: p1 > p2 H0: p1 =p2 Vs Ha: p1 < p2 n1 p1 n1 n2 p2 n2 Zc z1 Zc z1 166 .ESTADISTICA Asumiendo 2 1 2 2 que: Ha: 1 < 2 y Sp 2 2 n1 1 S1 n2 1 S2 c n1 n2 2 T t1 n1 n2 2 desconocidos Prueba de diferencia de Medias H0: 1 Ha : vs Ha : Ha : y 1 1 1 2 Tc v X1 X 2 2 S1 n1 2 S2 n2 2 S1 2 ) n1 2 ( S 2 / n2 ) 2 n2 1 Tc t1 v 2 = 2 > < 2 2 Tc t1 v Asumiendo que: 2 1 2 2 2 S1 n1 2 ( S1 / n1 ) 2 n1 1 ( Tc 2 c t1 v 2 2 desconocidos Prueba de varianzas H0: 2 Ha : Ha : Ha : 2 2 2 2 0 2 0 2 0 n 1 ó 2 c 2 1 n 1 2 = 2 0 vs 2 c n 1S 2 0 2 2 c 2 c 1 n 1 n 1 Prueba de razón de Ha: varianzas. Zc X 0 / n 180 .645 Zc =9. por lo tanto se debe pagar más de lo que actualmente se contribuye. a favor de la hipótesis de que el pago de impuestos es mayor al contribuido actualmente? .. Resulto una media muestral de 580 soles por concepto de impuestos. n 60.El pago en promedio por concepto de impuestos de los establecimientos comerciales en una ciudad es de 355 soles. pagando menos del debido. z1 1.645 . al nivel de 95% de confianza. Como Zc Zo Se rechaza la hipótesis nula. Proporcionan estos datos suficiente evidencia estadística. 167 .CLETO DE LA TORRE EJERCICIOS RESUELTOS 1.Se aplico una estrategia diferenciadora para colocar un producto en el mercado.68 Región critica =5% Z0=1.68 Región Aceptación Región Crítica Conclusión. Para contrastar esta hipótesis se analiza las ventas de 60 establecimientos comerciales. x1 580 Zc 580 355 180/ 60 9. H0: Ha: = 355 > 355 5% 180 Nivel de significancia. Estadística de prueba. 2. Use Solución Formulación de hipótesis. Se Sospecha que estos establecimientos evaden el pago de impuestos. A. t(1 / 2. Solución Formulación de hipótesis.R.R.262 n 9. 168 .76 / 9 4. Tc s X 0 S/ n 7. Antes Después 25 27 25 29 4 27 37 10 44 56 12 30 46 16 67 82 15 53 57 4 53 80 27 52 61 9 Diferencia 2 Hay suficiente evidencia estadística (al nivel de significación 0.ESTADISTICA En el cuadro siguiente se muestra las utilidades antes y después de aplicar la estrategia en miles de dólares.262 se rechaza la hipótesis nula.25 R.05) a favor de que la estrategia presenta un efecto positivo?.26 R. x1 11 Tc 11 0 7. H0: Ha: d d =0 0 5% Nivel de significancia.26 tc=4.76 . n 1) 2. H0 R.25 Región critica t0=–2. Estadística de prueba. Como tc 2. H0 t0=2. H0 Conclusión. Estadística de prueba.6 125. Los resultados del estudio se muestran a continuación. Empresa A Empresa B n1 13 .975 27 2. S12 29. S22 26.27 Tc X1 X 2 Sp 1 n1 1 n2 138.975 13 16 2 6.052 169 .6 .7 13 16 2 5.50 Región critica T0 t1 2 n1 n2 t0. x1 138..8 . Solución. Formulación de hipótesis.16 n2 16 .8 . para tal efecto se recopilo información de las recaudaciones diarias de las dos empresas.Se desea comparar el nivel de posicionamiento de dos empresas A y B en una ciudad.27* 13 16 2 t0.CLETO DE LA TORRE 3. S12 29.6 . H0: Ha: 1 1 = 2 2 Nivel de significancia. x1 138. x2 125.16 16 1 *26.7 Sp 2 2 n1 1 S1 n2 1 S2 n1 n2 2 13 1 *29.7 En base a la información.16 n2 16 . cual es su conclusión al 95% de confianza. 5% Supongamos que las varianzas poblacionales son iguales.8 1 1 5. entonces el estadístico de prueba es: Tc De la información se tiene: Empresa A Empresa B X1 X 2 Sp 1 n1 1 n2 t (n1 + n2 -2) n1 13 . x2 125. S22 26. 50 R. Como Tc T0 .052 tc=6.2 . n1 600 Provincia B. 20% en la actualidad exige boleta o factura. Formulación de hipótesis.15 600 600 0. Se selecciona a pobladores de ambas regiones que no presentaban esta cultura y se observo que de 600 residentes de la Región A. con la finalidad de que exijan la entrega de Boletas o facturas por todo servicio en dos regiones (A y B) del país. Estadística de prueba.15 . H0 R.El Ministerio de Economía viene desarrollando programas destinados a la población.2 600*0. 15 % en la actualidad exige la entrega de boletas.175 170 .R. Zc p1 p2 pc (1 pc ) pc (1 pc ) n1 n2 Provincia A. p1 0.ESTADISTICA t0=–2. H0: p1 =p2 Ha: p1 p2 5% Nivel de significancia. entonces se rechaza H0.052 R. H0 t0=2. H0 Conclusión. n2 n1 p1 n2 p2 n1 n2 600 600*0. en cambio de 600 residentes de la Región B . ¿Es posible concluir con 95% de confianza que el programa a tenido similar resultado en las provincias A y B ? Solución.A.R. p2 pc 0. 4. 96 Región Aceptación Zc =2.175(1 0.2 7.3 6.3 5.0 8.3 7.279 Región Crítica Conclusión.175) 600 600 2.175) 0.279 Región critica =5% Z0=1.1 6.2 8.1 6.2 7.9 Que tipo de Acción debería recomendar el especialista a sus clientes que a) Menos riesgo de inversión b) Mayor utilidad. se rechaza la hipótesis nula. Como Zc Zo .5 7. Se esta enfocando en un primer momento el comercio por el lado de las exportaciones ya que determinan la cantidad de dólares que ingresan al país por vía 171 .3 prefieren: Acción 2 7. el comercio entre países debería asumir un papel activo con el fin de ayudar al crecimiento de los países que lo llevan a cabo.9 5.175(1 0.2 8. por tanto p1 p2 EJERCICIOS PROPUESTOS 1) Un especialista trabaja como corredor para una empresa.3 8.3 8.2 5.20 0. 2) Un grupo de economistas esta realizando un estudio sobre el comercio internacional del Perú: consideran que en el actual contexto de continuas y profundas transformaciones.15 0.CLETO DE LA TORRE Zc p1 p2 pc (1 pc ) pc (1 pc ) n1 n2 0.6 7.2 6. Justifique adecuadamente sus respuestas.3 6. Sus registros muestran las tasas de rendimiento ( en porcentajes) para 10 meses en dos tipos de acciones Acción 1 5. a de pequeños inversionistas de tamaño igual al que obtuvo en a) y obtiene que 300 inversionistas reacción de manera A. b) La diferencia entre las exportaciones tradicionales en promedio y las no tradicionales es mayor que 1000 millones de dólares. Estime la media de toda las cuentas cobrar utilizando un intervalo de confianza del 98%.04 con un nivel de confianza del 95%. 900. 4) La reacción de un pequeño inversionistas con respecto a un cambio de política que modifique las reglas de juego de la economía es : retirar su inversión (A) o continuar con la inversión inicial(B). 500. Desarrolla el intervalo de confianza del 97% para el porcentaje de inversionistas que retirarían su inversión. además de una prueba piloto se obtuvo que 90% retiraría su inversión b) El investigador realiza la encuesta con una m. A continuación se presenta la información con la que cuenta el grupo de economistas sobre las exportaciones (en millones de dólares) para el Perú a lo largo de 31 años (desde 1960 -1990).Interprete el resultado brevemente. Tradicionales X1 1478 y s1 818 y No tradicionales X 2 340 y s2 357 En base a la información que se tiene se puede concluir que: a) Las exportaciones tradicionales en promedio anual es de 1500 millones de dólares. 860. Una muestra de 10 cuentas por cobrar seleccionadas al azar de un total de 400 cuentas que tiene esta compañía revela los siguientes datos. 790. 600. 172 . Usar 1% 3) Un auditor quiere estimar el monto promedio de las cuentas por cobrar de la compañía A. 500. 480. Un investigador quiere estimar la proporción de inversionistas que reaccionan de manera A. a) ¿ Que tan grande debería ser la muestra si se desea que el estimado del porcentaje de inversionistas de la población que retiran su inversión tenga error de estimación menor que 0. Justifique adecuadamente sus respuestas.ESTADISTICA intercambio comercial y porque la estructura de las mismas mostrara un mayor o menor ingreso en divisas. 760. 900. 750. 0.0. 2.0.0. De 875 hombres.0. Utilice un nivel del 90%.1.1.0.1.1. ¿Se confirma la sospecha del gerente? 1.1. De una muestra de 361 propietarios de pequeños comercios que quebraron en un período determinado. 3.0. Cuando Eastern Airlines se acogió a la protección de las leyes de bancarrota en 1989 en virtud del capítulo 11.0. Por experiencia se sabe que lo que ha venido ocurriendo es que a lo sumo el 25% de los comercios que no reciben asesoramiento quiebran. Donde 1 indica precios más bajos y 0 indica que los precios se mantienen igual que antes. observándose: 1.1.1.0.1.1.1.1. el senador Kennedy estimó que las empresas que buscan liberarse de las presiones de los acreedores debían.1. Durante una sesión de un subcomité del Senado. más de 2200 millones de dólares.1.CLETO DE LA TORRE 5) El gerente de una cadena muy conocida de tiendas sospecha que su principal competidor esta intentando vender los mismos productos a precios más bajos.1.1. Anteriormente las dos tiendas habían mantenido un balance en los precios de forma tal que la mitad de los artículos de una eran ligeramente más caros que los de la otra y viceversa.1. Contrastar las hipótesis a nivel de significancia del 5% 4.0.1.1.0. se hizo evidente que muchas de las mayores empresas de la nación estaban en dificultades financieras. de media. sólo 309 están a favor.0. envió un comprador a la otra tienda para ver los precios de 50 artículos seleccionados al azar.1.0. ¿Está respaldada la afirmación de Kennedy al nivel del 10%?. Muestras de 230 agencias 173 .1.0.1. 412 informan que tienen una impresión positiva. Analice si estos resultados prueban que ha habido un aumento en el porcentaje de quiebras.0. Una corporación bancaria quiere comparar el nivel medio de las cuentas de ahorro abiertas en bancos comerciales del Lima con las de Cusco.0.0.1.0. Una comprobación de 17 juicios recientes en virtud del capítulo 11 reveló que las empresas implicadas debían 2430 millones de dólares.1.1.0.1.1. 105 no tuvieron asesoramiento profesional antes de abrir el negocio. para investigar esta posibilidad.0. con una desviación típica de 900 millones de dólares.1.0. Un investigador de marketing quiere determinar si existe alguna diferencia en la proporción de hombres que responden favorablemente a un determinado anuncio y la proporción de mujeres que lo hacen. de las 910 mujeres encuestadas.0. respectivamente. Se emparejaron las empresas de nueve sectores concentrados con las de un número igual de sectores en los cuales el poder económico estaba más disperso.9 4.2 6.ESTADISTICA bancarias del Lima y 302 en Cusco.8 4. estructuras de costo y todos los demás factores que pueden afectar a los precios industriales. A continuación se indican los incrementos medios del precio en porcentajes de cada sector. Se sabe que la desviación típica en las cuentas para cada estado son 517 dólares para el Lima y 485 dólares para Cusco.9 Sectores menos concentrados 3.2 3.6 5.6 0.8 5.6 174 .1 4. Contrastar la hipótesis de que no hay diferencia de ahorros medios al nivel del 5%.1 2. tienen medias de 1512 dólares y 1317 dólares.1 4.7 2.7 3. Se hicieron coincidir las empresas de cada grupo en cuanto a competencia extranjera. ¿parece que los sectores concentrados presentan una presión inflacionaria más pronunciada que los sectores menos concentrados? Pareados de sectores 1 2 3 4 5 6 7 8 9 Sectores concentrados 3.1 -0. Se teme que las empresas poderosas en sectores de tan alta concentración dominen el mercado con fines egoístas.9 4. Muchos estudios económicos se ocupan de sectores en los cuales una gran parte del dominio del mercado se concentra en manos de unas pocas empresas.7 4. 5. Al nivel del 5%.2 3. en las que se establecen modalidades o categorías. están basadas en el supuesto de que la muestra pertenezca a una población con distribución conocida. Este tipo de distribución bidimensional de frecuencias suele presentarse en forma de tabla de doble entrada. 9. La información obtenida del estudio generalmente se presenta en una tabla de contingencias. en esta se tiene un conjunto de n elementos clasificados de acuerdo a dos criterios.1 TABLA DE CONTINGENCIA Es relativamente frecuente encontrarse con información referida a la observación de dos características de una población. La justificación de estos problemas es comparar las frecuencias esperadas y las observadas. también llamada tabla de contingencia. X e Y.CLETO DE LA TORRE CAPITULO IX PRUEBA DE CHI-CUADRADO Las pruebas de hipótesis desarrolladas anteriormente. La prueba de homogeneidad y la prueba de independencia. cada uno de los cuales tiene una serie de categorías mutuamente excluyentes: 175 . Muchas de las investigaciones científicas Aquí abordaremos dos problemas muy interesantes dentro de lo que se conoce con el nombre de estadística no paramétrica. mediante las cuales se clasifican los individuos o elementos que constituyen una muestra de la misma. . n. r o... Yc o1c Total o11 o12 o22 .. con la información suministrada por las muestras obtenidas. ni. Si.. o2c .. c nij j 1 En esta sección se verán las pruebas de homogeneidad y de independencia.... n1.2 PRUEBA DE HOMOGENEIDAD..2 orj n. oij . Sea ni. se puede aceptar que esto es así. . el número de individuos que pertenecen simultáneamente a las categorías X i e Yj .. En ocasiones ocurre que tenemos a varias poblaciones clasificadas de acuerdo con las categorías definidas para una determinada variable. o21 .. oi 2 ... n2. el tamaño de la muestra extraída de la i-ésima población. Si bien ambas pruebas presentan el mismo procedimiento de cálculo. Existen r poblaciones y una muestra aleatoria es extraída desde cada población.. las hipótesis a probar son diferentes y por lo tanto las conclusiones obtenidas también. j orc nc.. La pregunta que se sugiere inmediatamente es si la proporción de individuos pertenecientes a cada una de las clases es la misma en todas las poblaciones. . diremos que las poblaciones son homogéneas con respecto a la variable de clasificación utilizada... o1 j o2 j .. oi1 . Y2 . Xr Total or1 or 2 n.... es decir.ESTADISTICA Y1 X1 X2 . oic . oij representa la frecuencia observada.. Xi ..1 n... 9. Cada observación de cada muestra puede ser clasificada en una de c categorías 176 .Yj .c n En esta tabla... j i 1 nij y oi. j es el número total de observaciones en la categoría j extraídas desde las r poblaciones y n.c n r. n.…c H1: Al menos una igualdad no se cumple. Población r Total O r2 n. … o rc n.. La estadística de prueba esta dado por: r 2 xc j 1 j 1 c (oij eij eij ) x 2 (r 1)(c 1) donde eij ni .. O 1c c O2c n2• En la tabla. nrCategoría Total n 1•. Las hipótesis pueden expresarse equivalentemente de la siguiente manera: H0: La variable aleatoria tiene la misma distribución de probabilidades en las r poblaciones. j n... Hipótesis: Sea ij la probabilidad de que una observación seleccionada de la población i sea clasificada en la categoría j.( r 1)( c 1) 177 .CLETO DE LA TORRE diferentes. H1: La variable aleatoria tiene una distribución de probabilidades diferente en al menos una de las poblaciones. 2... . … .. Regla de decisión: 2 La hipótesis nula se rechaza con un nivel de significación a si el xc resulta mayor que el valor de tabla x 2 1 .2 . Entonces las hipótesis son: Ho : 1j =... .x n. .1 O r2 n.. . . = rj para todo j = 1. es el total de observaciones extraídas desde las r poblaciones... n. oij es el número de observaciones de la muestra i clasificadas en la categoría j. Los datos son arreglados en la siguiente tabla de contingencia r c: Categoría Categoría Población 1 O 11 O 12 2 1 O22 Población 2 O 21 . . n ro n. Entonces las hipótesis son: Ho: ij i... 0 rc n . es extraída. y cada observación de la muestra es clasificada de acuerdo a dos criterios (variables X y Y).j la probabilidad de que una observación sea clasificada en la la probabilidad de que una observación sea clasificada en la columna j. Estadístico de prueba: 178 . es el número total de observaciones en la fila i y n. Los datos son arreglados en la siguiente tabla de contingencia rxc: Fila 1 Fila 2  Columna Columna . .. . 0 2c n2. .ESTADISTICA 9. HI: Las variables X y Y no son independientes.2 . r.i O r2 n .. c. Usando el primer criterio cada observación es clasificada en una de r filas y usando el segundo criterio en una de c columnas.    Columna c Total O ic ni.3 PRUEBA DE INDEPENDENCIA Esta prueba permite analizar si dos variables aleatorias son o no independientes. n i . fila i y . . Hipótesis: Sea ij la probabilidad de que una observación sea clasificada en la fila i i.. .. columna j. o jj es el número de observaciones clasificadas en la fila i columna j.. Las hipótesis pueden expresarse. en forma equivalente de la siguiente manera: Ho: Las variables X y Y son independientes. 1 2 0 21 0 22 . .. 0 11 0 12 .... .   Fila r Total O r2 n . H1: Al menos una igualdad no se cumple.. En la tabla. Dado una muestra aleatoria de tamaño n. j = 1.. j para todo i = 1. j es el número total de observaciones en la columna j. CLETO DE LA TORRE r 2 xc j 1 c j 1 (oij eij eij ) x 2 (r 1)(c 1) donde eij ni .33 93.67 106.67 .2. e12 600 320* 200 106.67 106.1 En una investigación realizada sobre las preferencias de 3 marcas.67 179 130 93. e22 280* 200 600 2 93. EJERCICIOS RESUELTOS 8.33 93.33 2 50 93. j n.67 600 e21 2 c 280* 200 600 2 93.33 93.33 70 106.x n.33 .33 . e23 2 280* 200 600 2 93.67 .33 100 93. H1: Las preferencias de los tres marcas no son similares e11 320* 200 106. e13 600 320* 200 106. Marcas Preferencias Si No Total A 70 130 200 B 100 100 200 C 150 50 200 Total 320 280 600 ¿Podemos concluir con 95% de confianza que las preferencias de las marcas es similar? Solución. Regla de decisión: Se adopta la siguiente regla de decisión: Si Si 2 c 2 c 2 ( r 1)( c 1) 2 ( r 1)( c 1) entonces se acepta la hipotes H 0 entonces se rechaza la hipotes H 0 Como puede observarse el procedimiento es muy similar al de la prueba de homogeneidad.67 106.67 150 106. se obtuvo los siguientes resultados.33 2 .67 100 106. H0: Las preferencias de las tres marcas son similares.. y a veces suelen confundirse. A.R.. 5.99 2 o =65.ESTADISTICA 2 c 65.991 1 2 o =5. 2.625 2 0 De la tabla de chi-cuadrado . H0 Como 2 c 2 0 .. Las frecuencias observadas y esperadas (frecuencias esperadas entre paréntesis) se presentan en la siguiente tabla: dependiente del tamaño de la 180 .625 R. se rechaza la hipótesis nula Las preferencias de los tres marcas no son similares. Ho: El uso de técnicas de valorización es independiente del tamaño de empresa. H0 R.En un estudio sobre el uso de tres técnicas de valorización de empresas de distinto tamaño. HI: El uso de técnicas de valorización es empresa. se obtuvo los siguientes resultados. Técnicas de valorización Tamaño de la empresa Alto Actualmente En el pasado Nunca Total 51 92 68 211 Medio 22 21 9 52 Bajo 43 28 22 93 Total 116 141 99 356 ¿El uso de técnicas de valorización es independiente del tamaño de la empresa? Solución. 57) 68(58.510 Los grados de libertad para el estadístico de prueba son (3 -1)(3-1) = 4.68) 211 Medio 22(16.488 .86) 93 Total 116 141 99 356 Con estos datos el estadístico de prueba es: 3 3 xc2 i 1 j 1 oij eij eij 2 18.30) 28(36. Hace una encuesta en un grupo de firmas que tienen distintas cantidades de activos y las dividen tres grupos. Como el valor calculado es mayor que el valor de tabla se rechaza H o y se concluye que existe suficiente evidencia estadística para aceptar que el uso de técnicas de valorización depende del tamaño de la empresa .83) 22(25.CLETO DE LA TORRE Tamaño de la empresa Uso de software Alto Actualmente En el pasado Nunca Total 51 (68.60) 9(14.95. El 2 valor de tabla para un nivel de significación del 5% es x(0.4) 9. A continuación se dan los resultados de la encuesta: Deuda con respecto Tamaño de activos de la firma( en miles) al capital social Menor Mayor Total < $ 500 12 5 17 $500-2000 13 15 28 181 >$2000 4 13 17 Total 29 33 62 .94) 21(20.75) 92(83..Un asesor financiero quiere conocer las diferencias en la estructura de capital de varios tamaños de empresa en cierta industria. Clasifica cada una según que su deuda sea mayor que el capital contable de las acciones o que su deuda total sea menor.46) 52 Bajo 43(30. 3. 4% 53. Japón y de la Comunidad Económica Europea (CEE).6% 46. capital es similar en los distintos tipos de empresa.05. juega un papel muy importante en la decisión de las hipótesis.5% 17 28 17 100.4% 23.023 Chi-cuadrado=7.0% Total 29 46. (Independientes) HI: La Estructura de capital es similar en los distintos tipos de empresa (Dependientes) Estructura de capital Menor Mayor Total Tamaño de activos de la firma < $ 500 $500-2000 >$2000 12 13 4 70. específicamente su posición frente a la importación de ciertos bienes manufacturados de piases en vías de desarrollo como los Latinoamericanos. en el caso que p > 0. Se interrogo a representantes de EEUU. EJERCICIOS PROPUESTOS La estructura de 1) Durante la ultima ronda negociaciones del GATT (acuerdo general de tarifas y comercio). en este caso influye el factor.2% 62 100.563 EL p-valor. 182 . En nuestro ejemplo p-valor<0.6% 76.ESTADISTICA ¿Tienen idéntica estructura de capital los 3 tamaños de empresa? Solución Ho: La Estructura de capital es similar en los distintos tipos de empresa.05 se acepta la hipótesis alterna con un nivel de confianza del 95%. Si pvalor < 0.5% 5 15 13 29. P-valor=0.0% 100. no influye el factor. un grupo de investigadores de Latinoamérica evaluó en base a encuestas la actitud de los representantes de los países desarrollados respecto al proteccionismo de sus mercados individuales.05 la decisión es aceptar la hipótesis nula.0% 100.0% Frecuencia Porcentaje Frecuencia Porcentaje Frecuencia Porcentaje . se rechaza la hipótesis nula.8% 33 53. 0 2.0 3. De los 500 tarjeta habientes que fueron reportados por falta de pago en este mes. EEUU A favor de la importancia En contra de la 35 65 Japon 76 74 CEE 37 43 importancia En base a los datos ¿puede inferir los investigadores que el GATT ha cumplido su objetivo de liberalizar el comercio y homogeneizar las tendencias comerciales de sus países miembros mas importantes. B 6. bonos y fondos mutuos.2 2. Con tal motivo se ha seleccionado muestras aleatorias de inversión y ha registrado las tasas de rendimiento en cuatro entidades financieras.9 D 4. que 5% de los tarjeta habientes han tenido algunos estudios de bachillerato.1 3. 50 tenían estudios de bachillerato.0 3.5 3) El departamento de tarjetas de crédito bancarias del California Bank sabe que por su larga experiencia. Redacte un informe técnico sobre 2) Un investigador quiere averiguar si hay diferencias significativas en las tasas de rendimiento de valores. 190 tenían cierta preparación universitaria y 160 concluyeron la instrucción en la universidad.CLETO DE LA TORRE Numero de representantes por paises. 100 terminaron tal nivel escolar. Entidades Financieras A Valores Bonos Fondos mutuos ¿ Influye en la tasa de rendimiento el tipo de inversión y la entidad financiera?.Use 5% .1 C 2. y 55% han concluido la instrucción en universidad. Redacte Adecuadamente sus conclusiones. Use este estudio.1 5. 15% han terminado dicho nivel escolar. 1% .3 6 4. ¿Se puede concluir 183 . 25% han tenido ciertos estudios universitarios.5 4. 05.01 para determinar si existe relación entre el nivel directivo o gerencial y el interés en asuntos ambientales. obteniéndose los siguientes resultados: Adquisiciones NE Adquirieron la marca No la adquirieron 60 45 55 50 40 Región NO 55 SE 45 SO 50 Si el nivel de significancia es de 0.01 4) Doscientos hombres de diversos niveles de gerenciales. En una encuesta en la que el país fue dividido en 4 regiones geográficas. 5) Un administrador de marca está preocupado porque su producto puede estar mal distribuido a lo largo de todo el país. Los resultados fueron: Nivel de gerencial Preocupación Sin interés Gerencia alta Gerencia media Supervisor Jefe de grupo 15 20 7 28 Algo de interés Gran preocupación 13 19 7 21 12 21 6 31 Utilice el nivel de significancia de 0. La respuesta de cada persona se registró en una de tres categorías: interés nulo. fueron entrevistados con respecto a su interés o preocupación acerca de asuntos ambientales.ESTADISTICA que la distribución de tarjeta habientes que no han pagado sus cuentas es diferente de la de los demás?. se investigó una muestra aleatoria de 100 consumidores de cada región. siendo los resultados los siguientes: 184 . Aplique el nivel de significancia de 0. ¿Cuál es su conclusión? 6) Se encuestó a varios directores generales de empresas y se les pidió que valoraran la dependencia entre el rendimiento financiero de su empresa y la estrategia de la misma. seleccionados al azar. algo de interés y gran preocupación. En un estudio posterior. un economista observó el proceso de selección de 1000 compradores en tres supermercados. un experto en estudios sobre el comportamiento de los consumidores . Los datos sobre los 1000 compradores. medio y alto respectivamente. Estos se encontraban ubicados en tres áreas distintas de la ciudad. 7) Se clasificó una muestra de agencias inmobiliarias según su número de empleados y por si tenían o no un plan de marketing. han encontrado que aquellos de nivel soioeconómico bajo no están usando la ventaja que representa el tener exhibido en la etiqueta el precio unitario. 249 MEDIA 494 185 ALTA 201 . Sin embargo. y a manera de corroboración de los resultados reportados.CLETO DE LA TORRE Estrategia Rendimiento financiero Bajo Medio 25 52 49 Alto 18 23 61 Baja Media Alta 15 30 23 ¿A qué conclusión llega usted? Utilice un nivel de confianza del 90% para su prueba.uu. clasificados de acuerdo a su clase socioeconómica y al hecho de haber comprado con base en los precios unitarios o no. Se habían puesto paquetes de productos de la misma marca pero conprecios unitarios distintos. y correspondían a clases sociales de nivel bajo. para estudiar si había o no dependencia entre ambas variables Número de empleados Menos de 100 Entre 100 y 500 Más de 500 Con plan de Marketing 13 18 32 Sin plan de Marketing 10 12 6 Utilizando un nivel de significación del 1% realice la prueba correspondiente. 8) El incluir en las etiquetas de los productos alimenticios el precio unitario del producto tiene por objeto el facilitar a los compradores la elección. fueron: BAJA Usó pp. 05 evedencia que respalde los reportes del experto ? 9) Con el objeto de asesorar correctamente a sus clientes. 26 26 4 ¿Muestran los datos al nivel 0. bonos. todas miembros de la bolsa . pequeñas y medianas) y según hayan utilizado o no alguna de las fuentes de financiación especificadas en el cuestionario. acciones o bonos convertibles recomendaría. el gerente de un supermercado observó el número de clientes que escogieron cada una de las 6 cajas de pago distintas de la salida. un banco pidió la opinión de 50 analistas en inversión de cada una de tres firmas consultoras distintas. Las empresas se clasifican según su tamaño en tres categorías (micros.uu.05? 11) Se ha realizado un estudio sobre la utilización de ciertas fuentes de financiación externas para las pequeñas y medianas empresas (PYMES). A cada uno le fué preguntado específicamente cual de los tres tipos de inversión. Los datos obtenidos son: Si utiliza financiación Micros 115 186 No utiliza financiación 325 . Para ello se han seleccionado aleatoriamente 500 PYMES de una región.ESTADISTICA No usó pp. Los resultados fueron: Caja número Frecuencia 1 84 2 110 3 146 4 152 5 61 6 47 ¿Presentan los datos suficiente evidencia de que hay cajas preferidas al nivel 0.10 de que las tres firmas consultoras opinan distinto? 10) En un día dado. Las respuestas se presentan en la siguiente tabla: FIRMAS A Acciones Bonos Bonos convertibles 13 31 6 CONSULTORAS B 16 24 10 C 7 35 18 ¿Proporcionan éstos datos evidencia al nivel 0. 187 .CLETO DE LA TORRE Pequeñas Medianas 20 15 20 5 ¿Existe alguna relación entre el tamaño de la empresa y el hecho de recurrir o no a las fuentes de financiación indicadas?. Utilice un nivel de significación del 5%. Antes de tomar una decisión deberemos calcular cual será el resultado de escoger una alternativa. los elementos que constituyen la estructura de la decisión son: los objetivos de quién decide y las restricciones para conseguirlos.ESTADISTICA CAPITULO X TOMA DE DECISION. En función de las consecuencias previsibles para cada alternativa se tomará la decisión. sino también de una serie de factores externos que no controla. orientada a conseguir un objetivo. que se realiza entre diversas posibilidades de actuación (o alternativas). Así. Trataremos de estudiar criterios objetivos para tomar una decisión de forma que las consecuencias nos sean favorables. Una decisión es una elección consciente y racional.1 OBSERVACIONES  Se llama espacio de acciones (Aj) al conjunto de todas las posibles alternativas entre las que el decisor puede elegir. las alternativas posibles y potenciales. las consecuencias de cada alternativa. 10. el escenario en el que se toma la decisión y las preferencias de quien decide. 188 . Los problemas de decisión que vamos a estudiar se plantean cuando una persona (decisor) tiene que elegir una opción entre un conjunto de posibilidades sabiendo que las consecuencias que acarrea su decisión no dependen solo de la opción que elija. la mismas que se desarrollaran posteriormente. para ello existen varios criterios.CLETO DE LA TORRE  Se llama espacio de estados o eventos (Ei) de la naturaleza. lo primero que debemos identificar son las opciones entre las que debemos elegir. Tabla de pagos.  En un problema de decisión. Eventos Probabilidades Acciones A1 E1 E2 E3 … A2 . la misma que debe contener la lista de las acciones alternativas. posibles eventos y los pagos. Los pagos X ij de la tabla de pagos son valores que consisten de pérdidas o ganancias que dependen del evento Ei y de la acción Aj. 10.. pero determinan el nivel de éxito de una acción determinada. … … … An P1 P1 P1 X 11 X 12 X 22 X 32 X 1n X 2n X 3n X 21 X 31 EK P1 X k1 Xk2 X kn 10.  El segundo paso del planteamiento consiste en identificar los factores externos que no puede controlar el decisor pero que incluyen en las consecuencias.. al conjunto de todos los posibles valores de los factores externos que no controla el decidor. Tablas de pago. Criterios basados solo en probabilidades. El pago se define como la utilidad neta es decir ventas menos costos. I.  El cuarto paso es el proceso de la toma de decisiones.3 TOMA DE DECISIONES.  La teoría de decisión consiste en un conjunto de técnicas para elegir la mejor acción. en este paso se asigna probabilidades (pi) a los posibles eventos.  En el tercer paso se construye una tabla de pago.2 PASOS EN LA TEORIA DE DECISIONES. 189 . b. El arrepentimiento o pérdida de oportunidad condicional se define como la cantidad de pago perdido al no tomar la acción del pago más alto para cada evento posible. Criterio Maximin. Consiste en determinar el valor mínimo que resulta de cada acción a tomar en la tabla de pagos. bajo este criterio la mejor acción es aquella que tiene el mayor resultado económico esperado (promedio) b. Criterio de pérdida de oportunidad condicional (Arrepentimiento mínimas). Este es el criterio más conservador ya que está basado en lograr lo mejor de las peores condiciones posibles. corresponde a un pensamiento pesimista. III. y elegir como la mejor acción aquella cuya resultante es mayor c. Consiste en determinar el valor máximo que resulta de cada acción a tomar en la tabla de pagos.ESTADISTICA Este criterio consiste en decidir por el evento que tiene la máxima probabilidad. Criterio del pago esperado (PE) Llamado también Criterio Bayesiano. Criterios basados solo en probabilidades y consecuencias económicas a. Los cálculos son similares de PE excepto que se usa perdidas de oportunidades en vez de pagos. Criterio de la pérdida de oportunidad esperada(POE) La mejor acción es aquella que minimiza las perdidas de oportunidad esperada. II. El criterio maximin. pues razona sobre lo peor que le puede ocurrir al decisor cuando elige una alternativa. y elegir como la mejor acción aquella cuya resultante es mayor. a. Criterios Basados solo en las consecuencias económicas. Ejemplo 1 190 . Criterio Maximax. Este criterio toma como la mejor acción aquella para la cual el arrepentimiento máximo posible es menor. 1 respectivamente.2. 191 . Determine la mejore decisión desde el punto de vista del criterio del perdida de oportunidad condicional (Criterio de arrepentimiento condicional) g. Posibles eventos: E1: Vender 9 cajas. E2: Vender 10 cajas.4. puesto que se pierde 500 dólares después de cinco días. Determine la mejore decisión desde el punto de vista del criterio del pago esperado (PE) f. Construya una tabla de perdidas de oportunidades esperadas y determine la mejor decisión utilizando este criterio. 0. E3: Vender 11 cajas. a. Determine las mejores decisiones desde el punto de vista de los criterios: i) maximin. b. El elevado margen de utilidad refleja que los productos son perecedores. Determine las mejores decisiones utilizando el criterio de probabilidad máxima.3. c. Si los valores de probabilidad estimadas para las demandas de 9 a 12 cajas son: 0. e. Solución: a. y 0. d. ii) máximax. Con base en experiencias en productos similares el vendedor confía en que la demanda del producto esta entre 9 y 12 cajas. 0. Describa todo los posibles eventos y las posibles acciones a tomar.CLETO DE LA TORRE Un vendedor al menudeo adquiere cierto producto a 3000 dólares la caja y lo vende en 5000 dólares. Construya una tabla de ganancias. 12 es G = 11x5000-11x3000.2x500=11000. Tabla de ganancias. 12 es G = 10x5000-10x3000. D = 10 es G = 10x5000-11x3000 .4 P3 = 0.  Si se compra 10 cajas (C = 10). b. 12 son iguales a: G=9x5000-9x3000-0x500=18000. las ganancias (G) para : D = 9 es G = 9x5000-11x3000 . A4: Comprar 12 cajas.ESTADISTICA E4: Vender 12 cajas.3x500=7500. 11.2 P4 = 0. D = 11 es G = 11x5000-12x3000 . las ganancias (G) para : D = 9 es G = 9x5000-10x3000. 10. A2: Comprar 10 cajas.1x500=18500.2x500=13000.1x500=16500.3 P2 = 0. 11.0x500=24000. las ganancias (G) para : D = 9 es G = 9x5000-12x3000 .1x500=14500.1 Probabilidades A1 : 9 18000 18000 18000 18000 Comprar A2: 10 14500 20000 20000 20000 A3: 11 11000 16500 22000 22000 A4: 12 7500 13000 18500 24000  Si se compra 9 cajas (C = 9). D = 11. D = 10 es G = 10x5000-12x3000 .  Si se compra 12 cajas (C = 12).  Si se compra 11 cajas (C = 11). las ganancias (G) para las 4 demandas (D) respectivas D=9. Demanda de mercado E1: 9 E2 : 10 E3 : 11 E4 : 12 P1 = 0. D = 10.0x500=22000. 192 . A3: Comprar 11 cajas. D = 12 es G = 12x5000-12x3000 .0x500=20000. Posibles acciones a tomar: A1: Comprar 9 cajas. la mejor elección es comprar 10 cajas. Criterio de probabilidad máxima. por tanto la mejor acción es comprar 9 cajas. Criterio maximax: Demanda de mercado E1 : 9 E2 : 10 E3 : 11 E4 : 12 Máximos A1 : 9 18000 18000 18000 18000 18000 Comprar A2: 10 14500 20000 20000 20000 20000 A3: 11 11000 16500 22000 22000 22000 A4: 12 7500 13000 18500 24000 24000 El mayor de estos cuatro valores es 24000. por tanto la mejor acción es comprar 12 cajas. En base a este criterio. Criterio maximin: Demanda de mercado E1 : 9 E2 : 10 E3 : 11 E4 : 12 Mínimos A1 : 9 18000 18000 18000 18000 18000 Comprar A2: 10 14500 20000 20000 20000 14500 A3: 11 11000 16500 22000 22000 11000 A4: 12 7500 13000 18500 24000 7500 El mayor de estos cuatro valores mínimos es 18000. d. e.CLETO DE LA TORRE c. Criterio de pago esperado (PE) Demanda de mercado E1 : 9 E2 : 10 E3 : 11 A1 : 9 18000 18000 18000 Comprar A2: 10 14500 20000 20000 193 A3: 11 11000 16500 22000 A4: 12 7500 13000 18500 . lo correcto es producir 9 para tener una ganancia de G = 9x5000-9x3000=18000 no hay pérdida de oportunidad. la acción optima es A2. Tabla de perdidas de oportunidades esperadas (POE) Comprar A1 : 9 0 2000 A2: 10 3500 0 194 A3: 11 7000 3500 A4: 12 11500 7000 Demanda de mercado E1: 9 E2 : 10 . Criterio de pérdida de oportunidad condicional.1x500=14500.ESTADISTICA E4 : 12 Pago esperado 18000 18000 20000 18625 22000 17875 24000 15750 Se elige la acción que tiene mayor PE. la ganancia es G = 9x5000-10x3000. cuando la demanda es 9. para este caso la pérdida de oportunidades es: 18000-14500=3500 Tabla de pérdida de oportunidad condicional Demanda de mercado E1: 9 A1: 9 18000 – 18000 0 E2 : 10 20000 – 18000 2000 E3 : 11 22000 – 18000 4000 E4 : 12 24000 – 18000 6000 Máximos 6000 4000 A2: 10 Comprar A3: 11 18000 – 11000 7000 20000 – 16500 3500 22000 – 22000 0 24000 – 22000 2000 7000 A4: 12 18000 – 7500 11500 20000 – 13000 7000 22000 – 18500 3500 24000 – 24000 0 11500 18000 – 14500 3500 20000 – 20000 0 22000 – 20000 2000 24000 – 20000 4000 El menor de estos máximos es 4000. comprar 10 cajas. esto es comprar 10 cajas. f. Si la demanda fuera de 9 unidades (D=9). sin embargo si se produce 10 unidades. g. estados futuros.CLETO DE LA TORRE E3 : 11 E4 : 12 POE (Promedios) 4000 6000 3000 2375 2000 4000 0 2000 3125 3500 0 5500 La menor de estas perdidas de oportunidades esperadas es de 2375.  El esquema de un árbol de decisión es la siguiente. Mientras que los criterios de decisión analizados anteriormente ignoran las probabilidades para los estados naturales respectivos. la toma de decisión 195 . Nodo de Decisión Alternativas de decisión Nodo de azar Ramas de estado Resultados  Los nodos finales representan todos los posibles resultados. asociados con cada una de las alternativas de decisión 10. ocurrencias probables. por el criterio POE.5 Toma de decisión Bayesiana. la mejor acción es comprar 10 cajas.4 ARBOL DE DECISIONES  Es utilizado para estructurar el proceso de Toma de decisiones bajo Incertidumbre.  Variable de decisión: Son las alternativas disponibles  Variable de estado : Estados de la naturaleza. 10. Retribución esperada=VME= i 1 pi mi Donde: Pi: Probabilidad de que ocurra el estado natural i. Si el inversionista estima una probabilidad de 40% de que el mercado sea grande. Si invierte en la ciudad A y el mercado es grande la ganancia neta se estima en $75000.4 Mercado es grande Retribución en dólares $ 75000 Invertir en la ciudad A 0. específicamente se elige la alternativa con la mejor retribución esperada. EJEMPLO Un inversionista debe decidir si realiza una inversión de $ 50000 en la ciudad A o B para construir un mercado en una área residencial. Alternativa Probabilidad de Cada estado natural 0.ESTADISTICA bayesina la toma en cuenta. la ganancia neta será de $150000. Solución. Determine si el inversionista debe realizar o no el deposito. no se sabe si esta área residencial crecerá para convertirse en un mercado grande o moderado. si el mercado es moderado habrá una perdida de $ 30000.6x(-30000)=$12000 196 . Si invierte en la ciudad B y el mercado es grande. si el mercado es moderado la ganancia será de $50000.4x75000+0. Mi: La retribución si se selecciona esta alternativa y ocurre el estado natural i.6 Mercado es moderado -$ 30000 VME ciudad A=0. Si la ausencia al nuevo centro es baja. de forma que si ese nuevo centro tiene gran ausencia calculan que los beneficios anuales serán de 300000 euros.4 Mercado es grande Invertir en la ciudad B $ 150000 0. a. En base a la experiencia el vendedor confía en que la demanda del producto esta entre 10 y 14 unidades en un periodo de seis meses. EJERCICIOS.6 Mercado es moderado $ 50000 Al comparar las retribuciones esperadas se deduce que debe invertir en la ciudad B. del grado de éxito del nuevo centro. 0.6x(50000)=$90000 0.4x150000+0. Una tienda de moda tiene la oportunidad de abrir un local en un centro comercial muy conocido y con mucho éxito. Un vendedor de computadoras adquiere una computadora en 1000 dólares y lo vende en 1800 dólares. los beneficios que calculan dependen. también. 0. los beneficios para la tienda instalada en el centro comercial conocido. 197 . el valor de la computadora se deprecia en seis meses en 600 dólares. puede abrir la tienda en un nuevo centro comercial a un coste mucho mas bajo. si la ausencia es moderada serán de 135000 euros y si es baja esperan unas perdidas de 23000 euros. 1.11 respectivamente.CLETO DE LA TORRE VME Ciudad B=0. Si los valores de probabilidad estimadas para las demandas de 10 a 14 unidades son: 0.25.19. Describa todo los posibles eventos y las posibles acciones a tomar.15 y 0.3. 0. Alternativamente. Si abren la tienda en el centro comercial ya establecido. ya que son competidores directos. Utilice por lo menos tres criterios para la toma de decisión 2. ¿que opción recomendarías para este otro hotel? 198 . Determine la mejore decisión desde el punto de vista del criterio del perdida de oportunidad condicional (Criterio de arrepentimiento condicional) g. Construya una tabla de ganancias. La promoción playa depende mucho del tiempo. si es frió y lluvioso de 5000 soles y si es intermedio de unos 25000 soles. e.ESTADISTICA b. a) Uno de los hoteles de dicha cadena esta situado en una zona en la el 80% de los inviernos son calidos y soleados y nunca son fríos y lluviosos. Determine las mejores decisiones utilizando el criterio de probabilidad máxima. Si es calido y soleado. Al contrario para la promoción ski calculan una perdidas de 6000 soles si el tiempo el calido. ¿que promoción deberán lanzar?. unos beneficios de 15000 soles si es intermedio 70000 soles si es frió y lluvioso. c. calculan unos beneficios de unos 90000 soles. d. La promoción relax es independiente del tiempo y con ella esperan unos beneficios de unos 55000 soles. Determine las mejores decisiones desde el punto de vista de los criterios: i) maximin. 3. Determine la mejore decisión desde el punto de vista del criterio del pago esperado (PE) f. Construya una tabla de perdidas de oportunidades esperadas y determine la mejor decisión utilizando este criterio. ii) máximax. ¿con que valor asociado? b) Otro hotel esta situado en una zona en la que el 40% de las veces el invierno es frió y lluvioso y el 30% es intermedio. Cada hotel de cierta cadena debe decidir cual de las tres posibles promociones que ofrece la compañía matriz lanzara para la próxima campaña de invierno. CLETO DE LA TORRE 199 . ESTADISTICA CAPITULO XI DISEÑO EXPERIMENTAL El diseño de experimentos es en la actualidad una de las herramientas principales utilizados en la investigación estadística. simplemente significa planear un experimento de modo que se reúna la información que sea pertinente al problema bajo investigación. 11. NIVEL Es el conjunto de valores que tiene la variable independiente o factor en el experimento. la secuencia completa de pasos tomados de antemano para asegurar que los datos apropiados se obtendrán de modo que permitan un análisis objetivo que conduzca a deducciones válidas con respecto al problema establecido. El diseño de un experimento. es entonces. en algunos casos se les llama tratamiento. el objetivo que se tiene es estudiar el efecto de un factor sobre una variable respuesta. Diseñar un experimento. en la solución del problema.1 CONCEPTOS BASICOS FACTOR. Muy a menudo se coleccionan datos que pueden tener muy poco o ningún valor. Son todas aquellas variables cuyo efecto se desea medir. 200 . CLETO DE LA TORRE UNIDAD EXPERIMENTAL Es la entidad más pequeña a lo que se aplica el tratamiento. En un Diseño Experimental se tiene variabilidad inherente a la unidad experimental y otra variabilidad debida a los tratamientos. es decir.2 OBJETIVOS DEL DISEÑO EXPERIMENTAL  Determinar las variables con mayor influencia en la respuesta 201 . personas y otros recursos que transforman alguna entrada. ERROR EXPERIMENTAL Es la medida de la variación. Para reducir el error experimental se siguen algunos pasos:    Repetir el experimento Adicionar más tratamientos Introducir variables o bloques El proceso o sistema bajo estudio puede representarse por medio del modelo: Podemos pensar que el proceso es una combinación de maquinarias. en una salida que tienen una o más respuestas observadas 11. existente entre observaciones de las unidades experimentales. es el elemento donde se realiza la medición. cuando el material experimental es homogéneo Los resultados del experimento se pueden agrupar de la siguiente forma: factor variedad yij A Y11 B Y22 B Y23 A Y14 C Y31 A Y12 C Y33 D Y44 B Y21 D Y42 A Y13 C Y34 D Y41 C Y32 D Y43 B Y24 A niveles B C D Donde ( yij ) es el resultado de la medición del i-ésimo tratamiento en la j-ésima repetición.3 DISEÑO UNIFACTORIAL (Diseño completamente aleatorio)  Es el Diseño Experimental más simple.  En este Diseño los tratamientos (niveles) se distribuyen al azar en todas las unidades experimentales. Este diseño es muy útil cuando las unidades experimentales (homogeneidad) VENTAJAS Y DESVENTAJAS  VENTAJAS  Este Diseño es fácil de planear y es flexible en cuanto al número de repeticiones y unidades experimentales del tratamiento tienen variabilidad uniformemente repartidos  DESVENTAJAS  Solo es aplicable.ESTADISTICA  Determinar el mejor valor de las variables que influyen en la respuesta de manera que:  La respuesta se aproxime al valor deseado  La variabilidad de la respuesta sea pequeña  Se minimiza el efecto de las variables incontrolables 11. 202 . (DCA)..CLETO DE LA TORRE En resumen: Tratam 1 Y11 Y12  Y1 j  Y1n 2 Y21 Y22  Y2 j  Y2 n      i Yi1 Yi 2 Yij Yin  a     Ya1 Ya 2  Yaj  Yan TOTAL TOTALES Medias Varianzas Y1. j 1 a Yij Yi. Y2. . Y1. i 1 Yi .. . Donde: n Yi.  Yi .. Y.  Yi.  Ya .. j 1 Yij . 11. Yij . 2 s2. 2 s.  Yan 2  sa. Y2.. Media del i-ésimo tratamiento n a n Y. 2 s1..4 ANALISIS DE VARIANZA Es la técnica mediante el cual se mide los efectos de los tratamientos puesto que descompone la Varianza Total en diferentes fuentes de variabilidad definida por el 203 . Y. Media total an En esta parte desarrollaremos el Análisis de Varianza para el modelo de Efectos fijos del Diseño Completamente al Azar. Total i 1 j 1 Y. Total del i-ésimo tratamiento n Yi .  si2. Y. 2 N N SCE siguiente forma: SCT SCA Los cuadrados medios son los estimadores de las varianzas y son obtenidos de la CMA SCA a 1 CME SCE a(n 1) V ( ij ) 2 ó varianza del error.. Para el cual se siguen los siguientes pasos: H0 : 1 2  a H1: SCT i j . H0 R. a 2 a n yij i 1 j 1 y.ESTADISTICA modelo. H0 204 .R.A.2 N an . para algún par (i.j) La fórmula asumida para calcular la suma de los cuadrados es la siguiente: a n yij i 1 j 1 y.a n 1 gl 1 f(1 R. ni y. 2 Por otra parte el cociente de 2 variables de Fisher se distribuye mediante la distribución Fc SCA a 1 SCE a(n 1) f a 1..N an SCA i 1 yi2.. Este tipo de análisis se determinan según el numero de observaciones. de donde se puede afirmar que cada factor A contiene los elementos del factor B el cual disminuye el error experimental. si cada unidad experimental tiene una observación.l SC CM FCAL Conclusiones:  Si Fc  Si Fc F0  Se rechaza H0 F0  Se acepta H0 11. TABLA DE ANALISIS DE VARIANZA Fuentes de Varianza Factor A a-1 SCA CMA CMA CME g. en este caso no existe interacción entre los dos factores.5 DISEÑO EXPERIMENTAL DE DOS FACTORES El análisis de la varianza de dos factores esta formado como su nombre indica por dos factores que a su vez tienen la misma importancia en este tipo de análisis existen “a” niveles del factor A y “b” niveles de factor B.CLETO DE LA TORRE Análisis de la varianza.l SC CM FCAL 205 . Fuentes de Varianza Tratamiento a-1 Error Total a(n-1) an-1 SCA SCE STT CMA CME CMA CME g. En este tipo de análisis el control local (unidad experimental) por el factor A l cual esta constituido por todo los del factor B o variantes repetidas una sola vez siendo el factor A una repetición con la condición de que los del factor B están dentro del factor A . el modelo del análisis univariado de la varianza de dos factores se denomina sin replica. Y 2 ... es medir el efecto de una 206 . bn abn . j.. En estadística... b SCB j 1 Y 2 . a b j 1 SCAB i 1 Y 2 ij. Y 2 . an abn . la idea de una interacción. abn SCA SCB SCE = SCT-(SCA+SCB+SCAB) El cuadrado medio... se obtiene: Para el factor A Para el factor B Para la interacción AB Para el error : CMA : CMB : CMAB : CME SCA a 1 SCB b 1 SCAB (a 1)(b 1) SCAB ab(n 1) INTERACCIÓN.ESTADISTICA Factor B Interacción AB Error Total b-1 (a-1)(b-1) SCB SCAB CMB CMAB CMB CME CMAB CME ab(n-1) abn-1 SCE CME Donde: a b n SCT i 1 j 1 k 1 Y n 2 ijk Y 2 . a SCA i 1 Y 2 i . abn ... Y 2 . 6 12.9 . B y C en las ventas.CLETO DE LA TORRE variable (factor).8 17.7 49 B 22..1 ¿Se puede concluir que el efecto de las tres estrategias es diferente? Solución La hipótesis estadística esta dado por: H0 : 1 2  a H1: i j Estrategia A 35 30. En el cuadro siguiente se observa las ventas semanales de un producto de miles de unidades.8 37. cuando las líneas son paralelas.7 26.9 13.8 37.5 C 16. APLICACIONES. en cambio no existe interacción.5 15.9 37.6 14.4 26. 1.6 12.10 37.6 26.11 13.10 13. Figura: Interacción de factores.Se desea evaluar la efectividad de tres estrategias de marketing A.3 13.7 Estrategia B 36 30.2 6.4 18.8 207 Estrategia C 37 30. A 35 30.8 26. manteniendo constante los demás. De la gráfica anterior se concluye que geométricamente existe interacción cuando las líneas no son paralelas.9 13.6 26.1 7. 51 2 2582 18 2194.00220775 g. La información obtenida del estudio se muestra en el cuadro siguiente...ESTADISTICA 49 Totales N Media 50 84 6 51 86 6 y1. y2.258 0.6666667 y.68. Se acepta HO.57 SCA i 1 842 862 882 6 2582 18 0.57 0. y3.. =14 y2. los resultados se mide en términos del incremento en las ventas. ni y..2 N 35 2 30. 258 N=18 y1.8 2 .3333333 a n SCT i 1 j 1 a yij yi. 88 6 y.. Fuentes de Varianza Tratamiento 2 Error Total 15 17 0. por lo tanto las tres estrategias de ventas presenta similar efecto.87 2194. =14.35295 146.7059 SCE SCT SCA 2193..l SC CM FC 0 fc f De la tabla FO=3.Un investigador analiza el efecto de 5 tipos de publicidad en cinco áreas geográficas.6 2 26.7059 2193. =14.2 N y..3333333 y3. 208 . =14.87 Análisis de la varianza. 2.. 209 .CLETO DE LA TORRE Area geográfica Publicidad R1 E1 R1 E1 R2 E1 R2 E1 R3 E1 R3 E1 R4 E1 R4 E1 R5 E1 R5 E1 R1 E2 R1 E2 R2 E2 R2 E2 R3 E2 R3 E2 R4 E2 R4 E2 R5 E2 R5 E2 R1 E3 R1 E3 R2 E3 R2 E3 R3 E3 Incremento en las ventas 85 45 100 20 85 95 73 87 250 170 110 30 100 20 90 80 50 110 120 250 60 0 40 45 50 Incremento Tiempo Tratamiento en las ventas 100 200 250 260 340 0 70 30 100 100 180 210 200 350 420 30 60 110 100 170 150 10 20 40 20 R3 E3 R4 E3 R4 E3 R5 E3 R5 E3 R1 E4 R1 E4 R2 E4 R2 E4 R3 E4 R3 E4 R4 E4 R4 E4 R5 E4 R5 E4 R1 E5 R1 E5 R2 E5 R2 E5 R3 E5 R3 E5 R4 E5 R4 E5 R5 E5 R5 E5 Con 95% cual es su conclusión de este estudio. 42 6.18 0. 4 4 13664. 43110.0003 0. Para determinar que publicidad tiene mejor efecto en las ventas se aplica las pruebas de comparación de múltiples que se ilustra gráficamente.ESTADISTICA Análisis de Varianza para Ventas Fuente de variación Factores A:Publicidad B:Region INTERACCION AB Error TOTAL 170472. es decir algunos de estos tipos de publicidad genera mayor incremento en las ventas.0000 54658.0 182098. (P-valor < 0.92 26. E4 estadísticamente tienen mejor efecto en las ventas en comparación con los otros tipos de publicidad.0000 Suma de Cuadrados Gl Cuadrado Medio Fc Valor-P Del análisis de varianza que se muestra en el cuadro anterior se puede concluir con 95% de confianza que el factor publicidad influyen en el incremento de las ventas. 210 V entas . También del mismo cuadro se puede desprender que el factor región influye (p-valor < 0.5 450339.40 0.05). 200 170 140 110 80 50 E1 E2 E3 P ublic idad E4 E5 De este grafico se observa que el tipo de publicidad.5 45524.05) es decir que en determinados regiones las ventas son mayores que los otros. Por otra parte los tipos de publicidad E1 y E2 tienen similar efecto y el tipo de publicidad E5 tiene el menor efecto en las ventas.5 7. 16 25 49 10654.5 1724. EJERCICIOS 211 . V entas 400 Region R1 R2 R3 R4 R5 300 V entas 200 100 0 E1 E2 E3 P ublicidad E4 E5 El tipo de publicidad E5. son mayores en promedio que las otras regiones. no presenta efecto en las regiones 4 y 5.CLETO DE LA TORRE En el grafico siguiente se observa el análisis del incremento en las ventas por Región. 250 200 150 100 50 0 R1 R2 R3 Region R4 R5 Las ventas en las región 5. en cambio las ventas en las regiones 3 y 4 son similares y menor a las ventas de la región 5. con el propósito de mejorar sus ventas diseña 4 tipos de oferta. B. La tabla siguiente muestra el posicionamiento de un producto de 4 marcas (A. Posicionamiento (%) 212 . la hipótesis nula de que no existe diferencia en el posicionamiento en le mercado de las 4 marcas. Política A B C 48 42 68 54 59 71 78 62 87 83 80 98 96 92 10 Pruebe si hay diferencia entre los tres tipos de política. Contrastar a un nivel de confianza de 95%. En el cuadro siguiente se muestra los resultados del incremento de ventas en dólares. C y D) en una región del país.ESTADISTICA 1. En el cuadro siguiente se muestra la reducción del número de cheques sin fondos que recibe esta empresa. Región A I 109 110 II 110 112 III 116 114 B 110 115 110 111 119 115 Tipos de oferta C 108 109 111 109 124 119 D 110 108 114 112 120 117 Con 95% de confianza ¿Cual es su conclusión respecto del efecto de la oferta? 2. usando un nivel de significación de 5% 3. Una empresa. El propietario de una empresa ha probado tres políticas diferentes de cambio de cheques para reducir el gran número de cheques sin fondo que recibia su empresa. en tres regiones del país. El desea saber cual política minimiza el problema. 2 4 Medio 7 4.8 3.6 2 6.6 Bajo 2 7.CLETO DE LA TORRE Marca A Marca B Marca C Marca D 10 4 15 7 37 35 5 11 12 32 10 1 31 19 12 8 11 33 6 2 9 18 6 5 23 8 15 3 4. En un estudio financiero se afirma que el apalancamiento financiero puede utilizarse para aumentar la tasa de rendimiento sobre la inversión. los accionistas pueden recibir rendimientos más altos con la misma cantidad de inversión gracias a su uso. y el apalancamiento financiero se refiere al porcentaje de activos financiados por deuda.4 1.8 5. Los siguientes datos muestran las tasas de rendimiento utilizando 3 diferentes niveles de apalancamiento financiero y un nivel de control (deuda cero) de empresas seleccionadas al azar: Tasas de Rendimiento Control 4.5 11..9 6.8 Alto 7.La estructura financiera de una firma se refiere a la forma en que se dividen los activos de la empresa por debe y haber. es decir que.8 9.8 4.6 6 6.2 11 En función de la información cual su conclusión de este estudio. 213 .2 1. 06 0.41466 0.4918 0.11026 0.4452 0.4861 0.3051 0.49975 0.49962 0.49969 0.15542 0.01994 0.4991 0.37923 0.05172 0.2673 0.47932 0.48077 0.01 0.49343 0.49996 0.37076 0.7 0.43448 0.12172 0.43574 0.07124 0.1293 0.49977 0.49413 0.40658 0.34134 0.25175 0.41774 0.49788 0.48645 0.49882 0.27337 0.49693 0.49534 0.49997 0.21226 0.49036 0.47725 0.45637 0.4 3.49995 0.03188 0.49994 0.4994 0.00399 0.4 0.49869 0.00798 0.49913 0.35314 0.49906 0.4999 0.49981 0.49995 0.49379 0.07 0.49996 0.49886 0.49286 0.379 0.45449 0.40147 0.4049 0.48983 0.49305 0.28814 0.2 2.44295 0.49957 0.48928 0.49953 0.31327 0.48214 0.49987 0.49752 0.49983 0.05962 0.4972 0.49989 0.11781 0.48341 0.49916 0.40824 0.9 1 1.26424 0.33891 0.49736 0.27935 0.49979 0.47615 0.49995 0.2549 0.46856 0.49851 0.22575 0.5 2.2 1.40988 0.43943 0.49609 0.43189 0.49997 0.4767 0.45994 0.6 0.05 0.475 0.46926 0.47381 0.49988 0.03983 0.48713 0.35993 0.19847 0.08617 0.49986 0.45254 0.4032 0.49846 0.15173 0.24857 0.47558 0.49001 0.43822 0.16276 0.37698 0.49993 0.49202 0.49621 0.485 0.05567 0.45543 0.39435 0.4999 0.49994 0.41149 0.38877 0.18793 0.48956 0.49781 0.42507 0.2 3.49921 0.49942 0.49324 0.49992 0.49061 0.4983 0.49597 0.32639 0.06356 0.32894 0.45728 0.47882 0.38686 0.49991 0.26115 0.49903 0.49983 0.13307 0.49964 0.49958 0.49643 0.02392 0.33646 0.49825 0.49813 0.49158 0.48169 0.19497 0.49711 0.08706 0.5 0.47193 0.4986 0.49961 0.09871 0.7 2.09095 0.1 0.49926 0.8 3.49477 0.4995 0.18082 0.4 1.49993 0.49996 0.28524 0.49841 0.49683 0.47257 0.17364 0.3 2.45154 0.48574 0.48809 0.49981 0.499 0.46637 0.11409 0.34849 0.49664 0.47831 0.49934 0.1664 0.49767 0.10257 0.38298 0.4222 0.49795 0.49774 0.46164 0.49744 0.49865 0.29373 0.31859 0.2054 0.49361 0.49874 0.48778 0.01595 0.4732 0.49993 0.ESTADISTICA Tabla Normal Estándar Z 0 0.49134 0.42364 0.4956 0.49461 0.49948 0.49992 0.29389 0.49936 0.47128 0.49266 0.4495 0.27637 0.4997 0.49974 0.49996 0.46327 0.09 0.46246 0.34375 0.49893 0.47062 0.49585 0.49989 0.49889 0.18439 0.48537 0.39616 0.17003 0.48679 0.41621 0.19146 0.49944 0.47441 0.6 2.49955 0.49978 0.37286 0.49929 0.41308 0.48461 0.10642 0.49984 0.4998 0.48382 0.45352 0.44179 0.49996 214 .4803 0.31057 0.39796 0.4943 0.49992 0.21566 0.2224 0.4463 0.35543 0.29955 0.33147 0.49674 0.381 0.14431 0.1 2.43056 0.1 1.49728 0.49702 0.36864 0.20194 0.49972 0.6 1.1591 0.49224 0.49547 0.49801 0.32381 0.49819 0.03586 0.49991 0.31594 0.49632 0.4999 0.49245 0.22907 0.24215 0.4911 0.20884 0.49994 0.23565 0.49931 0.46562 0.48422 0.4 2.21904 0.4996 0.39251 0.49995 0.29103 0.49994 0.49836 0.49396 0.1 3.49924 0.45818 0.01197 0.49968 0.7 1.49988 0.35769 0.46784 0.49807 0.36433 0.49956 0.49976 0.38493 0.30234 0.49446 0.49995 0.2 0.49965 0.43699 0.42073 0.04 0.49973 0.08 0.49952 0.07534 0.41924 0.07926 0.8 2.39973 0.23237 0.27035 0.9 2 2.49938 0.49986 0.34614 0.30785 0.46995 0.02 0.9 0 0 0.49897 0.5 3.45907 0.43319 0.46485 0.49878 0.49086 0.8 0.49978 0.49982 0.49987 0.39065 0.13683 0.4952 0.04776 0.49996 0.48124 0.49992 0.48299 0.45053 0.2823 0.49946 0.49971 0.48899 0.7 3.3 1.3 0.44738 0.46079 0.9 3 3.42647 0.09483 0.49506 0.4887 0.14058 0.12552 0.47982 0.17724 0.42922 0.33398 0.48257 0.47778 0.49491 0.44845 0.36214 0.32124 0.44062 0.46712 0.8 1.49985 0.46407 0.49918 0.3665 0.23891 0.4884 0.3 3.04395 0.25804 0.24537 0.48745 0.42785 0.0279 0.49653 0.03 0.35083 0.49573 0.49985 0.4976 0.0675 0.44408 0.14803 0.6 3.49856 0.5 1. 763 1.356 1.684 0.677 0.876 0.042 2.250 1.326 2.289 1.015 2.000 2.457 2.706 0.684 0.697 2.725 2.492 2.058 1.683 0.383 1.69 0.638 1.873 0.796 2.718 0.201 2.998 3.093 1.645 1.889 0.088 1.765 0.066 1.776 3.95 0.071 1.703 0.056 1.866 0.688 0.079 1.021 2.920 4.055 1.650 3.086 2.812 2.319 1.727 0.390 2.855 0.323 1.303 6.567 2.978 0.052 2.080 2.868 0.711 0.714 2.069 1.862 0.134 1.057 1.423 2.313 1.228 2.160 2.131 2.476 1.069 2.688 0.764 3.306 2.041 1.718 3.321 1.048 2.106 1.485 2.658 1.819 1.508 2.182 4.303 1.859 0.533 1.060 2.854 0.851 0.855 0.694 0.660 1.681 3.975 0.870 0.695 0.060 1.707 1.787 1.055 1.860 0.045 2.80 1.729 2.671 2.821 63.064 2.845 1.499 1.120 2.143 3.061 0.093 2.895 2.807 1.704 1.706 2.358 2.831 1.415 1.316 1.119 1.883 0.753 2.315 1.681 0.701 2.761 2.386 1.860 2.947 1.878 1.697 0.110 2.365 2.9 3.879 0.604 2.721 2.282 0.841 2.055 1.685 0.296 1.756 1.132 2.063 1.746 2.856 0.679 0.85 1.960 2.856 0.845 0.372 1.074 1.943 2.078 1.708 2.032 1.036 0.064 1.711 2.963 1.797 1.779 1.500 2.7 0.920 0.75 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 60 120 1 0.328 1.692 0.685 0.821 3.345 1.318 1.397 1.311 1.602 2.337 1.898 1.995 6.325 1.376 1.782 2.262 2.848 0.624 2.100 1.861 1.190 1.699 2.684 2.083 1.350 1.741 0.896 3.365 4.145 2.657 2.740 2.717 2.833 2.310 1.108 1.314 1.99 0.854 0.479 2.440 1.686 0.541 5.314 12.687 0.858 0.674 0.067 1.576 215 .518 2.734 2.816 0.552 2.691 0.074 2.353 3.355 1.333 1.156 1.683 0.617 1.921 1.925 2.341 1.539 2.050 1.771 1.058 1.169 1.528 2.842 0.363 1.330 1.689 0.747 4.865 0.473 2.965 9.941 0.447 3.886 1.771 2.061 1.101 2.858 0.863 0.056 2.CLETO DE LA TORRE TABLA DE LA DISTRIBUCION T-STUDENT gl p x c 1 1 0.977 1.683 0.896 0.703 2.583 2.059 1.750 1.179 2.906 0.857 0.467 2.046 1.250 1.980 2.012 1.706 31.076 1.462 2.571 3.686 0.861 0.684 0. 3 134.02 7.44 13.85 0.13 67.79 20.01 0 0.34 63.01 33.24 10.1 123.49 85.87 1.07 0.2 28.92 23.31 50.85 34.68 0.34 1.57 87.52 113.44 32.37 32.03 24.07 3.72 37.93 53.025 0 0.41 95.04 7.84 7.34 36.99 7.6 61.69 15.8 17.05 0 0.03 22.89 6.31 79.92 18.61 34.89 57.5 73.16 38.77 25.38 40.31 17.8 106.21 73.38 9.44 14.57 38.4 40.19 31.84 32.58 102.69 21.34 24.26 8.81 18.86 51.48 20.8 65.19 37.28 8.81 21.27 35.07 12.52 0.18 2.75 18.975 5.35 79.06 0.94 57.24 1.84 5.53 12.15 12 12.06 46.48 21.06 22.63 9.57 7.98 11.99 23.25 41.96 43.1 0.51 16.2 2.22 4.28 10.3 122.02 0.82 4.47 11.28 18.14 30.01 0.22 0.71 1.62 30.9 0.27 66.13 12.59 5.5 15 18.62 61.43 8.75 91.58 13.4 5.09 16.8 34.12 27.56 46.4 13.5 53.03 12.13 42 46.74 56.64 14.6 12.36 27.3 47.77 73.9 11.41 71.995 7.71 1.2 59.4 45.65 2.55 9.14 31.66 5.35 37.26 6.42 7.26 7.53 19.65 12.11 4.25 72.57 24.3 216 .2 63.35 11.11 26.6 48.7 35.6 24.27 1.45 46.47 26.13 6.92 35.58 1.05 3.32 32.69 42.02 20.64 55.17 2.9 2.65 46.9 ) 0.76 38.4 106.3 0.69 29.02 13.63 9.41 32.67 23.19 47.4 79.76 61.98 44.88 10.8 1.47 10.39 64.48 36.9 29.24 13.2 0.49 22.17 27.56 3.15 61.21 0.84 14.8 74.28 15.4 0.05 33.77 49.48 44.21 24.34 13.23 5.43 29.6 5.07 4.61 6.94 15.26 46.36 0.9 0.3 27.6 3.99 1.06 18.79 8.29 41.17 36.02 0.7 33.73 20.07 25.85 11.57 5.19 26.76 97.71 85.88 78.67 92.99 17.2 110.73 58.58 68.86 11.09 21.31 19.63 6.57 5.81 9.23 5.02 62.05 60.97 85.98 14.5 41.06 51.33 59.03 13.66 4.12 16.24 10.1 104.41 0.59 25.21 0.7 24.68 15.15 82.4 42.16 2.14 5.09 10.17 68.85 15.98 53.83 3.27 52.9 9.82 90.08 39.73 3.87 19.29 77.41 7.54 10.23 8.18 95.68 21.04 50.62 46.38 94.2 51.72 14.61 22.58 15.2 59.36 40.34 3.79 64.69 12.81 6.59 28.09 85.59 10.89 57.86 16.67 33.74 26.83 2.49 4.01 7.85 30.96 76.36 36.2 10.39 10.8 44.39 65.25 0.05 0.82 4.16 63.2 34.34 65.42 100.56 83.3 116.36 77.26 9.8 55.4 43.3 89.1 0.07 15.89 10.04 5.4 71.28 68.83 14.78 17.9 25.57 4.75 69.99 7.45 1.34 13.66 67.35 0.5 13.19 18.77 19.24 14.18 11.6 113 0.35 9.3 118.15 118.44 16.82 18.06 96.89 16.49 6.3 28.95 23.3 128.13 73.58 40 41.29 8.4 112.36 14.73 101.55 19.11 0.49 28.1 107.68 25 26.8 11.04 14.94 4.17 4.55 69.22 101.21 11.07 90.45 16.2 55.5 39.18 6.81 36.02 100.81 32.53 32.87 5.48 0.8 29.96 8.85 17.65 22.64 9.12 10.42 37.41 34.3 28 31.81 8.47 41.75 1 0.76 23.88 41.78 47.56 8.1 130 0.55 20.98 18.59 14.36 8.7 3.41 10.42 77.63 15.07 3.64 12.31 11.99 90.74 56.2 20.53 91.45 51.95 4.95 21.67 9.3 0.73 2.99 6.87 2.76 28.ESTADISTICA TABLA DE LA DISTRIBUCION CHI CUADRADO ( p x c gl 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95 0.51 30.5 57.87 30.14 12.43 28.33 3.76 51.99 27.54 24.08 13.3 9.38 6.73 16.58 32 33.94 23.08 84.2 124.31 23.46 82.81 16.53 96.51 63.41 29.29 76.69 2.56 9.99 7.73 26.61 18.91 20.03 8.3 7.81 57.26 6.29 88.57 4.86 13.15 1.55 30.5 22.82 0.64 3.01 0 0.01 17.64 2.88 107.64 42.78 9.75 3.21 7.61 2.66 16.02 1.01 5.09 2.91 9.17 35.85 14.58 6.81 18.4 118.28 21.19 81.09 13.65 2.95 98.26 59.22 27.97 74.14 31.91 7.17 79.82 31.3 29.4 49.59 12.15 19.7 6.93 40.32 36.6 112.25 3.62 27.69 69.2 25.18 45.25 7.6 37.63 8.78 73.83 1.49 11.47 21.36 23.31 20.65 69.71 4.9 64.31 10.51 66.64 5.76 52.6 0.24 1.92 0.28 37.67 60.68 36.38 83.04 26.55 0.46 50.05 106.47 20.78 38.65 43.88 55.01 1.95 3.06 1. NO Distribución normal NO Prueba de Mann Whintney para comparación de poblaciones SI Prueba Z para la media de la diferencia en datos apareados SI n≥30 Prueba T para la media de la diferencia en datos apareados Prueba del signo o de Wilcoxon para datos apareados NODistribución normal NO 3 o más grupos i n d e p e n d i e n t e s SI ANOVA – comparación de tratamientos Distribución normal SI con varianzas semejantes NO SI Prueba de Krusskal – Wallis – comparación de tratamientos. Prueba de Friedman . 217 . Distribución normal con varianzas NO semejantes NO ANOVA en bloque .CLETO DE LA TORRE PRUEBAS DE HIPÓTESIS SI 1 grupo n≥20 NO Distribución Normal NO SI Prueba T para la media Prueba Z para la media Prueba del signo para la mediana SI Prueba Z para la diferencia de medias SI n≥30 SI Número de Grupos 2 grupos i n d e p e n d i e n t e s NO Varianzas iguales SI Prueba T para la diferencia de medias Prueba T para la diferencia de medias con ajuste de NO grados de libertad.comparación de tratamientos.comparación de tratamientos. Cuadrado (reunir categorías) Para comparación de proporciones 3 o más grupos i n d e p e n d i e n t e s SI Frecuencias esperadas pequeñas No Prueba Ji-Cuadrado para comparación de proporciones NO NO Prueba Q de Cockran Comparación de proporciones 218 .ESTADISTICA PRUEBAS DE HIPÓTESIS SI Prueba Z para la proporción poblacional 1 grupo Muestra grande nP y n(1-P) > 5 NO SI Prueba Binomial para la proporción poblacional SI Prueba exacta de Fisher – comparación de proporciones 2 grupos Número de Grupos i n d e p e n d i e n t e s SI Frecuencias esperadas pequeñas No Prueba Z o Ji-Cuadrado para comparación de proporciones NO NO Prueba de McNeman Comparación de proporciones SI Prueba Ji . SI -Prueba de chi-cuadrado (Coeficiente de contingencia) -Riesgos relativos( Estudios Cohorte). -Odds Ratio( Estudios caso-control) -Coeficiente de correlación Nominal Cada variable tiene dos categorías (Tabla 2x2) NO Prueba de chi-cuadrado para independencia de variables (Coeficiente de contingencia) 219 .CLETO DE LA TORRE PRUEBAS DE HIPÓTESIS Coeficiente de correlación lineal de pearson Continua Ordinal y/o cardinal Coeficiente de correlación por rangos de Spearman Escala de medición para ambas variables. Representados por grafico de barras. proporciones. sectores o pictogramas. -Análisis factorial. Tipo de Descripción Variables individuales Tipo de variable Nivel de investigación Método o Técnica Estadística. percentiles. Tabla de Frecuencias. o porcentajes. Variables individuales Cuantitativa (Intervalo o razón) DESCRIPTIVA -Distribución de frecuencias por intervalos. Ind: Cualitativa con V. Cualitativa (Nominal y Ordinal) DESCRIPTIVA Escala de actitud de Likert) Intervalo de confianza y prueba de hipótesis de la proporción. -Pruebas de chicuadrado: independencia -Grafico de barras de doble entrada. 220 . varianza. análisis de compontes principales.Dep: Cualitativa EXPLICATIVA -Tablas de contingencia. -Intervalo de confianza y prueba de hipótesis de la media. -Medias. Asociación entre variables V. -Calculo de riesgos. de Spearman. -Pruebas de Kendall. .ESTADISTICA MÉTODOS ESTADÍSTICOS DE ACUERDO AL TIPO DE VARIABLES y NIVEL DE INVESTIGACION. desviación . Dep: Cualitativa EXPLICATIVA -Regresión Logística.Dep: Cuantitativa (Rpta) COMPARATIVA. Asociación entre variables V. cualitativa(s) Con V. -Tablas con clasificación categórica. -prueba t-student Asociación entre variables V. Ind: : Cuantitativa(s) con V.Dep: Cuantitativa RELACIONAL.Análisis de regresión.Dep: Cuantitativa(Rpta) EXPERIMENTAL. etc.CLETO DE LA TORRE -Análisis de correspondencias Asociación entre variables V. Ind: : Cuantitativa(s). Asociación entre variables V. CUASI EXPERIMENTAL Diseño experimental (ANOVA) -Prueba de comparación de medias. Ind: : Cualitativa(s) (factores) con V. -coeficiente de correlación de pearson. con promedios. . Ind: : Cualitativa(s) (Grupos) con V. 221 . desviaciones. -Análisis Discriminante. CORRELACIONAL -Grafico de dispersión. -intervalos de confianza. Tipo de Descripción Variables individuales Escala de la variable Nominal -Prueba Z para una proporción poblacional. -Prueba de Friedman. Intercalar o de razón -Prueba de t para una media poblacional. -Prueba de hipotes e intervalos de confianza para diferencia de medias.ESTADISTICA PRUEBAS ESTADÍSTICAS DE ACUERDO A LA ESCALA DE MEDICIÓN DE LA VARIABLE. -Prueba de chi-cuadrado para varias proporciones en una sola población. Prueba de U Mann Whitney( dos o más poblaciones) -Prueba de Kruskal Wallis. -Prueba de McNemar. 222 . -Pruebas de wilcoxon para rangos. -Prueba de varianzas Método o Técnica Estadística. -Prueba de Mantel Haenzel Variables individuales o más de una variable Ordinales -Prueba de signos o binomial para la media poblacional. Variables individuales Mas de una variables Intercalar o de razón. -Intervalos de confianza para proporciones.

estadistica para la toma decisiones.pdf

Comments

Description