Estadistica Basica UnADM

March 30, 2018 | Author: Edwin Martinez | Category: Sampling (Statistics), Statistics, Histogram, Probability, Information


Comments



Description

Estadística básicaPrograma desarrollado Primer cuatrimestre Programa de la asignatura: Estadística básica Clave: ESAD Noviembre, 2010 Educación Superior Abierta y a Distancia • Primer cuatrimestre 1 Estadística básica Programa desarrollado Índice I. Información general de la asignatura 3 A. Ficha de identificación B. Descripción C. Propósito II. Competencia a desarrollar 5 III. Temario 5 IV. Metodología de trabajo 6 V. Evaluación 7 VI. Material de apoyo 8 VII. Desarrollo de contenidos por unidad 9 Unidad 1. Fundamentos de estadística 9 Unidad 2. Representación numérica y gráfica de datos 21 Unidad 3. Medidas de tendencia central y dispersión 34 Educación Superior Abierta y a Distancia • Primer cuatrimestre 2 Estadística básica Programa desarrollado I. Información general de la asignatura A. Ficha de identificación Nombre de la Licenciatura o Ingeniería: Nombre del curso o asignatura Clave de asignatura: Tronco común Estadística básica Seriación: Sin seriación Cuatrimestre: Horas contempladas: Primero 90 B. Descripción En un mundo cada vez más competitivo, tanto en las áreas comerciales, financieras, tecnológicas y científicas, y donde invariablemente el flujo de información es mayor a cada momento, se hace indispensable no sólo la correcta descripción de los datos sino también su análisis e interpretación. Es aquí donde la estadística juega un papel preponderante, al ser una de las herramientas más poderosas para comprender la variabilidad inherente a los datos observados y se constituye como la mejor herramienta para la toma de decisiones. La diversidad de conocimientos, habilidades, actitudes, creencias y valores, requeridos en cada una de las carreras que ofrece la ESAD, hace necesaria la conformación de un tronco básico que, por un lado, garantice la formación integral en los atributos generales deseables de los estudiantes, y por el otro, derive, de manera natural, en los atributos particulares necesarios para cada disciplina de estudio. El tronco básico se conforma de varias asignaturas comunes que promueven, por un lado, la formación integral de los estudiantes, integrando asignaturas de distintas áreas del conocimiento, y por otro lado, desarrollan en el estudiante competencias transversales necesarias para la investigación, el análisis crítico, el manejo y la sistematización de información y datos, así como una serie de valores que le permitan conducirse con ética y responsabilidad durante su trayectoria académica y su desempeño profesional. Las materias que forman el tronco básico son: Contexto socioeconómico de México, Desarrollo humano, Estadística básica y Fundamentos de investigación; estas materias a simple vista parecen desarticuladas, pero se interrelacionan para contribuir a la formación integral de los estudiantes. Educación Superior Abierta y a Distancia • Primer cuatrimestre 3 Estadística básica Programa desarrollado En relación al tronco básico la asignatura Estadística básica tiene varios propósitos, pues pretende despertar en el estudiante el interés por la investigación para la toma de decisiones, la solución de problemas y el análisis de situaciones y eventos relacionados con el entorno académico, profesional, personal y social, rigiéndose en todo momento por un código de ética profesional y personal. Los propósitos de la asignatura en relación al tronco básico son que los estudiantes: 1. Adquieran la capacidad de lectura e interpretación de tablas y gráficos estadísticos que con frecuencia aparecen en diferentes medios. 2. Lleguen a comprender y apreciar el papel de la estadística en la sociedad, incluyendo sus diferentes campos de aplicación y el modo en que la estadística ha contribuido a su desarrollo. 3. Identifiquen, dentro del contexto socioeconómico mexicano, la importancia y utilidad de los análisis estadísticos para la toma de decisiones. 4. Se conduzcan de manera ética y responsable en el manejo y análisis de la información. De manera particular, la materia pone especial énfasis en el enfoque práctico del material y los contenidos que se presentan, tratando siempre de relacionar los conceptos, técnicas y casos de estudio con el quehacer cotidiano de las diferentes disciplinas, esperando despertar en los estudiantes el deseo de adentrarse cada vez más a la teoría de la probabilidad y estadística, al ver lo importante que resulta su utilización en las diferentes áreas de trabajo. La asignatura consta de cuatro unidades. En la primera unidad se estudian los fundamentos de la estadística, en la segunda las técnicas para representación gráfica y numérica de datos, en la tercera se abordan los conceptos básicos de la teoría de probabilidad como una medida del riesgo frente a la incertidumbre en experimentos aleatorios y la última unidad presenta el concepto de variables aleatorias y los modelos de probabilidad Binomial, Poisson y Normal. C. Propósito La asignatura tiene como propósito introducir al estudiante con los conceptos y técnicas básicas de la estadística aplicada a la licenciatura e ingeniería. El curso tiene un nivel matemático elemental, con la intención de que el estudiante comprenda la metodología y su aplicación, y no tanto la teoría matemática detrás de ella. Educación Superior Abierta y a Distancia • Primer cuatrimestre 4 1.2. Conceptos básicos e importancia de estadística Población Individuo Muestra Muestreo Dato Variable Solución de un problema estadístico 1.4.2. Metodología del muestreo aleatorio simple 2.6. 2. 1. representación y la descripción de datos.3.2.1. Representación numérica y gráfica de datos 2.3.1.2.4.2.1.2. 2.2.2. Fundamentos de la estadística 1.3.5. Conceptos básicos de muestreo aleatorio 1. 2.2. 2. 2.1.1.2.3. III.2.1.2. Introducción a la estadística 1. 1.2.1.7.1. Muestreo aleatorio 1. Temario 1. 2.1. División de la estadística 1. Representación gráfica de datos Histograma Gráfica de barras Gráfica de líneas Educación Superior Abierta y a Distancia • Primer cuatrimestre 5 . Competencia a desarrollar 2. 1.Estadística básica Programa desarrollado II.5.7.3. 2.1.1. Competencia general Utiliza la estadística descriptiva para el análisis de información a través de la recolección.1.1.1.2. 1. 1.3. 2.2.6.1. Organización de datos y distribución de frecuencias Frecuencias Intervalos Construcción de intervalos de clase Tablas de datos Tablas de frecuencias Tablas por intervalos de clase Tablas de doble entrada 2. 2. 2.1. 1.2. que complementen los ejercicios que se están planteando.1.1.2. Gráfica de área o de pastel 3. Educación Superior Abierta y a Distancia • Primer cuatrimestre 6 .2. es fundamental que los conceptos y procedimientos presentados se ejerciten todo el tiempo. pues esperamos que los contenidos no sólo se comprendan sino que se apliquen en la solución de problemas que tengan que ver con situaciones que los estudiantes pueden enfrentar en su trayectoria académica y profesional. esto con el fin de que puedan observar e identificar cuáles son sus avances y las dificultades que presentan en el aprendizaje de los temas.Estadística básica Programa desarrollado 2.3. pues se espera que sea quien dirija y oriente todo el proceso de aprendizaje.2.1. esto con el objetivo de que los estudiantes ejerciten en el uso. 3. de cada uno de los procedimientos que se abordan durante el curso.1. El facilitador juega un papel muy importante dentro del curso. Por lo anterior. Por otro lado. se les presentarán a los estudiantes varias autoevaluaciones de carácter lúdico. 3.3. es decir.1. A lo largo del curso.2. por un lado.4.1. Medidas de dispersión Recorrido Varianza Desviación típica o estándar IV. los facilitadores de la asignatura tendrán que orientar la aplicación de cada uno de estos procedimientos a las áreas específicas de interés de los estudiantes. aplicación y manejo de formulas y contenidos procedimentales. 3. Como estrategia de evaluación se utiliza un proyecto integrador. 3. las estrategias metodológicas de enseñanza-aprendizaje son. 3. Estas autoevaluaciones contarán con una retroalimentación que sirva para reforzar los temas que se evalúan. dentro de la asignatura se trabajan los contenidos de manera aislada y los facilitadores tendrán que ejemplificar y presentar casos y situaciones aplicables en las diferentes carreras. Medidas de tendencia central Media aritmética Mediana Moda 3.2. Medidas de tendencia central y dispersión 3. el planteamiento de ejercicios y problemas tipo.2. Metodología de Trabajo Para el logro de la competencia. donde el estudiante haga uso de todo lo que se trabajó en el curso. 3.2. Dicho examen se presenta al concluir el estudio de todas las unidades temáticas que integran la asignatura. Además de ser quien oriente las discusiones y sesiones de trabajo que se plantean en los espacios de aprendizaje colaborativo. en el que la retroalimentación permanente es fundamental para promover el aprendizaje significativo y reconocer el esfuerzo. V. que te servirán de ejercitación y práctica.Estadística básica Programa desarrollado Deberá diseñar estrategias que propicien un aprendizaje verdaderamente significativo. la evaluación se conceptualiza como un proceso participativo. Para lo cual es necesaria la recolección de evidencias que permitan apreciar el proceso de aprendizaje de contenidos: declarativos. y conforme a las indicaciones dadas. Por lo que se le considera desde un enfoque integral y continuo. para aprobar la asignatura. En este contexto la evaluación es parte del proceso de aprendizaje. La calificación se asignará de acuerdo con la rúbrica establecida para cada actividad. se espera la participación responsable y activa del estudiante así como una comunicación estrecha con su facilitador para que pueda evaluar objetivamente su desempeño. A continuación presentamos el esquema general de evaluación. A lo largo de la asignatura encontrarás autoevaluaciones. Por lo anterior. Es requisito indispensable la entrega oportuna de cada una de las tareas. actividades y evidencias así como la participación en foros y demás actividades programadas en cada una de las unidades. procedimentales y actitudinales. su realización te preparará para resolver el examen final de la asignatura. sistemático y ordenado que inicia desde el momento en que el estudiante ingresa al aula virtual. Educación Superior Abierta y a Distancia • Primer cuatrimestre 7 . a través del estudio casos y problemas relacionados con el hacer cotidiano donde los estudiantes puedan aplicar y ejercitar lo aprendido. facilitando la comprensión del contenido y relacionando éste con los conocimientos previos del estudiante así como con sus áreas específicas de estudio. Evaluación En el marco del Programa de la ESAD. por lo que es importante que el estudiante la revise antes realizarla. Séptima Edición.. Segunda Edición. Walpole Ronald E. Probabilidad y Estadística para Ingenieros. México: Cengage Learning. México: Mc Graw Hill. (2008). México: Editorial Pearson. México: Mc Graw Hill. Pearson Education de México. Estadística descriptiva y cálculo de probabilidades. Isabel (2006). Octava Edición. Ferris Ritchey. Estadística aplicada a los negocios y la economía. Educación Superior Abierta y a Distancia • Primer cuatrimestre 8 . William M. Probabilidad y Estadística aplicadas a la ingeniería. (2008). (2010). Cuarta Edición. Douglas L. Bibliografía complementaria:     Wackerly Dennis D. George C. México: McGraw-Hill.Estadística básica Programa desarrollado Esquema de Evaluación Foros y base de datos 10% Taller y tareas 30% Evidencias 40% Autorreflexiones 10% E-portafolio. Myers Raymond H. Scheaffer. Castillo Manrique. Decimotercera Edición. se debe de obtener la calificación mínima indicada por la ESAD.. Runger (2007)... Montgomery. 50% Examen final 10% Calificación Final 100% Cabe señalar que para aprobar la asignatura. Mendenhall William III. Samuel W. Estadística Matemática con Aplicaciones. Material de apoyo Bibliografía básica:   Douglas C. Estadística aplicada a las ciencias sociales. (2007). Primera Edición. Richard L. VI. para aprovechar las herramientas de análisis estadístico. Educación Superior Abierta y a Distancia • Primer cuatrimestre 9 . demografía. ingresos. etc. Desarrollo de contenidos por unidad Unidad 1.Estadística básica Programa desarrollado VII. muertes. No obstante.  Aplicarás el procedimiento para obtener una muestra aleatoria simple. identificando los elementos que intervienen en un problema estadístico. Competencia específica Aplica la metodología estadística para obtener información de una muestra aleatoria simple.  Reconocerás la utilidad e importancia de la Estadística. impuestos. es necesario comprender qué representa cada concepto y la metodología mediante la cual se obtiene un dato estadístico. Fundamentos de la estadística Propósitos En esta unidad:  Identificarás los conceptos básicos relacionados con la Estadística. Introducción La palabra estadística a menudo te remite a gráficas y tablas. deudas. cifras relativas a nacimientos. créditos. conocerás sus conceptos básicos.1. En México. sino también para interpretar la información obtenida. Los datos que publica sirven para dar a conocer a cualquier persona la situación en la que se encuentra el área de donde se obtuvo la información. 1.1. Los métodos estadísticos se utilizan prácticamente en investigaciones de todas las áreas de conocimiento. en donde la estadística muestra a la realidad para que el investigador pueda analizar sus deseos y con ello tomar una decisión. División de la estadística La Estadística para su mejor estudio se ha dividido en dos grandes ramas: la Estadística Descriptiva y la Inferencial. entre otros. una confusión que es conveniente aclarar debido a que esta palabra tiene tres significados: la palabra estadística. también se utiliza para referirse al conjunto de técnicas y métodos que se utilizan para analizar la información estadística. en primer término se usa para referirse a la información estadística descripción de parámetros.1. el análisis y la interpretación de datos numéricos con el fin de realizar una toma de decisiones más efectiva. en general. se refiere a una medida derivada de una muestra. Utilidad e importancia La estadística resulta muy útil no sólo para recopilar y describir datos. así como la metodología del muestreo para que al final. como en el profesional y laboral. y el término estadístico.entendiendo que un problema queda definido como la diferencia entre lo real y lo deseado –. la presentación.Estadística básica Programa desarrollado En esta unidad se hablará sobre la importancia de la estadística. grupos. el Instituto Nacional de Estadística y Geografía (INEGI) se encarga de recabar información estadística y geográfica de todo el país. series de hechos. 1. Introducción a la estadística La estadística es la ciencia cuyo objetivo es reunir información cuantitativa relacionada a individuos. Gracias al análisis de estos datos se pueden deducir algunos significados precisos o algunas previsiones para el futuro. en diferentes áreas y contextos. la organización. obtengas una muestra aleatoria simple. Los estudiantes confunden comúnmente los demás términos asociados con las Estadísticas. en todos ellos la finalidad es poder resolver un problema . La estadística. es la ciencia que trata la recopilación. que puede ser aprovechada para demostrar la evolución de un fenómeno a través de cierto tiempo. Educación Superior Abierta y a Distancia • Primer cuatrimestre 10 . tanto en el ámbito académico. en singular y en masculino. etc. 1. si el elemento es una persona. que está formado por varias personas.2. La estadística inferencial infiere con esos datos. llamado muestra. Por ejemplo. sexo. etc. En general el tamaño de la muestra es mucho menor al tamaño de la población.2.2.1.2. Por ejemplo. objetos o grupos (por ejemplo. familias. en los censos económicos se obtienen datos de los negocios.2. se debe analizar un subconjunto o parte de esta que la represente. es un individuo de la población. Población Conjunto de todos los elementos que permiten resolver un problema y que presentan una característica común determinada. Individuo Un individuo o unidad estadística es cada uno de los elementos que componen la población. En este caso cada negocio. 1. entendiendo inferir como la estimación de un resultado. peso. Nota que un individuo en estadística puede ser distinto a un individuo como persona. se pueden estudiar las características edad. 1. Muestra Cuando es difícil estudiar la población debido a su gran tamaño o que provenga de un proceso que no se detiene (como la producción de un bien).Estadística básica Programa desarrollado  Estadística Descriptiva: La función descriptiva de la estadística se enfoca en la presentación y clasificación de los datos obtenidos de la población que se analiza.). Educación Superior Abierta y a Distancia • Primer cuatrimestre 11 . las manzanas de una cosecha. La estadística descriptiva describe datos.  Estadística Inferencial: Esta aplicación de la estadística busca plantear y resolver problemas específicos y/o hacer previsiones a partir de los datos de una muestra. empleados de una empresa. dado que es muy difícil estudiar a la población completa. partiendo del supuesto de que este subconjunto presenta el mismo comportamiento y características que la población. observable y medible. Conceptos básicos e importancia de la estadística 1. Los elementos que integran una población pueden corresponder a personas. nacionalidad.3. se subdividen en:  Discreta: Se tratan de variables expresadas con valores enteros. N° de hijos de una familia.4. Por ejemplo: Si lanzamos una moneda al aire 5 veces obtenemos 5 datos: cara. Dato El dato es cada uno de los valores que se han obtenido al realizar un estudio estadístico.2. cruz. Ej. n° de alumnos de un curso. Las variables se pueden clasificar en cuantitativas y cualitativas: a) Variable cuantitativa: se expresa en valores numéricos. cruz. cara. Educación Superior Abierta y a Distancia • Primer cuatrimestre 12 . Muestreo Es el proceso de recabar los datos que se desean analizar. Peso. Ej. y a la cual se desea estudiar.2. cara. 1.  Continua: son valores que pueden tomar cualquier valor dentro de un intervalo.Estadística básica Programa desarrollado 1. estatura. Variable Se llama variable a una característica que se observa en una población o muestra. Dentro de ella.2.5. obtenidos de una proporción reducida y representativa de la población. sueldos. La variable puede tomar diferentes valores dependiendo de cada individuo. 1.6. lugar de residencia. Ej. días de la semana. se tabulan los datos y se calculan los valores que serán necesarios en pasos posteriores. b) Elaboración de un modelo Se establece un modelo teórico de comportamiento de las variables de estudio. Solución de un problema estadístico La solución de un problema estadístico comprende los siguientes pasos: a) Planteamiento del problema En el planteamiento se define si se requiere de una muestra o es posible estudiar la población. 1. c) Extracción de la muestra Se usa alguna técnica de muestreo o un diseño experimental para obtener información de una pequeña parte de la población. En este punto también se analizan los medios de los que se dispone y el procedimiento a seguir. Ej. Estado civil.7.Estadística básica Programa desarrollado b) Variable cualitativa: es aquella que describe cualidades.  Ordinal: son variables organizadas de acuerdo con una clasificación. las características a estudiar (las variables). No son numéricas y se subdividen en:  Nominal: son variables presentadas sin orden ni jerarquía. se debe analizar un subconjunto o parte de esta que la represente. si es necesario establecer una hipótesis. Los posibles modelos son Normal. nivel socioeconómico. etc. Uniforme. como la media Educación Superior Abierta y a Distancia • Primer cuatrimestre 13 . Binomial. preferencia por una marca. calidad de la atención. grado de estudios. se depura la muestra. etc. d) Tratamiento de los datos En esta fase se eliminan posibles errores. Cuando es difícil estudiar la población debido a su gran tamaño o que provenga de un proceso que no se detiene (como la producción de un bien) . sexo. En ocasiones no es posible diseñar el modelo hasta realizar un estudio previo. Poisson.2. Los métodos de muestreo se pueden clasificar en:   Muestreo probabilístico: en él. clasificación y presentación de la información.1.3. Un ejemplo de estas herramientas son las pruebas de hipótesis que se obtienen del análisis de los datos y los intervalos de confianza.3. Los métodos de esta etapa corresponden a los métodos de la estadística descriptiva. todas las muestras posibles tienen la misma posibilidad de ser elegidas. Para que la información obtenida tenga validez y confiabilidad es necesario que la muestra cumpla con ciertas condiciones específicas. 1. 1. Muestreo no probabilístico: en este tipo de muestreo los elementos de la población no comparten las mismas posibilidades de ser seleccionados. e) Estimación de los parámetros La estadística inferencial nos proporciona herramientas para la predicción o estimación de los parámetros de la población que nos ayudarán a resolver el problema. Las muestras obtenidas no cumplen con la condición de representatividad.2. por lo que no es confiable hacer generalizaciones a toda la población. Conceptos básicos de muestreo aleatorio Para que la información obtenida tenga validez y confiabilidad es necesario que cumpla con algunas condiciones específicas. Muestreo aleatorio Introducción Los estudios estadísticos normalmente se hacen con una parte de la población. 1. Metodología del muestreo aleatorio simple Educación Superior Abierta y a Distancia • Primer cuatrimestre 14 . Las muestras obtenidas a través de este tipo de muestreo son confiables porque aseguran la condición de representatividad que es muy importante para hacer generalizaciones. por lo tanto.Estadística básica Programa desarrollado y la varianza de la muestra. Algunas de las etapas de esta fase son: recopilación. todos los elementos de una población y.3. ya que realizarlos sobre la totalidad resultaría demasiado complicado. relacionadas con el método para determinar el tamaño y características de la muestra y los individuos que la componen. Enumerar a todas las unidades de análisis que integran la población. Siguiendo con el ejemplo de la relaciones de género en el noviazgo en los estudiantes de química.Veamos en qué consiste cada concepto:  Definir el tamaño de la población: Significa determinar el número de individuos que la constituyen. Una vez que hemos definido nuestra población y las variables a estudiar. la variable N representa el tamaño de la población. el paso 1 es determinar el que se va a estudiar. c) El nivel de variabilidad que se calcula para comprobar la hipótesis.  Porcentaje de confianza: Es el grado o nivel de seguridad que existe para generalizar los resultados obtenidos. Esto es. Definir la población de estudio y el parámetro a estudiar. es necesario asignar un número de identificación a cada individuo de la población. su objeto de estudio es las manifestaciones de violencia física y psicológica entre los estudiantes del último año de la carrera de química. lo que sigue es numerar a los 386 estudiantes un número del 1 al 386. determinar el porcentaje de error y el porcentaje de confianza y obtener una muestra preliminar. Su población es el total de estudiantes del último año de ingeniería química que tengan novio o novia. b) El porcentaje de error que se pretende aceptar al momento de hacer la generalización. N=X. Por ejemplo: Un investigador realiza un estudio sobre las relaciones de género en el noviazgo. Para calcular el tamaño de una muestra hay que tomar en cuenta tres factores: a) El porcentaje de confianza con el cual se quiere generalizar los datos desde la muestra hacia la población total. Determinar el tamaño de la población. 3. Por lo tanto. el total de individuos con esta característica es de 386 en este ejemplo. Por lo que. Recordemos que la población es el grupo formado por el conjunto total de individuos.Estadística básica Programa desarrollado 1. Esto quiere decir que un porcentaje del 100% equivale a decir Educación Superior Abierta y a Distancia • Primer cuatrimestre 15 . asignándoles un número de identidad o identificación. objetos o medidas que poseen algunas características comunes observables en un lugar y en un momento determinado. 2. la población es de 386 individuos y las variables son: violencia física y violencia psicológica. el porcentaje de error y el nivel de variabilidad han sido determinados. En este paso. Para evitar un costo muy alto se busca un porcentaje de confianza menor.Estadística básica Programa desarrollado que no existe ninguna duda para generalizar tales resultados. si se quiere eliminar el riesgo del error y considerarlo como 0%. Una vez que la población. y el porcentaje con el que se rechazó la hipótesis es la variabilidad negativa. entonces la muestra es del mismo tamaño que la población. El porcentaje con que se aceptó tal hipótesis se denomina variabilidad positiva y se indica con p (también llamada probabilidad de éxito). Variabilidad positiva = p = a la probabilidad de que suceda el evento. El uso de una u otra depende de si se conoce o no el tamaño de la población. Este dato se obtiene a partir de la distribución normal estándar (esto se considerará en la unidad 4).  Variabilidad: Es la probabilidad (o porcentaje) con el que se aceptó y se rechazó la hipótesis que se quiere comprobar. Al igual que en el caso de la confianza. identificada por q (también llamada probabilidad de fracaso y se obtiene 1-p).  Porcentaje de error: Este error es una distancia alrededor del valor que deseamos estimar y nos da un margen de aproximación. comúnmente es un 95%. por lo que conviene correr un cierto riesgo de equivocarse. se utiliza cualquiera de las siguientes fórmulas. se debe determinar el tamaño de la muestra. Variabilidad negativa = q = a la probabilidad de que no suceda el evento. tomando en cuenta de que no son complementarios la confianza y el error. Determinar el tamaño óptimo de muestra para el estudio. El nivel de confianza es la probabilidad que establecemos (sin hacer ningún cálculo) para poder acertar al valor verdadero de la población. Para cuando no se conoce el tamaño de la población: n es el tamaño de la muestra Z es el nivel de confianza p es la variabilidad positiva q es la variabilidad negativa E es la precisión o error Ejemplo: Educación Superior Abierta y a Distancia • Primer cuatrimestre 16 . el porcentaje de confianza. 4. pero también implica estudiar a la totalidad de los casos de la población. Comúnmente se aceptan entre el 4% y el 6% como error. Se debe determinar el tamaño de la muestra para un nivel de confianza del 95% con un error del 5%.96.000 cajas de medicina.5. Supongamos que la variabilidad p=q=0. Sustituyendo: Educación Superior Abierta y a Distancia • Primer cuatrimestre 17 . Solución: Para el nivel de confianza sea igual al 95%. Supongamos que la variabilidad p=q=0. se desea verificar que la proporción de los ingredientes activos sea el adecuado.95 si Z=1. Debido a que la variabilidad y el error se pueden expresar por medio de porcentajes. tenemos que P(Z)=0. en el caso necesario.95 si Z=1.5. Solución: Para el nivel de confianza sea igual al 95%. Para cuando se conoce el tamaño de la población: n es el tamaño de la muestra Z es el nivel de confianza p es la variabilidad positiva q es la variabilidad negativa N es el tamaño de la población E es la precisión o error Ejemplo: En un lote de 25.Estadística básica Programa desarrollado En un lote grande de medicinas. Se debe determinar el tamaño de la muestra para un nivel de confianza del 95% con un error del 5%. tenemos que p(Z)=0. se ocupará una muestra de aproximadamente 384 unidades.96. Sustituyendo: Es decir. se desea verificar que la proporción de los ingredientes activos sea el adecuado. hay que convertir esos valores a proporciones. se ocupará una muestra de aproximadamente 378 cajas. Ejemplo: Suponga que tenemos la siguiente tabla de 100 datos. Procedimiento para utilizar las Tablas de Números aleatorios: Se selecciona el bloque. Tomar los individuos correspondientes a los números elegidos. s. Si el número seleccionado en la tabla es mayor que N lo pasamos por alto y seguimos hasta tener la muestra total. 0 1 2 3 4 5 6 7 8 9 0 61 21 15 68 79 63 81 84 73 28 1 78 73 10 4 40 20 87 1 46 84 2 83 26 21 49 30 71 69 45 25 29 Educación Superior Abierta y a Distancia • Primer cuatrimestre 18 . Seleccionar la muestra usando números aleatorios. numerados del 00-99. funciones en calculadora o bien utilizando tablas de números aleatorios. También puedes generar números aleatorios de formas mecánicas. Generar números aleatorios mediante programas computaciones (por ejemplo.e incluirán en la muestra aquellos individuos que en la lista de la población ocupen la posición de los “n“ números de las columnas seleccionadas. Comenzando por el primer número de las columnas. Para hacer esto debemos: 1. por ejemplo.Estadística básica Programa desarrollado En otras palabras. Excel con la función “=aleatorio ()” ). se toman tantas columnas como dígitos tenga la población (N). siempre que sean menores que N. sacando números de una urna o lanzando una moneda al aire. el renglón y la columna de la tabla. 3. Nosotros nos enfocaremos únicamente en el uso de la tabla de números aleatorios. Numerar a los individuos de la población del 1 a N (donde N es el tamaño de la población). 5. El último paso para obtener la muestra es saber qué individuos específicos de la población se tomarán. 2. Partiendo de esta selección. en esta basta con poner en la calculadora el número de muestras + (Tecla SHIFT) + RAN# y cada vez que presionemos la tecla (=) nos dará un numero aleatorio. Esto significa que nuestra muestra aleatoria deberá contener esos individuos.uc3m. en el caso de 67 que se repite. tendríamos entonces la siguiente serie de 7 números: 65 03 83 69 67 67 43 54 49 27 82 50 15 06 etc. En la figura anterior tenemos una tabla de números aleatorios tomados de este documento (http://halweb. si solo queremos la parte entera. ignoramos al decimal). seleccionemos una fila al azar. (En algunas calculadoras existe la función RAN# que nos proporciona también números aleatorios. Tendríamos la siguiente tabla: Educación Superior Abierta y a Distancia • Primer cuatrimestre 19 . suponga la fila 5.es/esp/Personal/personas/aarribas/esp/docs/NumerosAleatorios.Estadística básica Programa desarrollado 3 4 5 6 7 8 9 64 29 79 93 58 67 32 74 46 34 39 39 64 7 1 29 24 73 34 52 72 83 34 77 64 88 56 88 74 46 23 66 88 18 48 98 38 1 93 33 51 28 24 25 44 92 5 30 30 25 23 31 61 79 16 22 91 81 29 25 58 68 74 65 17 99 69 51 29 39 Selecciona una muestra aleatoria de 7 números.pdf). y separamos los números de 2 en 2. solo lo consideramos una vez y pasamos al siguiente número. (2010). 23.merriam-webster. Consideraciones específicas de la unidad En esta unidad se trabajará con lecturas de apoyo y se resolverán problemas como ejercicios para reforzar el aprendizaje.Statistics. este material lo utilizarás a lo largo del curso para que elabores las evidencias de aprendizaje de cada unidad. 61. 52. Consultado el 01 de marzo de 2010 en: http://www. Borrego. Castillo Manrique. “Estadística descriptiva e inferencial” en: Revista digital innovación y experiencias educativas 13. 4. 17 . Isabel (2006). 69. Silvia (2008). Conceptos Básicos de Estadística. México: Pearson Educación. Referencias: 1.csicsif. (s/f). Galbiati Riesco. Consultado el 8 de marzo de 2010 en: http://www. Consultado el 10 de marzo de 2010 en: http://www.pdf 3. En Merriam-Webster Online Dictionary. Tendrás que participar en una encuesta con la cual se generará una base de datos. 56.com/dictionary/statistics 2. 34.Estadística básica Programa desarrollado Número aleatorio 65 03 83 69 67 43 54 49 27 82 Individuo de la muestra 93 68 56 69 61 34 23 17 45 52 Por lo que nuestra muestra quedaría con los valores 93. Pontificia Universidad Católica de Valparaíso. Instituto de Estadística. Jorge M. 68.cl/ejercicios_4/ConceptosBasicos.45 . --.es/andalucia/modules/mod_ense/revista/pdf/Numero_13/SILVIA_BORREGO_2.pdf Educación Superior Abierta y a Distancia • Primer cuatrimestre 20 . Estadística descriptiva y cálculo de probabilidades.jorgegalbiati. 12. Raymond H. Introducción En la unidad anterior vimos que existen dos grandes divisiones de la estadística: la que se dedica a la recolección. Estadística aplicada a los negocios y la economía. Scheaffer (2010). Teoría de muestreo”. México: McGraw-Hill. William Mendenhall III y Richard L. Manual de estadística. Decimotercera edición. 8. Estadística para las ciencias sociales.net/cursecon/libreria/drm/ped-drm-est. llamada estadística descriptiva. 10.html 7. Montgomery. Myers.uaq. y George C. Competencia específica Utiliza las técnicas de representación numérica y gráfica para representar información a través de la organización de los datos obtenidos de una muestra o población. México: McGraw-Hill. Octava Edición.Estadística básica Programa desarrollado 5. Enric Mateu (2003). Estadística Matemática con Aplicaciones. Segunda edición. Probabilidad y Estadística para Ingeniería y ciencias.  Organizarás datos en diferentes tipos de tablas y elaborarás varios tipos de gráficas.htm 11. Ruiz Muñoz. Larios Osorio. et al. Douglas.eumed. México: Pearson Educación. Consultado el 01 de marzo de 2010 en: http://minnie.pdf 6. México: McGraw-Hill. Probabilidad y Estadística aplicadas a la ingeniería. Representación numérica y gráfica de datos Propósitos En esta unidad:  Identificarás algunos conceptos que se utilizan en estadística descriptiva.. (2007). Med.mx/matematicas/estadisticas/xu5. “Tipos de muestreo” en: Revista Epidem. Prev. David (2004).es/~veteri/21216/TiposMuestreo1. Ferris (2008). México: Cengage Learning. Jordi Casal. Consultado el 12 de marzo de 2010 en: http://www. Runger (1996). y la que se dedica a realizar hipótesis en base a dichos datos. presentación y categorización de datos. Víctor (1999).uab. Wackerly. Séptima edición. 9. Lind.. Consultado el 09 de marzo de 2010 en: http://www. William Marchal y Samuel Wathen (2008). También Educación Superior Abierta y a Distancia • Primer cuatrimestre 21 . Unidad 2. 1: 3-7. llamada inferencial. Cuarta edición. Dennis D. Douglas C. Ritchey. “Unidad 5. Walpole Ronald E. qué alimentos nos parecen más salados. las personas que realizan el trabajo diseñan sus instrumentos para recolectar la información y obtener los datos que necesitan. pero los más frecuentes son: Censos Es una técnica de recolección de datos que se aplica a la totalidad de los elementos que componen la población o universo que se estudia. un experimento para determinar la velocidad de la luz en el vacío. experimentar mediante el sentido del gusto. veamos en qué consisten. se debe tomar en cuanta a todos los elementos de la población. y dentro de ella aprenderemos cómo organizar y presentar los datos que se obtienen de las muestras tomadas de nuestras poblaciones. Existen muchos métodos para recolectar información. Encuesta Esta técnica se utiliza para recolectar información de una muestra de la población. Experimento Otra de las técnicas más recurridas en estadística para recolectar información son los experimentos. Cuando se realiza un trabajo que requiere de la estadística. Simultaneidad: debe realizarse dentro de un periodo de tiempo limitado. Por ejemplo. Por ejemplo. veamos de dónde y cómo se obtienen los datos que vamos a organizar. también se define como el proceso que se realiza para verificar una serie de hipótesis relacionadas con un determinado fenómeno. Antes de comenzar con los temas. Educación Superior Abierta y a Distancia • Primer cuatrimestre 22 . es decir la población. La diferencia entre la primera y la segunda definición es que en la segunda se parte de una hipótesis mientras que en la primera no necesariamente. Un censo debe cumplir dos condiciones: Universalidad: esto es. Un experimento. donde se está determinando la velocidad de la luz.Estadística básica Programa desarrollado aprendimos a determinar el espacio de estudio. En esta unidad estudiaremos la Estadística Descriptiva. y las variables que se van a estudiar de acuerdo al problema planteado. Un experimento es una prueba que se realiza para determinar las características o comportamientos de una cosa. en el cual se determinan las características o comportamientos del fenómeno que se analiza. Consiste en presentar un conjunto de preguntas abiertas (preguntas que no tienen respuestas predeterminadas) o cerradas (preguntas que cuentan con una serie de respuestas establecidas). 23. resume. 52. mi hipótesis. 23.  Frecuencia acumulada: es la suma de las frecuencias absolutas de las variables hasta el renglón i. 23. 7. Mi experimento verifica si esta hipótesis es cierta o no y en él cabe un margen de error experimental. 41. 2. Frecuencias Dentro de los conceptos básicos para la organización de datos están los que conciernen a la frecuencia:  Frecuencia: es el número de veces que se repite un dato. 52. sin elaborar inferencias ni obtener conclusiones. 18. A continuación veremos que existen diferentes tipos de presentación de datos y con base en ellos distintas clasificaciones de frecuencia. 7. 41. a partir de estudios anteriores. En el segundo ejemplo. 47. 52. 47.  Frecuencia relativa acumulada: es la suma de las frecuencias relativas hasta el renglón i. 2. experimento los sabores de los alimentos sin antes predecir cuál pienso que me sabrá más salado. organiza y representa los datos obtenidos de una población o muestra de dicha población. 52. 47. 18. 18. La organización de datos se realiza a través de tablas que se utilizan para simplificar la presentación y distribución de estos datos. 47.Estadística básica Programa desarrollado En el primer ejemplo. 23. 23. 47. 41.1. 52. Esta área sólo describe.1. también se le conoce como frecuencia absoluta. 23. frecuencia acumulada y frecuencia absoluta. 47.1. De Datos Frecuenci Frecuencia Otra forma Educación Superior Abierta y a Distancia • Primer cuatrimestre Frecuencia Frecuencia 23 . Este dato también puede verse como un porcentaje.18. 23. 18. 41.  Frecuencia relativa: es el resultado de dividir la frecuencia entre el número total de datos (N). es que la velocidad de la luz en el vacío es de 300 000 km/seg. 47. Por ahora veamos cómo se representan los tipos de frecuencia que vimos anteriormente. También es conocida como frecuencia absoluta acumulada. No. Podemos encontrar las frecuencias organizadas en tablas que estudiaremos más adelante. como: frecuencia relativa. supongamos que tenemos la siguiente distribución de datos: 18. 23. Organización de datos y distribución de frecuencias La descripción estadística organiza los datos y los presenta en forma de tablas y gráficas. Marca de clase: Es el punto medio del intervalo y es el resultado de la suma de los límites inferior y superior del intervalo dividido entre 2. se llama intervalo de clase a la expresión que nombra un intervalo.Estadística básica Programa desarrollado renglón (i) obtenidos de la variable 1 7 f1= 2 2 18 f2= 6 3 23 f3= 8 4 41 f4= 4 5 47 f5= 7 6 52 f6= 5 Total a fi Acumulada Fi para obtener Fi Relativa hi f1=F1= 2 f1 = F1=2 f1+f2= F2= 8 f1+f2+f3= F3=16 f1+f2+f3+f4 = F4=20 f1+f2+f3+f4 +f5= F5=27 f1+f2+f3+f4 +f5+f6= F6=32 F1+f2=F2= 8 F2+f3=F3= 16 F3+f4=F4= 20 F4+f5=F5= 27 h1=f1/N=0.0 000 1. Intervalos  Intervalo o rango: Conjunto de números comprendidos entre otros dos números dados.0000 2.  Intervalo de clase: En estadística.12 50 h5=f5/N=0.06 25 h2=f2/N=0.2500 h1+h2+h3=H3=0.2.21 87 F5+f6=F6= 32 h6=f6/N=0.15 63 N=32 Relativa acumulada Hi h1=H1=0. A la marca de clase también se le denomina punto medio de clase. tendríamos que: El intervalo corresponde a todos los números que se encuentran entre el 15 y el 25.   Las fronteras de clase se utilizan para recuperar los datos entre el límite superior de un intervalo y el límite inferior del siguiente. El intervalo de clase sería: 15-25 Educación Superior Abierta y a Distancia • Primer cuatrimestre 24 .5000 h1+h2+h3+h4=H4=0.  Amplitud del intervalo: Es la diferencia del límite superior menos el límite inferior (Ls Li).6250 h1+h2+h3+h4+h5=H5=0. Ejemplo de intervalos Veamos cómo se representan los conceptos relacionados con los intervalos. Dados los números 15 y 25. Fronteras de clase: Son los puntos medios entre los límites de intervalos consecutivos.25 00 h4=f4/N=0. conocidos estos últimos como límites del intervalo.18 75 h3=f3/N=0.8430 h1+h2+h3+h4+h5+h6=H6=1.1.0625 h1+h2=H2=0. porque sería complicado identificar el intervalo al que pertenece dicho dato.5-35.5.5 y 36.5. 25.5 para el tercer intervalo. es decir 10. 15-25 y 26-36. generalmente. 14.5 y 25.5-24. las fronteras de clase serían: 3.5-25. Si esta coincidencia sucede deberá moverse el intervalo. La marca de clase del intervalo 15-25 es igual a: Es recomendable que la marca del intervalo coincida con alguno de los datos.5 y 24. Siguiendo con el ejemplo.Estadística básica Programa desarrollado Los límites del intervalo son: Límite inferior = 15 Límite superior = 25 La amplitud del intervalo 15-25 sería: 25 menos 15.5 y 14.5. se identifica el número mayor (Xn) y el número menor (X1) en los datos.5-13. La frontera de clase no debe coincidir con los datos límites del intervalo.5 para el segundo intervalo.1. Lo que se debe hacer para determinar los intervalos de clase es lo siguiente: 1. esto es: Educación Superior Abierta y a Distancia • Primer cuatrimestre 25 . 13.5-14. Esto no es necesario y no siempre se logra. que se representa con (k). Es recomendable que todos los intervalos tengan la misma amplitud. 14. Construcción de intervalos de clase La formación de clases o intervalos de clase.5 y 25.5 no se sabría si ponerlo en el segundo o en el tercer intervalo. La frontera de clase: si tomamos los intervalos 4-14. El rango es el resultado de la resta. del tamaño del rango de la población o muestra. por último. moviéndolo un punto a la izquierda tendríamos los intervalos 2.3. Ejemplo: Con en base las fronteras dadas se construyen los nuevos intervalos 3. 2.5. dependen. para el primer intervalo. Calcular el rango: Para esto. Para ello podemos restar el dato menor del dato mayor y dividir este resultado entre el número de intervalos que se deseen. sobre todo cuando los intervalos tienen la misma amplitud.5. Si se tiene el dato 25.5-36. entonces: Esta será la amplitud de los intervalos. Se forman los intervalos: Los intervalos se forman comenzando un número antes del primer dato: INTERVALOS: 17 a 22 (se cuenta 5 desde 18 hasta 22) 23 a 28 29 a 34 35 a 40 41 a 46 47 a 52 53 a 58 Nota: No importa que el último intervalo exceda el último dato. La decisión la toma el investigador.Estadística básica Programa desarrollado R= Xn – X1 Por ejemplo: Si en una serie de datos que van desde el 18 hasta el 56. Dividir el rango entre el número de intervalos que se desea tener: Recordemos que lo recomendable es elegir un número entre 5 y 20 para los intervalos. Cuando la cantidad de datos es tal que no alcanza para acumular un intervalo más. deseo 7. entonces se divide entre el número de intervalos que se quieren. Siguiendo con el ejemplo. Determinar el número de intervalos que se desea tener: No existe una regla para determinar el número de intervalos. Entonces decimos que K=7. tendríamos lo siguiente: Xn= 56 y X1= 18. por lo tanto: R= Xn – X1= 56 – 18= 38 2. se escoge el entero más cercano. pero generalmente se suelen crear entre 5 y 20 intervalos. 3. como en este caso. Dividimos entre uno menos de los intervalos deseados porque con el número de datos se acumula un intervalo más. tomamos el rango igual a 5. 4. Siguiendo con nuestro ejemplo. diríamos que vamos a construir 7 intervalos. Cuando no es un número entero. Educación Superior Abierta y a Distancia • Primer cuatrimestre 26 . 38. Se forman los intervalos: Comenzamos por un número anterior al límite inferior: 19-24. 46-50. 28 46. 41-45.Estadística básica Programa desarrollado Ejemplo de construcción de intervalos Veamos el siguiente ejemplo para la construcción de intervalos de clase. 22. 27. Tablas de datos Existen diferentes tipos de tablas para presentar los datos. 25. 25. 37. 37. Vayamos paso por paso: 1. 35. Para ello pide a uno de sus empleados que le elabore un reporte. 36. las más utilizadas son: Tabla de datos. 30. 31. 30. Se organizan en columnas o renglones y se registran las mediciones o datos obtenidos. 56. 40. 28. 56-60. 55. 51-55.1. 48. Dividir el rango entre el número de intervalos: 4. 38. 30. Tabla por intervalos de clase y Tablas de doble entrada. El director de una consultoría en desarrollo de software desea conocer el número de incidencias en sus desarrollos reportadas durante los meses de agosto y septiembre. 25-29. 44. 41. Calcular el rango: R= Xn – X1= 60-20=40 2. 24. 26. 39. 23. 3640.4. 31. 40. 30. Determinar el número de intervalos entre 5 y 20: Elegimos 8 intervalos 3. 32. 31. 58. 52. 28. 48. 2. 24. 52. 26. 22. 35. 50. 24. 36. 49. 29. 29. 56. Tabla de frecuencias. 27. el empleado tiene los siguientes datos: 35. 20. 60. 31. Veamos en qué consiste cada una: Una tabla de datos es la forma más sencilla de organizar un conjunto de datos y se utiliza cuando la información que necesitamos son los datos mismos. 30. 40. 38. 48. Ejemplo: Educación Superior Abierta y a Distancia • Primer cuatrimestre 27 . 27. 39. 30-35. 20. 5 20.Estadística básica Programa desarrollado Supongamos que la medición de temperatura a lo largo del día da como resultado los siguientes valores en grados Celsius: 20.1.3 26.1.2.1.4.2 22.2. 25.5.9.2.3.2.5.7 Tablas de frecuencias Esta nos aporta mayor información pues está formada por categorías de la variable que se esté midiendo y su frecuencia (es decir.1.7.3.1. 22.3.4.9 27.4.2.9. 26. Tablas por intervalos de clase En este tipo de tablas los datos son presentados por intervalos de clase y no por los valores correspondientes a cada variable. 27.4 21.1.3. 21.6.2 Procedemos entonces a agrupar por categorías. Ejemplo: suponga que un experimento da los siguientes valores medidos: 1.3. Entonces construimos una tabla como la siguiente: Temperatura (Celsius) 2. según la frecuencia o número de veces que aparece cada medición: Valor de la Variable medida 1 2 3 4 5 6 Frecuencia 4 7 5 4 5 1 2. Ejemplo: Educación Superior Abierta y a Distancia • Primer cuatrimestre 28 .1 23.5.4.6.3. 23.2.5.9 25. el número de ocurrencias de un valor dado).2.4. Tablas de doble entrada Estas tablas proporcionan información referente a dos variables o eventos relacionados entre sí.Estadística básica Programa desarrollado En una encuesta sobre el desempleo en el Área Metropolitana de la Ciudad de México. Grupo de edad De 12 a 19 De 20 a 24 De 25 a 34 De 35 a 44 De 45 a 99 Frecuencia 9600 7100 3900 1500 1600 2.1.7. Por ejemplo: Educación Superior Abierta y a Distancia • Primer cuatrimestre 29 . Ejemplo: Suponga que se miden el número de cirugías realizadas por edades en una muestra de 100 personas. Se forma poniendo en los renglones de la tabla la información de una de las variables y en las columnas la información de la otra variable. teniendo un total de 23. en la cual las variables relacionadas son los rangos contra el valor de las variables en dicho rango. de cirugías Menos de 2 cirugías Más de 2 cirugías 0-10 1 0 11-20 2 2 21-30 6 4 31-40 11 7 41-50 17 6 Más de 50 30 14 Una tabla cualquiera puede ser vista como una tabla de doble entrada. se organizan los datos por grupos de edades (intervalos de clase) y se presenta la frecuencia de cada intervalo. encontrándose lo siguiente: Edades / No.700 desempleados. El histograma también proporciona visualmente el aspecto de la distribución y dispersión de las mediciones. 2. Si los intervalos de clase tienen el mismo ancho. a la escala de medición o fronteras de clase. En estas se muestran la frecuencia. las alturas de las barras serán proporcionales a las frecuencias.Estadística básica Programa desarrollado Supongamos que medimos la temperatura de un líquido con respecto al tiempo de calentamiento. Ahora veremos la representación gráfica de los datos.2. nominal y discreto. Se elabora en un sistema de coordenadas rectangulares. En el renglón colocamos los tiempos y en las columnas la temperatura obtenida. Gráfica de barras Este tipo de gráfica se utiliza para datos de tipo ordinal. 2.2. El eje vertical representa a la escala de frecuencias.2. es decir. Las gráficas son representaciones visuales de los datos que se muestran en una tabla.2. Histograma Histograma es la representación gráfica de una variable continua. Podríamos considerar la tabla como una tabla de frecuencias o como una tabla de doble entrada: Tiempo (min) 1-5 6-10 11-15 Temperatura (°C) 36 44 67 2. cada una de ellas se elabora con base en el tipo de información que se quiere representar.1. la frecuencia relativa y el porcentaje por medio de la altura de la barra y Educación Superior Abierta y a Distancia • Primer cuatrimestre 30 .    El eje horizontal se utiliza para representar a la variable independiente. Existen diferentes tipos de gráficas. Representación gráfica de datos Introducción En el tema anterior presentamos diferentes formas de organizar o de tabular datos y vimos la distribución de frecuencias. 2. obteniéndose la gráfica de línea. En el eje horizontal se representa a la variable y en el eje vertical la frecuencia. Esta gráfica muestra las discontinuidades en las mediciones por medio de espacios vacios entre las barras. En el eje vertical los valores de la variable.Estadística básica Programa desarrollado no por el área de la barra. Un histograma y una gráfica de barras son muy semejantes.3. Para trazar la gráfica.2. La frecuencia de cada valor medido es representada por la altura del punto. Y puede ser de dos formas: Barras verticales: • • En el eje horizontal se representan los valores de la variable. Barras horizontales: • • En el eje horizontal se representan las frecuencias. la diferencia radica en que el histograma no presenta separación entre las barras.4. Gráfica de líneas Una gráfica de líneas se construye también en un sistema coordenado rectangular. En el eje vertical se representa la frecuencia de cada clase. se hace una distribución proporcional de las frecuencias del problema con respecto a la circunferencia determinando sectores circulares para cada categoría. 2. y muestra la relación entre las variables mediante puntos conectados por líneas continuas. Esta gráfica muestra la relación entre las variables dividiendo un círculo (o pastel) en sectores (o rebanadas). 2. Educación Superior Abierta y a Distancia • Primer cuatrimestre 31 . Gráfica de área o de pastel Una forma de representar datos u observaciones de una variable cualitativa es mediante un diagrama circular. Se determinan los puntos de corte del valor de la variable con su frecuencia y se unen. pero es el área de cada sector la proporcional a los valores medidos. También se utilizan para representar la distribución de frecuencias. La gráfica de barras se traza sobre un eje de coordenadas. 1 30.4 30.8 30.Estadística básica Programa desarrollado Ejemplo: Considere la siguiente tabla de datos.5 30.6 30.9 Frecuencia 3 7 12 18 23 21 17 11 5 1 Educación Superior Abierta y a Distancia • Primer cuatrimestre Frecuencia acumulada 3 10 22 40 63 84 101 112 117 118 Porcentaje 3% 6% 10% 15% 19% 18% 14% 9% 4% 1% 32 .3 30.2 30.7 30. Medición en cm 30 30. Educación Superior Abierta y a Distancia • Primer cuatrimestre 33 . note como el ancho de las clases es el mismo. En esta figura se muestra la frecuencia acumulada mediante una gráfica de línea. En la gráfica de pastel se muestra dentro de cada “rebanada” la medición en cm y el porcentaje que corresponde a la frecuencia relativa. frecuencia.Estadística básica Programa desarrollado En esta figura se muestra el histograma de las mediciones en cm vs. gov. Probabilidad y Estadística aplicadas a la ingeniería. Medidas de tendencia central y dispersión Propósitos En esta unidad: • Aplicarás el procedimiento para obtener las medidas de tendencia central y dispersión en datos agrupados y no agrupado.unal. Douglas C. Probabilidad y Estadística para Ingeniería y ciencias.doc. México: Pearson Educación. Raymond H. Octava edición. Consultado el 26 de abril de 2010 en: http://www. Consultado el 27 de abril de 2010 en: http://www.vitutor. México: McGraw-Hill. Montgomery. Consultados el 26 de abril de 2010 en: http://www.ar/proyectos/censo2001/maestros/quees/masinfo.pdf Para saber más: 5.indec.html Unidad 3.Estadística básica Programa desarrollado Consideraciones específicas de la unidad En esta unidad se trabajará con dos problemas diferentes que permitirán practicar a elaboración de tablas de datos y gráficas.com/estadistica. Cuarta edición. y George C. (2007).edu. 2.co/cursos/odontologia/2002890/lecciones/estadistica_descrip tiva_2/estadistica_descriptiva_2.tec. http://www. Walpole. La evidencia de aprendizaje se generará a partir de la muestra que se obtuvo en la unidad uno. además de participar en un foro sobre el uso cotidiano de la estadística descriptiva.gt/boletin/URL_03_BAS01. Competencia específica Utiliza las medidas de tendencia central y dispersión para describir un conjunto de datos mediante la representación numérica y gráfica de la información obtenida en una muestra o población. Referencias: 1. Runger (1996). Consiste en la elaboración de tablas de datos y gráficas de diferentes tipos.edu. Intervalos de clase.virtual.htm 4. Myers et al. Estadística y probabilidad. Censo y entrevista.. 3. Introducción Educación Superior Abierta y a Distancia • Primer cuatrimestre 34 .url. Ronald E. la mediana y la moda. Las fórmulas para calcular la media son: En una población Educación Superior Abierta y a Distancia • Primer cuatrimestre En una muestra 35 . Media aritmética La media aritmética o. varía de acuerdo a la manera cómo los tenemos organizados. Esta información nos indica cómo se comporta la población de datos que tenemos. respectivamente. que. Se llaman así porque tienden a ubicarse en la parte central del conjunto de datos.1.1. 3. que nos muestran hacia qué valores se agrupan o acumulan los datos. representan conjuntos de datos.1.Estadística básica Programa desarrollado Para cualquier conjunto de datos estudiados es importante tener información resumida de sus características. se denota por ̅ o por la letra μ según se calcule en una muestra o en la población. La media es resultado de dividir la suma de todos los valores (xi) entre el número total de datos (N). Estos dos tipos de indicadores estadísticos son: las medidas de tendencia central. Medidas de tendencia central Las medidas de tendencia central son los valores que representan un conjunto de datos de forma tal que nos ayudan a saber dónde están acumulados los datos pero sin indicar como se distribuyen. La fórmula para calcular la media de una distribución de datos. es decir. cada valor se representa de manera individual. Las medidas de tendencia central más comunes son: la media aritmética. simplemente. comúnmente conocida como media o promedio. de forma contraria a las anteriores. Para resumir la información se utilizan dos tipos de valores que en lugar de representar cada dato. Fórmula para calcular la media en datos no agrupados Los datos no agrupados son aquellos datos que organizamos en una tabla de datos. 3. muestran cómo se dispersan o separan los datos. y las medidas de dispersión. media. Recuerda que las tablas de intervalos muestran el número de datos que abarca cada intervalo (frecuencia por intervalo).Estadística básica Programa desarrollado En estas fórmulas la diferencia radica en que. las tablas que contienen. en otra columna. el total de la población se representa con la letra N y el total de la muestra se representa con la letra n. en una columna. Fórmula para calcular la media en datos agrupados por frecuencias simples Los datos agrupados en frecuencias son aquellos que organizamos en una tabla de frecuencias. Las fórmulas para calcular la media con los datos organizados de esta manera son: En una población Educación Superior Abierta y a Distancia • Primer cuatrimestre En una muestra 36 . la frecuencia (fi) o el número de veces que se repite cada valor en una serie de datos. Las fórmulas para calcular la media con los datos organizados de esta manera son: En una población En una muestra Fórmula para calcular la media en datos agrupados por intervalos Los datos agrupados en intervalos son aquellos que se organizan dentro de un rango establecido entre un límite inferior y un límite suprior. es decir. el valor de la variable (xi) y. Por ejemplo: Educación Superior Abierta y a Distancia • Primer cuatrimestre 37 . 6. 1. 7. su suma dividida entre dos. El dato que divide a la mitad es: 4.1. Si n es impar hay un dato que queda en medio de todos. Mediana La mediana es el valor que divide a la mitad la serie de datos que se tienen. por lo tanto Me: 4 Para cuando la cantidad de valores es impar: 1. es decir. 6.Estadística básica Programa desarrollado 3. 4. Para cuando la cantidad de valores de la distribución es impar: 1. 2. 0. en este caso la mediana es el promedio de esos dos datos. 0. 8. entonces. 8. el número de datos que queda a la izquierda de la mediana es igual al número de datos que queda a la derecha. 1. Promediamos los valores del centro.2. Ordenamos los valores de menor a mayor. 0. Ordenamos los valores de menor a mayor. Ordenamos: 0. 1. 7. 8. 2. Es decir. 4. 6. 4. Por ejemplo: Supongamos que tenemos los siguientes valores: 2. 1. 2. 6. 3. Si n es par hay dos datos que quedan en medio de todos. la mediana queda en medio de todos los datos cuando los acomodas ya sea en orden creciente o decreciente. Buscamos el valor del centro. éste será igual a la mediana. 4. 9 1. 8. 9 2. Buscamos los valores del centro. 5 Mediana en datos agrupados por intervalos Cuando queremos calcular la mediana en datos agrupados por intervalos. 5. Algunas veces el valor que más se repite puede no ser único. 2. Ordenamos 1. 4. Buscamos los datos del centro: 4.1. 9 2. 6. 2 1. 3. 3. 7. puede haber dos o más datos que aparezcan con la misma frecuencia absoluta.Estadística básica Programa desarrollado Supongamos que tenemos los siguientes valores: 5. por lo tanto Me: 4. Por ejemplo si tomamos una muestra de hombres y mujeres y medimos sus estaturas tendremos dos modas. 6. tenemos que buscar el intervalo donde la frecuencia acumulada llega hasta la mitad de la suma de las frecuencias absolutas. 1. 3. 8. es decir. y se denota como Mo. siendo ésta la mayor. 9. 7.3. 5 3. es decir. Educación Superior Abierta y a Distancia • Primer cuatrimestre 38 . 6. ocupamos siguiente fórmula: En donde: Li = Límite inferior del renglón en donde debe estar la mediana Fi-1 = Frecuencia acumulada anterior al renglón de la mediana fi = frecuencia del renglón de la mediana ai = tamaño del intervalo 3. En esas ocasiones podemos hablar de poblaciones o muestras bimodales si existen dos modas o multimodales si existen más de dos. esto es. es necesario localizar el intervalo donde se encuentre . 1. Moda La moda es el valor del dato que más veces se repite. 6. 3. 1. 2. 4. 7. 8. Promediamos: . 2. 7. el valor cuya frecuencia absoluta es mayor. Las medidas de dispersión más comunes son: el recorrido. 3. las medidas de dispersión miden el grado de separación o alejamiento que tiene una variable estadística en torno a una medida de posición o tendencia central.2. que miden acumulaciones.Estadística básica Programa desarrollado Cuando nuestra distribución de datos es por intervalos de clase. también se le conoce como rango y se denota por Re. A mayor dispersión menor representatividad de la medida de posición y viceversa.1. Dicho grado de separación nos indica lo representativa que es la medida de posición con respecto al conjunto total de datos. La fórmula para calcularlo es: Donde: Educación Superior Abierta y a Distancia • Primer cuatrimestre 39 . Medidas de dispersión A diferencia de las medidas de tendencia central. Recorrido El recorrido representa la distancia que hay entre el primero y el último valor de la variable. la varianza y la desviación estándar. primero localizamos el intervalo que tiene mayor frecuencia absoluta y utilizamos la siguiente fórmula para calcular la moda: En donde: Li = Límite inferior del renglón en donde debe estar la moda fi = frecuencia del renglón de la moda fi+1 = Frecuencia ulterior al renglón de la moda fi-1 = Frecuencia anterior al renglón de la moda ai = tamaño del intervalo 3. mediante un solo punto.2. 74. 76. 78. 69. sustituyendo los valores: Re=78-52=26 3.Estadística básica Programa desarrollado máx xi es el valor máximo del a variable min xi es el valor mínimo de la variable Por ejemplo: Supongamos que tenemos la siguiente distribución de datos: 69.2. Calculamos el rango. 69.2. 57. 74. 68. Desviación típica o estándar Educación Superior Abierta y a Distancia • Primer cuatrimestre 40 . Siempre es mayor o igual que cero y menor que infinito. Varianza La varianza mide la mayor o menor dispersión de los valores de la variable respecto a la media aritmética. Se define como la media de los cuadrados de las diferencias del valor de los datos menos la media aritmética de estos. 52. 52.3. 71. 52. La fórmula de la varianza para datos no agrupados es: Para calcularla en una población: Para calcularla en una muestra: Varianza para datos agrupados por intervalos La fórmula para calcular la varianza en datos agrupados por intervalos es la siguiente: Para calcularla en una muestra: Para calcularla en una población: 3.2. Se define como la raíz cuadrada positiva de la varianza. respectivamente. Se denota como S o. es decir. según se calcule en una muestra o en toda la población. Se expresa mediante las siguientes fórmulas: En datos no agrupados: En una población: En una muestra: En datos agrupados por intervalos: En una población: En una muestra: Educación Superior Abierta y a Distancia • Primer cuatrimestre 41 .Estadística básica Programa desarrollado La desviación típica muestra qué tan alejado está un dato del valor de la media aritmética. la diferencia que hay entre un dato y la media aritmética. Consultado el 27 de abril de 2010 en: http://bibliotecavirtual. 2. los alumnos tendrán que obtener las medidas de tendencia central y dispersión. Ronald E. además de incluir. México: Pearson Educación.edu.com/estadistica. Cuenta con una actividad que debe ser enviada al facilitador como tarea. Octava edición. una reflexión sobre el uso y las aplicaciones de la estadística descriptiva. Myers et al. Probabilidad y Estadística para Ingeniería y ciencias. Se contará con dos foros de uso general. Runger (1996). Cuarta edición. 3.html Educación Superior Abierta y a Distancia • Primer cuatrimestre 42 . Se les solicita a los alumnos que al concluir cada subtema (tipo de medida) se elabora una actividad relacionada con el mismo. Estadística y probabilidad.pdf 4. Walpole. Consultado el 27 de abril de 2010 en: http://www. Montgomery. a manera de conclusión.pe/Estadistica/res/pdf/estadisticadescriptivav ariables2. Probabilidad y Estadística aplicadas a la ingeniería. Referencias: 1. México: McGraw-Hill.vitutor. al final del tema uno y dos estas actividades se comparten con el resto del grupo para que entre todos se revisen y retroalimenten. Douglas C. además de la autoevaluación y la evidencia de aprendizaje. (2007).Estadística básica Programa desarrollado Consideraciones específicas de la unidad Las actividades de esta unidad se trabajan en diferentes momentos. Esta última consiste en la presentación de las medidas de tendencia central y dispersión de los datos obtenidos de la muestra de la unidad uno. El objetivo de estos foros es que los alumnos planteen sus dudas a todo el grupo o compartan información que pueda ser de utilidad para el estudio de los temas. a partir de un problema que se trabaja en la unidad 2. Raymond H.lasalleurubamba. Medidas de tendencia central y dispersión. y George C. uno para las medidas e tendencia central y otro para las medidas de dispersión.. Estadística básica Programa desarrollado Educación Superior Abierta y a Distancia • Primer cuatrimestre 43 .
Copyright © 2024 DOKUMEN.SITE Inc.