Material de Clases © German Pomachagua Perez 2-Abr-13Germán Elías Pomachagua Pérez
[email protected] CLASE 01: Conceptos básicos Material de Clases © German Pomachagua Perez 2-Abr-13 Que deberían saber al terminar esta clase: Que queremos significar por estadística Que entendemos por estadística descriptiva e inferencial. Que es una población y que una muestra. Que es una variable, el dato y los datos Cuando la información se refiere a un parámetro o un estimador Distinguir cuando una variable es cualitativa y cuando cuantitativa. Distinguir entre una variable discreta y continua. Distinguir las fuentes de datos OBJETIVOS Material de Clases © German Pomachagua Perez 2-Abr-13 INTRODUCCIÓN No se puede administrar lo que no se mide. Las mediciones son la clave. Si usted no puede medirlo, no puede controlarlo. Si no puede controlarlo, no puede adminístralo. Si no puede adminístralo, no puede mejorarlo. La falta sistemática o ausencia estructural de estadísticas en las organizaciones impide una administración científica de las mismas. Material de Clases © German Pomachagua Perez 2-Abr-13 INTRODUCCIÓN Dirigir sólo en base a datos financieros del pasado, realizar predicciones basadas más en la intuición, y tomar decisiones desconociendo las probabilidades de éxito u ocurrencia, son sólo algunos de los problemas o inconvenientes más comunes hallados en las empresas Peter Drucker hace dos afirmaciones básicas. Primero, afirma que pocos factores son tan importantes para la actuación de la organización como la medición. Segundo, lamenta el hecho de que la medición sea el área más débil de la gestión en muchas empresas. Material de Clases © German Pomachagua Perez 2-Abr-13 Sin estadísticas una empresa carece de capacidad para reconocer qué actividades o productos le generan utilidades, y cuáles sólo pérdidas. No contar con datos ni interpretarlos correctamente es para los administradores como caminar en la oscuridad. Contar con los datos les ilumina, les permite ver lo que está aconteciendo y en consecuencia tomar las medidas más apropiadas INTRODUCCIÓN Material de Clases © German Pomachagua Perez 2-Abr-13 En un estudio de mercado, se toma una muestra de clientes y se pide la opinión de las personas acerca de las calidades de cierto producto El comité ejecutivo de un hotel utiliza las estadísticas para medir la satisfacción del cliente. Los análisis de control de calidad necesitan de la obtención de información acerca de los productos que son fabricados. APLICACIONES En una industria, se hace inspección de los artículos comprados como materia prima. Se debe entonces hacer un muestreo para contar los artículos defectuosos en el lote comprado. Material de Clases © German Pomachagua Perez 2-Abr-13 Es una ciencia que comprende diversas técnicas para : RECOLECTAR ORGANIZAR ANALIZAR INTERPRETAR DATOS ¿Qué es Estadística ? Es una ciencia que constantemente proporciona métodos y técnicas para mejorar la calidad de las observaciones científicas, y ayuda a la toma de decisiones en condiciones de incertidumbre. Material de Clases © German Pomachagua Perez 2-Abr-13 ¿Quienes usan la estadística? Organismos oficiales. Diarios y revistas. Políticos. Deportes. Marketing. Control de calidad. Administradores. Investigadores científicos. Médicos etc. Material de Clases © German Pomachagua Perez 2-Abr-13 Es el valor de la variable. Ejemplo : Si un DATO es útil para tomar decisiones se convierte en INFORMACIÓN. 1.3 ¿Qué son DATOS ? Edad del paciente Peso Tiempo permanencia Temperatura corporal Profesión 27 70 5 37,5 Contador años Kg. días °C --- Variable Datos Unidad de medida Material de Clases © German Pomachagua Perez 2-Abr-13 ESTADÍSTICA DESCRIPTIVA: Método de recolectar, organizar, resumir, analizar e interpretar los datos. Tiene como objetivo presentar los datos obtenidos en forma resumida, clara y comprensible Ejemplo 1: Los datos del Censo de población de 2006. Ejemplo 2: La cantidad de robos ocurridos el último mes en el distrito de Surco. Ejemplo 3: La nota promedio del curso de Estadística General de los alumnos del grupo 1. DIVISION DE LA ESTADISTICA Mencionamos algunos procedimientos: Tablas de distribuciones de frecuencia Gráficos de distribución de frecuencias Diagramas de cajas Diagramas de tallos y hojas Estadísticos de tendencia central, dispersión y de forma Material de Clases © German Pomachagua Perez 2-Abr-13 ESTADÍSTICA DESCRIPTIVA: Algunos procedimientos <X i-1 - X i ] f i h i F i H i <38 - - 45] 3 0.14 3 0.14 <45 - - 52] 2 0.10 5 0.24 <52 - - 59] 7 0.33 12 0.57 <59 - - 66] 3 0.14 15 0.71 <66 - -73] 6 0.29 21 1.00 21 1.00 Gráficos de distribución de frecuencias EDAD Stem-and-Leaf Plot Frequency Stem & Leaf 1,00 3 . 9 3,00 4 . 029 8,00 5 . 14678889 5,00 6 . 34689 4,00 7 . 0012 Tabla de Frecuencias 20 80 N = SEXO MUJER HOMBRE E D A D 25 24 23 22 21 20 19 18 17 46 94 28 65 93 43 62 47 71 41 52 Grafico de Cajas y Bigotes Diagrama de Tallos y hojas Material de Clases © German Pomachagua Perez 2-Abr-13 Estadística Inferencial Muestra Estimador POBLACIÓN Parámetro DIVISION DE LA ESTADISTICA Inferencia Es un conjunto de métodos que permiten efectuar una estimación, predicción o generalización sobre una población, basado en el análisis de datos de una muestra. Ejemplo 1: Una encuesta desarrollada por IBOPE, en marzo 2012, dice que el rating de radio en la Gran Lima esta encabezado por RPP con un 10.5% seguido por RCN con 9.18% Ejemplo 2: El INEI informó que la Encuesta Permanente de Hogares (EPH) del mes de marzo de 2011 reporto la tasa mas alta de desempleo que ascendió al 10.3% a nivel nacional Material de Clases © German Pomachagua Perez 2-Abr-13 Fuente http://estadisticas.bcrp.gob.pe ¿Qué parte de la estadística nos dice cuál será el tipo de cambio el día de mañana? ………………………………………………………………………………........................... ....................................................................................................................................... Material de Clases © German Pomachagua Perez 2-Abr-13 DEFINICIONES BASICAS Ejemplos: un alumno de la universidad, un turista nacional, un turista internacional, una ama de casa, un supermercado, una empresa de calzado, un mozo, un lugar turístico, un grifo, una persona, una familia etc. Unidad Estadística: (Unidad de análisis) el elemento fundamental e indivisible de la población (persona, animal o cosa), sobre las cuales se va obtener datos, en otras palabras es el que proporciona el dato. Material de Clases © German Pomachagua Perez 2-Abr-13 Población Conjunto de todas las unidades elementales (personas, procesos o cosas) perfectamente definidos de los cuales se desea obtener información Población y Muestra Ejemplos : • Todos los trabajadores afiliados a una AFP • Todos los alumnos de las universidades publicas. • Todas las historias clínicas de un hospital. Material de Clases © German Pomachagua Perez 2-Abr-13 POBLACION Parámetro: Es un valor numérico que resume los datos de una población; para determinar su valor es necesario utilizar toda la información de la población (censo). Sólo hay un parámetro en cada población. Generalmente es desconocido y por lo tanto debe ser estimado π : Proporción poblacional : Media poblacional (mu) 2 : Varianza poblacional (sigma cuadrado) Los más usados son: Censo: Estudio realizado a todos y a cada uno de los individuos que forman parte de la población Material de Clases © German Pomachagua Perez 2-Abr-13 MUESTRA: Parte o subconjunto representativo de una población, sus elementos son seleccionados aleatoriamente o no con el objeto de investigar las características de la población de la cual proceden. Muestreo: Es un procedimiento de selección de los elementos a ser estudiados o encuestados Material de Clases © German Pomachagua Perez 2-Abr-13 Muestreo Actividad por la cual se toman muestras de una población de elementos de los cuales vamos a tomar ciertos criterios de decisión. No Si Material de Clases © German Pomachagua Perez 2-Abr-13 p Proporción muestral x Media muestral. Ejemplo - De los 100 estudiantes entrevistados, el 70% apoya la resolución sobre la vacancia del Director Los más usados son: Varianza muestral 2 s Estimador (estadígrafo): Es un valor numérico que resume los datos de una muestra. Su valor es usado con propósitos de estimación de los parámetros de una población, de la cual se extrajo la muestra. Material de Clases © German Pomachagua Perez 2-Abr-13 Ejemplo: El siguiente gráfico muestra la evolución de la inflación desde el año 1980 al 2010. ¿El índice de precios al consumidor IPC que obtiene el INEI, es un parámetro o un estadígrafo? Material de Clases © German Pomachagua Perez 2-Abr-13 RESUMEN Población (N) µ σ 2 π MUESTRA (n) MUESTREO x 2 S p INFERENCIA P A R A M E T R O E S T I M A D O R Material de Clases © German Pomachagua Perez 2-Abr-13 Material de Clases © German Pomachagua Perez 2-Abr-13 Ejemplo 1: Se ha hecho un estudio en SJL para determinar la preferencia de una marca especial de detergente por parte de las amas de casa. Entre las 50 amas de casa entrevistadas, 30 dijeron que preferían esta marca. a. ¿Qué constituye la muestra? b. ¿Qué constituye la población? c. ¿Cuál es la proporción, dentro de la muestra, de las amas de casa que prefieren la marca del detergente? Solución: a) El conjunto de respuestas que dieron las 50 amas de casa. b) El conjunto formado por las posibles respuestas de las amas de casa de SJL c) Es el estimador proporcional 30 0.6 50 x p n Material de Clases © German Pomachagua Perez 2-Abr-13 Ejemplo 2: Cierta universidad realizo un censo estudiantil observándose que: El ingreso familiar promedio mensual de los alumnos es de S/.2,500, y el ingreso familiar promedio mensual de 100 alumnos escogidos al azar es de S/. 2,250 Hallar: La población, el parámetro, la muestra, el estimador. La población : Es la totalidad de los alumnos de la Universidad (N) El parámetro: μ=S/2,500 La muestra: Los 100 alumnos elegidos al azar (n=100). El estimador: la media muestral / 2, 250 x S Material de Clases © German Pomachagua Perez 2-Abr-13 Ejemplo 3: Una compañía produce poleas que se supone tengan un diámetro promedio de 2.50 centímetros, según requerido por el comprador. Un equipo de ingenieros examina la producción rutinariamente para velar que se cumpla con las especificaciones. Si encuentran que las poleas no cumplen con las especificaciones establecidas, las máquinas que las producen son ajustadas. Ellos seleccionan una muestra de 100 poleas de un lote producido en la fábrica y encuentran con que el diámetro promedio es de 2.51 centímetros. a) Indica cuál es el problema que debe ser resuelto. b) En términos de este problema, indica explícitamente cuál es La población El parámetro El estimador La variable que se debe medir La muestra Material de Clases © German Pomachagua Perez 2-Abr-13 VARIABLES Variable Cualitativa Nominal Ordinal Cuantitativa Discreta Continua Es una característica de los elementos que se va investigar y que toma diferentes valores o categorías. Material de Clases © German Pomachagua Perez 2-Abr-13 Tipos de variables: Según su naturaleza Cualitativas o Categóricas Son aquellas características que se pueden clasificar, pero no medirse Nominales: Si sus valores no se pueden ordenar Sexo, Grupo Sanguíneo, Religión, Nacionalidad, Fumar (Sí/No) Ordinales: Si sus valores se pueden ordenar Calificaciones, Grado de satisfacción, Intensidad del dolor Cuantitativas o Numéricas Si sus valores son numéricos (tiene sentido hacer operaciones algebraicas con ellos) Discretas: Toma valores enteros y no puede tomar una fracción entre dos valores consecutivos Número de hijos, Número de cigarrillos, Numero de accidentes Continuas: Si entre dos valores, son posibles infinitos valores intermedios. Altura, Presión intraocular, talla, peso Material de Clases © German Pomachagua Perez 2-Abr-13 TIPOS DE VARIABLES: Según su relación Independiente (X): Causal o determinante de los cambios en la v. dependiente, es manipulada por el investigador. Dependiente (Y): Efecto como resultado de la manipulación de la v. independiente, llamada también como variable resultado. Interviniente: Puede mediar en la relación entre las variables independiente y dependiente Ejemplo 1: ¿Cuál es la incidencia del nivel de cariño que reciben los estudiantes de la ciudad de Lima en su rendimiento escolar? Material de Clases © German Pomachagua Perez 2-Abr-13 Relación Variable Independiente “X” Variable Dependiente “Y” Causa /Efecto Precio Demanda Antecedente/Consecuente Hábito de Fumar Cáncer Pulmonar Estímulo /Respuesta Programa Educativo Nivel de Aprendizaje Ejemplo2 Material de Clases © German Pomachagua Perez 2-Abr-13 Unidad de análisis / Variable Unidad de análisis Variable (Característica) - Persona - Familia - Empresa - Casa - Salario, cargo, ocupación, edad, sexo, estado civil. - Ingreso familiar, consumo familiar, número de hijos. - Consumo de energía, actividad económica, inversión anual, número de trabajadores, volumen de ventas. - Propia/Alquilada, área techada, número de habitaciones, número de moradores, material usado en su construcción. Material de Clases © German Pomachagua Perez 2-Abr-13 31 Niveles de medición de las variables NOMINAL Valores que se agrupan en categorías disjuntas y exhaustivas •Genero (sexo) •Color de pelo •Religión ORDINAL Hay un orden entre las categorías Clase social Preferencias Educación DE INTERVALO •Hay orden •Hay distancia •Hay un cero convencional •Temperatura •Coeficiente Intelectual DE RAZON •Hay orden •Hay distancia •Hay un cero natural •Edad •Producción •Ingresos Tipos Característica Ejemplos Material de Clases © German Pomachagua Perez 2-Abr-13 Material de Clases © German Pomachagua Perez 2-Abr-13 Material de Clases © German Pomachagua Perez 2-Abr-13 EJERCICIO Clasificar las siguientes variables Preferencias de cerveza. Velocidad en Km/h. El peso en Kg. Signo del zodiaco. Nivel educativo (primario secundario, superior). Años de estudios completados. Tipo de enseñanza (privada o pública). Número de empleados de una empresa. La temperatura de un enfermo en grados Celsius. La clase social (baja, media o alta). La presión de un neumático en Nw/cm2 Capacidad de un disco duro de un ordenador, en GB. Velocidad de transferencia de ficheros en una red, en bps. Resultado de un test que comprueba si un ordenador tiene virus o no. Tipos de impresoras. Velocidad de acceso a un disco duro, en milisegundos Material de Clases © German Pomachagua Perez 2-Abr-13 Clasificar cada una de las siguientes variables: a) Distancia diaria recorrida por cada estudiante para ir de su casa a la universidad. b) Tiempo que requiere un estudiante para responder a un examen. c) Llamadas que llegan a la central telefónica de la USB en un día. d) Preferencia por cierta marca de refresco. e) Sexo de las estudiantes que toman el curso de estadística en el semestre. f) Número de acciones vendidas en un día en la Bolsa de Valores. Material de Clases © German Pomachagua Perez 2-Abr-13 HOJA DE COMPROBACIÓN 1. L a estadística es una ciencia que sólo analiza datos 2. Los datos se organizan para mejorar su comprensión 3 El muestreo permite disponer de los datos en menor tiempo, reduciendo costos 4 .El parámetro representa a una población Material de Clases © German Pomachagua Perez 2-Abr-13 5. El muestreo permite disponer de los datos en menor tiempo, reduciendo costos. 6. El parámetro representa a una población 7. .Existen tanto estimadores como muestras se extraigan de una población Material de Clases © German Pomachagua Perez 2-Abr-13 9.Los estimadores se representan por letras griegas 10.En la estadística descriptiva, el análisis se limita a un conjunto de datos 11.Las técnicas que permiten estimar un parámetro a partir de datos muestrales se denomina Estadística Inferencial 12.El error del muestreo consiste en la equivocación cuando seleccionamos muestras 8.Diferentes muestras, extraídas de una misma población, ocasionan diferente Valores del estimador