TEMAS DE ESTADÍSTICA YPROBABILIDAD Estadistica cuantitativa y cualitativa Estadistica cuantitativa caracteres medibles, estadistica cualitativa propiedades no medibles. Individuo en estadistica, población y muestra. Ejemplos de estadistica cuantitativa y cualitativa. Estadística descriptiva Estadistica cuantitativa y cualitativa Cuantitativos Son aquellos que se pueden medir. Determinan variables estadísticas que pueden ser: Discretas Sólo pueden tomar un número finito de valores enteros, los valores posibles de estas variables son aislados. Ejemplos de variables estadísticas cuantitativas discretas • Número de hermanos: pueden ser 1, 2, 3 …, pero nunca podrá ser 3,45. Número de hijos • Número de empleados de una fábrica. • Número de goles marcados por un equipo de futbol en la liga. Continuas Pueden tomar cualquier valor real (infinitos) dentro de un intervalo. Ejemplos de variables estadísticas cuantitativas continuas • Velocidad de un vehículo: puede ser 20; 54,2; 100 ; … km/h • Temperaturas registradas en un observatorio cada hora. • Peso en kg de los recién nacidos en un día en España. Cualitativos No se pueden medir numéricamente. Ejemplos de variables estadísticas cualitativas • Color de los ojos. • Bondad de una persona. • Profesión de una persona. Determinan modalidades. frecuencias y gráficos Frecuencia absoluta y relativa . Las modalidades del carácter profesión pueden ser: arquitecto. médico. … etc. Tablas. albañil. 1. 0. 8. 6. 4. 5. 7. Ordenamos los datos contando los alumnos que han sacado un 0 han sido 2.Frecuencia absoluta y relativa de variables cuantitativas. histograma. 8. 2. b) Hacer un diagrama de barras de las frecuencias absolutas y dibujar el polígono de frecuencias. frecuencia acumulada. 7. diagrama de barras y de sectores. 8. 8. 1. . Ejercicios resueltos Variable cuantitativa discreta Las notas de un examen de matemáticas de 30 alumnos de una clase son las siguientes: 5. 0. 8. 7. 3. Construimos la tabla correspondiente: N: número total de datos N = 30. 5. 9. 8. a) Tabla para calcular la frecuencia relativa hi y la frecuencias acumuladas. 1. 7. a) Ordenar los datos y calcular las frecuencias absolutas de cada nota. 6. un 1 han sido 3 y así sucesivamente. 9. 9. 9. 8. 7. 9. xi: variable estadística. nota del examen. F 2 = f 1 + f2 => 2 + 3 = 5 F 3 = F 2 + f 3 => 5 + 1 = 6 hi: frecuencia relativa. fi: frecuencia absoluta. El sumatorio nos da los datos totales N = 30. Cociente f i / N Hi: frecuencia relativa acumulada ∑: sumatorio (suma de todos los datos de la columna correspondiente) . Para calcularla vamos sumando los valores de la frecuencia absoluta fi. número de veces que se repite una nota. Fi: frecuencia absoluta acumulada. b) Diagrama de barras de frecuencia absoluta y polígono de frecuencias Representar el diagrama de barras de frecuencia absoluta . Dibujar el polígono de frecuencias Variable cuantitativa continua Se ha controlado el peso de 50 recién nacidos. a) Tabla de frecuencias . obteniéndose los siguientes resultados: a) Formar la tabla de frecuencias. b) Representar gráficamente la distribución. La tabla de frecuencias se hace igual que en el ejemplo anterior b) Histograma. gráfica de la distribución . 23 tiene un peso comprendido entre 3 y 3.3) son muy pocos solo 6.Interpretación La mayoría de los niños. Ejemplo de un diagrama de sectores En un hipermercado se han producido las siguientes ventas en euros: juguetes 125. plantas 175. porcentajes y ángulo correspondiente. . a) Calcular las frecuencias.5 kg. b) Realizar un diagrama de sectores. Los niños con menor peso [2.5 . discos 250. alimentación 450. b) Diagrama de sectores Para realizar el diagrama de sectores necesitamos conocer el ángulo. Dibujamos los ángulos obtenidos en un círculo. . Las frecuencias relativas hi se obtienen dividiendo las frecuencias absolutas entre el total de euros 1000 €.a) Colocamos los datos en una tabla. Las frecuencias absolutas f i son las ventas en euros de cada producto. Las variable xi son los productos vendidos. Para hallar el ángulo multiplicamos la frecuencia relativa por 360 º que se corresponden con el total. Ver datos en la tabla. El porcentaje % se calcula multiplicando la frecuencia relativa por 100. unos a continuación de otros. Fórmulas de la media y desviación típica Media aritmética y desviación típica. Fórmulas para calcular la media aritmética, la moda y la desviación típica. Medidas de centralización: media, moda y mediana Medidas de dispersión: varianza, desviación típica y rango Problemas de desviación típica Problemas de desviación típica. Cálculo de la media aritmética y la desviación típica en variables continuas y variables discretas. Diagramas Variable discretas Se ha preguntado a 40 personas el número de personas que forman el hogar familiar obteniéndose los siguientes resultados: Número de personas en el hogar Frecuencia 2 3 4 567 4 11 11 6 6 2 a) Calcula la media, la mediana, la moda y la desviación típica. b) Haz el diagrama correspondiente. Media aritmética,mediana, moda y desviación típica Para resolver esto construimos una tabla, debemos fijarnos en las columnas que necesitamos para calcular lo que nos piden. Fi La frecuencia absoluta acumulada la necesitamos para calcular la mediana. xi·fi Necesitamos el sumatorio de esta columna para la fórmula de la media aritmética. Los valores se hallan multiplicando xi·fi de cada fila. xi2·fi Necesitamos este sumatorio para hallar la desviación típica. Para conseguir los valores se multiplica en cada fila el valor de xi por xi·fi. Tabla para calcular la media y desviación típica personas xi frecuencia fi Fi xi · f i xi 2 · f i 2 4 4 8 16 3 11 15 33 99 4 11 26 44 176 5 6 32 30 150 6 6 38 36 216 7 2 40 14 98 ∑ 40 165 755 se han obtenido los resultados siguientes: Puntuación Número de personas 30 .50 50 . 76 70 22 8 .70 70 .90 6 18 a) Calcula la media.80 80 .60 60 . y la desviación típica.40 40 .Diagrama de barras por ser variables discretas Variables continuas En un test de inteligencia realizado a una muestra de 200 personas. .40 35 6 210 7350 40 .60 55 76 4180 229900 60 .90 85 8 680 57800 ∑ 200 12080 751000 Histograma y polígono de frecuencias Para construir el polígono de frecuencias se unen las marcas de clase de cada intervalo.70 65 70 4550 295750 70 . Intervalos Marca de clase xi Frecuencia fi xi · f i xi 2 · f i 30 .80 75 22 1650 123750 80 . Esta marca de clase la trataremos como xi.50 45 18 810 36450 50 .b) Dibuja un histograma para representar gráficamente los datos . debemos hallar la marca de clase para cada intervalo sumando los valores extremos y dividiendo entre dos. El resto de los sumatorios que necesitamos se hallan como en el ejemplo anterior. haz también el polígono de frecuencias. Media aritmética y desviación típica Es una variable continua. a) Calcula el coeficiente de variación de cada una de ellas.106. b) ¿Cuál de las dos ha sido más regular? .Cálculo del coeficiente de variación La media y la desviación típica de los puntos conseguidos por Ana y Rosa en una semana de entrenamiento jugando al baloncesto han sido las siguientes: media de Ana 22 puntos y desviación típica 4. Media de Rosa 22 puntos y desviación típica 2. moda. mediana y desviación típìca de variables discretas y continuas. Parámetros estadísticos. fórmulas Medidas de centralización . fórmulas Parámetros estadísticos: calcular la media.Parámetros estadísticos. . Parámetros de localización o posición: cuantiles Medidas de dispersión . moda y mediana Ejercicios estadística. Ejercicios estadística Ejemplo de una variable discreta Las calificaciones de historia del arte de los 40 alumnos de una clase viene dada por la tabla adjunta: xi 1 2 3 4 5 6 7 8 9 . media.Ejercicios estadística. moda y mediana estadística. Ejercicios resueltos de variables continuas y discretas. media estadística. mediana y desviación típica. con las columnas necesarias para calcular la media estadística. c) Halla la desviación típica. b) El cuartil Q1 y el percentil P70. Construimos una tabla. moda. . la moda y la mediana.fi 2 2 4 5 8 9 3 4 3 a) Halla la media aritmética. con las columnas necesarias para calcular la media estadística. Construimos una tabla. a) Halla la media aritmética. . b) Halla el rango y la desviación típica. mediana y el cuartil Q1.Ejemplo de una variable continua Se ha aplicado un test de satisfacción en el trabajo a 88 empleados de una fábrica obteniéndose la tabla de datos adjunta. mediana y desviación típica. moda. moda. . . Distribuciones bidimensionales Covarianza y coeficiente de correlación . estudio de dos variables. Covarianza. Covarianza y correlación Distribuciones bidimensionales.Distribuciones bidimensionales. coeficiente de correlación entre las variables y ecuaciones de las rectas de regresión. . Rectas de regresión Ejercicios de estadística, covarianza, correlación y recta de regresión Ejercicios de estadística, problemas de distribuciones bidimensionales. Covarianza, coeficiente de correlación entre las variables y ecuación de las recta de regresión. Ejercicios resueltos 1. Una compañía de seguros considera que el número de vehículos (y) que circulan por una determinada autopista a más de 120 km/h , puede ponerse en función del número de accidentes (x) que ocurren en ella. Durante 5 días obtuvo los siguientes resultados: Ejercicios estadística Accidentes xi 5 7 2 1 9 Vehículos yi 15 18 10 8 20 a) Calcula el coeficiente de correlación lineal. b) Si ayer se produjeron 6 accidentes, ¿cuántos vehículos podemos suponer que circulaban por la autopista a más de 120 km / h? c) ¿Es buena la predicción? Construimos una tabla con las columnas necesarias Vemos las fórmulas que tenemos que aplicar para saber las columnas que necesitamos, a continuación se explica la forma de hacer esto. . 2. Las calificaciones de 40 alumnos en psicología evolutiva y en estadística han sido las de la tabla adjunta. Psicología xi 3 4 5 6 6 7 7 8 10 Estadística yi 2 5 5 6 7 6 7 9 10 Nº de alumnos fi 4 6 12 4 5 4 2 1 2 . a) Obtener la ecuación de la recta de regresión de calificaciones de estadística respecto de las calificaciones de psicología. b) ¿Cuál será la nota esperada en estadística para un alumno que obtuvo un 4.5 en psicología? Construimos una tabla con las columnas necesarias . 5 4.5 7 5 10 5 4 Música yi 6. Las notas obtenidas por 10 alumnos en Matemáticas y en Música son: Matemáticas xi 6 4 8 5 3. • ¿Existe correlación entre las dos variables? .3.5 7 5 4 8 7 10 6 5 • Calcula la covarianza y el coeficiente de correlación. Ejemplos de variable aleatoria . variable aleatoria. Distribución aleatoria Una variable aleatoria es discreta cuando sólo puede tomar unos ciertos valores enteros.• ¿Cuál será la nota esperada en Música para un alumno que hubiese obtenido un 8. comparar una distribución de frecuencias con una de probabilidad.3 en Matemáticas? Distribución de una variable aleatoria discreta Distribución aleatoria discreta. 2. 10. 9. anotamos el resultado obtenido en la cara superior obteniendo los siguientes resultados: Distribución aleatoria discreta Cara superior Número de veces 1 2 3 4 5 6 40 39 42 38 42 39 . 3. • Suma de las caras superiores obtenidas al lanzar dos dados: 2. 11. Distribución de probabilidad Ejemplo de variable aleatoria Lanzamos un dado perfecto 240 veces. 12. 1. 7. 6. 3. 8. 5.• Número de caras obtenidas al lanzar tres monedas: 0. 4. Tabla de distribución de frecuencias La tabla de distribución de frecuencias muestra los resultados obtenidos 2. Tabla de distribución de probabilidad La tabla de distribución de probabilidad muestra los resultados esperados .1. Gráfica de las distribuciones En la gráfica de los valores esperados. observamos que a cada valor de la variables aleatoria xi "cara del dado" le hacemos corresponder su probabilidad teórica. A esta ley se le llama distribución de probabilidad. Parámetros de una distribución discreta .3. CXC. los casos posibles son 23 = 8 E = { CCC. 1. el número de caras que podemos obtener será: 0. CCX. represéntala gráficamente y calcula la media y la desviación típica. teniendo en cuenta los valores que puede tomar la variable xi obtener cara. XXX } . Tenemos tres monedas. XCX. Escribimos el espacio muestral para facilitar el recuento. XCC. 2 y 3. varianza y desviación típica Ejemplo Se lanzan tres monedas y se cuenta el número de caras obtenidas. La media es el valor esperado también se llama esperanza matemática Esperanza matemática o media . Haz una tabla con las probabilidades. XXC. CXX. Construimos la tabla.Media y desviación típica de una variable aleatoria discreta. La probabilidad de obtener tres caras será {CCC} = 1 / 8 Calcular media y desviación típica sacar cara xi probabilidad pi xi · p i p i · x i2 0 1/8 0 0 1 3/8 3/8 3/8 2 3/8 6/8 12/8 3 1/8 3/8 9/8 1 1. XCC } = 3 / 8 . CXC.5 3 ∑ Distribución binomial Fórmula y características de la distribución binomial .La probabilidad de obtener una cara será {XCX.La probabilidad de obtener dos caras será {CCX.La probabilidad de no obtener ninguna cara será obtener tres cruces {XXX} = 1 / 8 . XXC. CXX } = 3 / 8 .. Características Fórmula distribución binomial . varianza y desviación típica de una distribución binomial .Media. Ejercicios y problemas resueltos de distribución binomial Ejercicios y problemas resueltos de distribución binomial Ejercicio 1 . . Ejercicio 2 . . Ejercicio 3 Ejercicio 4 . distribución normal Características de una variable aleatoria continua.Variable aleatoria continua.curva normal o campana de Gauss. . definición y características Es aquella que puede tomar infinitos valores dentro de un intervalo de la recta real. Distribución normal. Variable aleatoria continua. Distribución normal.En el caso de una variable aleatoria continua no tiene sentido plantearse probabilidades de resultados aislados. basta calcular el área correspondiente para conocer la probabilidad de un intervalo cualquiera. La probabilidad de valores puntuales es cero. Conociendo esta curva. El interés de estas probabilidades está en conocer la probabilidad correspondiente a un intervalo. curva normal o campana de Gauss . Dicha probabilidad se conoce mediante una curva llamada función de densidad y suponiendo que bajo dicha curva hay un área de una unidad. .1) Los valores de la tabla normal representan el área bajo la curva normal hasta un valor positivo de z.Tabla de distribución normal tipificada N(0. . 6736 . Basta buscar 0. menor o igual que un número negativo. La probabilidad p ( z ≤ 0.45 ) En la 1ª columna buscamos el valor de las unidades y las décimas. Su intersección nos da la probabilidad. 1 Cuando la probabilidad pedida se encuentra directamente en las tablas Hallar la probabilidad p ( z ≤ 0. Casos frecuentes Ejemplos de uso de la tabla normal. Leemos y nos da 0.05 en la fila. entre dos valores positivos. cálculo de la probabilidad en cada caso.Manejo de la tabla normal.6736. En la 1ª fila el valor de las centésimas.4 en la columna y 0. Cuando la variable z es mayor o igual que un número positivo.45 ) = 0. Estudio de los casos más frecuentes. 8925 = 0.24) = 1 – p (z ≤ 1.72 ) .0.1075 3 Probabilidad de un valor negativo p ( z ≤ . deducimos de la figura que: p (z > 1. Sin embargo.2 Probabilidad de un valor positivo p ( z > 1.24) = 1 – 0.24) En este caso la probabilidad pedida no está en las tablas. si tenemos en cuenta que el área total bajo la gráfica ha de ser 1. p ( z < + 0.5 ≤ z ≤ 1.2358 p ( z ≤ . p ( z ≤ .76 ) Leemos directamente en la tabla la p ( z ≤ 1.2358 4 Probabilidad entre dos valores positivos p ( 0.72 ) = 1 .5 ).7642 = 0.72 ) igual que en el caso 2.0.0. p ( z ≥ + 0. La diferencia entre ellas es la probabilidad que nos piden.Como la gráfica es simétrica respecto al eje de ordenadas.72 ) = 1 .72 )= 1 .72 ) = 1 .72 ) Calculamos p ( z ≥ + 0.p ( z < + 0.76 ) y la p ( z ≤ 0.72 ) = p ( z ≥ + 0.7642 = 0. .0.72 ) = p ( z ≥ + 0.0. 1.1.2693 Observa que el área sombreada es la misma que en el caso 4.76 ) = p ( z ≤ 1.5 ≤ z ≤ 1.76 ) = 0.2693 5 Probabilidad entre dos valores negativos p ( .5 ≤ z ≤ 1.p ( z ≤ 0. .76 ) .76 ≤ z ≤ .0. p ( .5 ) Por simetría cambiamos los dos valores negativos a positivos y calculamos sus probabilidades.0.6915 = 0.0.0.9608 .76 ≤ z ≤ .9608 .5 ) = p ( 0.6915 = 0.5 ) = 0.p ( 0. p ( z ≤ .53 ≤ z ≤ 2.p ( z < 0.2981 = 0.46) .7019 = 0.46) = p ( z ≤ 2.53 ) p ( z ≤ .0.0.46) = p ( z ≤ 2.9931 .0.46) .p ( z ≤ .53 ≤ z ≤ 2.6 Probabilidad entre un valor positivo y uno negativo p(.0.53 ≤ z ≤ 2.53 ) = 1 .0.2981 p(.0.46) p(.0.53 ) = 0.53 ) = p ( z ≥ 0.0.695 . 53)= 1 . Manejo de la tabla de forma inversa Ejercicios . Una distribución normal que no tiene de media 0 y desviación típica 1 debemos tipificar la variable x para poder leer en la tabla normal N(0.Ejercicios resueltos distribución normal Ejercicios resueltos distribución normal.0) . Tipificación de la variable x Ejercicios resueltos tipificar la variable x Pasar una variable x N (8. 3) a una variable tipificada z N(1.1). Porcentaje de población en los diferentes intervalos simétricos . Ver ejercicio 1 .Para hallar el porcentaje %. hallamos la probabilidad y multiplicamos por 100. . variable continua cuando n es grande.Aproximación de la distribución binomial a la normal Una distribución binomial variable discreta la podemos aproximar a una normal. Distribución binomial . . Problemas aproximar distribución binomial a normal . se sabe que las puntuaciones siguen una distribución normal de media 80 y desviación típica 25. aproximación de la binomial a la normal.Problemas de la distribución normal Problemas de la distribución normal. Solución: 36. 1. Un profesor de matemáticas ha observado que las notas obtenidas por sus alumnos en los exámenes de Estadística siguen una distribución N (6.5). Una empresa lleva a cabo una prueba para seleccionar nuevos empleados. ¿cuántos sacaron al menos un 7? Solución: 11 alumnos sacaron al menos un 7 2. ¿Qué porcentaje de candidatos obtendrá entre 75 y 100 puntos?. El peso de los toros de una determinada ganadería se distribuye normalmente con una media de 500 kg y 45 kg de desviación típica. Por la experiencia de pruebas anteriores.74 % 3. 2. Se han presentado al último examen 32 alumnos. calcular: . Si la ganadería tiene 2000 toros. tipificación de la variable. Soluciones: a) 373 kg b) 660 kg c) 348 kg 4.1492 Soluciones: a) 0. Una de las pruebas de acceso a la Universidad para mayores de 25 años consiste en un test con 100 preguntas. 30 respuestas correctas. cada una de las cuales tiene 4 posibles respuestas y sólo una correcta.a) Cuántos pesarán más de 540 kg.3446 .7852 b) 0. Para superar esta prueba deben obtenerse. ¿cuál es el número esperado de respuestas correctas? ¿Qué probabilidad tendrá de superar la prueba?. Si una persona contesta al azar. p = 0. c) Cuántos pesarán entre 490 y 510 kg. Ayuda: utiliza la aproximación de la binomial a través de la normal para la segunda pregunta. Soluciones: 25 respuestas correctas. b) Cuántos pesarán menos de 480 kg. al menos. El número de individuos de la muestra se llama tamaño de la muestra. Tipos de muestreo . así como de la toma de decisiones. No se refiere exclusivamente a personas. Muestra Es la parte de la población en la que se miden las características estudiadas. Encuesta Es el proceso de obtener la información buscada entre los elementos de la muestra. informaciones obtenidas de una muestra.Tipos de muestreo Conceptos generales Estadística inferencial La estadística inferencial se ocupa de extender o extrapolar a toda una población. Muestreo Es el proceso seguido para la extracción de una muestra. la población puede estar formada por todos los árboles de un bosque. Población Es el conjunto total de individuos susceptibles de poseer la información buscada. a intervalos constantes. en función de que sean representativos. por sexo. de forma que cada miembro de la población tuvo igual oportunidad de salir en la muestra. Simple Elegido el tamaño de la muestra. los elementos que la compongan se han de elegir aleatoriamente entre los N de la población. Estratificado Se divide la población total en clases homogéneas. después se elige uno de ellos al azar. llamadas estratos. según la opinión del investigador. por ejemplo.No aleatorios Se eligen los elementos. . se eligen todos los demás hasta completar la muestra. Con calculadora: se utilizan los números aleatorios Sistemático Se ordenan previamente los individuos de la población. Aleatorios Todos los miembros de la muestra han sido elegidos al azar. a continuación. por grupos de edades. Hecho esto la muestra se escoge aleatoriamente en número proporcional al de los componentes de cada clase o estrato. . . Distribución de medias muestrales Fórmulas población y muestra . . Intervalo de probabilidad de medias muestrales Niveles de confianza y probabilidad en porcentaje . Intervalo de probabilidad para la media muestral . Ejemplos . . . Intervalo de probabilidad para proporciones Distribución para proporciones . Intervalo de probabilidad para la proporción muestral . . Estimación de la población desde una muestra Estimación Lo habitual es que se desconozca la media y la desviación típica de la población. error y tamaño de la muestra . Intervalo de confianza. vamos a estimar estos parámetros en función de una muestra . utilizamos la desviación típica de la muestra. Si desconocemos la desviación típica de la población. Vamos a calcular el intervalo de confianza para la media poblacional. error máximo admitido y tamaño de la muestra. . . Contraste de hipótesis . Contraste de hipótesis bilaterales . ver si la media poblacional pertenece al intervalo de la media muestral o no.Contraste de hipótesis sobre la media poblacional. Pueden ser unilaterales y bilaterales. . . Contraste de hipótesis unilaterales . . Proporciones: estimación y contraste de hipótesis Estimación para proporciones: intervalo de confianza Ejemplos de intervalo de confianza para proporciones . . Pueden ser unilaterales y bilaterales.Contraste de hipótesis El contraste de hipótesis para proporciones consiste en ver si la proporción muestral pertenece a la zona de aceptación o no. . . . . . Problemas resueltos de muestreo y estimación .