Datos PerdidosSon aquellos que no constan debido a cualquier acontecimiento, como por ejemplo errores en la transcripción de los datos o la ausencia de disposición a responder a ciertas cuestiones de una encuesta. Los datos pueden faltar de manera aleatoria o no aleatoria. (UNIVERSIDAD DE VALENCIA, s.f.) Datos Atípicos Un dato atípico (outlier) es un registro mayor o menor de lo esperado que se detecta por tener un residuo que es un valor “inusual”, muy grande o muy pequeño en relación con la distribución asociada a los residuos. (atípicos., s.f.) EJERCICIO APLICADO AL TURISMO El gerente en ventas de una compañía turística afirma que todos sus vendedores realizan el mismo numero de visitas durante el mismo periodo de tiempo. Una muestra aleatoria de 5 registros de los vendedores en una semana dada revelo el siguiente numero de visitas. Vendedor A B C D E Número de 23 29 25 23 30 visitas Con el nivel de significa de 0.05, ¿es razonable aceptar la afirmación del gerente? 1) 𝐻𝑜 = Hacen el mismo numero de visitas 𝐻𝑖 = Hacen menor numero de visitas 2) Nivel de Significancia: 0.05 95% 3) Chi- cuadrado 4) Toma de decisión se acepta la hipótesis nula por que realizan el mismo numero de visitas. DESARROLLO RESUMEN DE PROCESAMIENTO DE CASOS Tabla 1.1 Tabla 1.2 CONCEPTOS X2 Bondad de Ajuste: Estudia las pruebas de las estadística cuya distribución no se ajusta a los criterios paramétricos. De los cuales algunos experimentos producen respuestas que no son cuantificables, o en otras palabras mediciones que no pueden ordenarse. (Carlos, s.f.) X2 Bondad de Ajuste Binomial: Consiste en una secuencia de ensayos independientes en los que cada ensayo produce uno de dos resultaos posibles éxito o fracaso. (Carlos, s.f.) Ejemplo: Cuando mayor sea el valor de X2, la Ho se encuentra mas alejada del valor correcto. Cuando el chi-cuadrado se acerca a cero la distribución se encuentra más ajustada, es decir, su resultado es correcto. Comparar el valor calculado con el observado para determinar si la distribución es aleatoria. 𝑿𝟐Bondad de Ajuste Corrección de Yates Test exacto de Fisher Es una técnica extremadamente satisfactoria para analizar datos discretos cuando dos muestras independientes son pequeñas. (parametrica, s.f.) Mc Nemar Es aplicable a los diseños “antes- después”, en los cuales cada sujeto se utiliza como su propio control en los que las mediciones se realizan ya sea en escala nominal u ordinal. (parametrica, s.f.) Wilcoxon Se utiliza información solo en términos de la dirección de las diferencias en cada uno de los pares analizados. Si se considera tanto la magnitud relativa como la dirección de las diferencias, se puede utilizar una prueba mas poderosa. El rasgo asignado de Wilcoxon adjudica mayor peso a los pares que se muestran mayores diferencias entre las dos condiciones, mas que en los pares cuya diferencia es pequeñas. (parametrica, s.f.) U Mann-Withney Se utiliza para evaluar si dos grupos independientes fueron extraidos de la misma población, si de las varibles en estudios se han obtenido datos en, al menos, escala ordinal. (parametrica, s.f.) H Kuskal-Wallis Es una prueba extremadamente útil para decidir si K muestras indepenientes provienen de diferentes poblaciones. (Carlos, s.f.) Q de Cochran Es una medida del grado de asociación o relación entre dos series de atributos o variables. Se una únicamente cuando tenemos solo información categórica acerca de uno o de ambos conjuntos de atributos o variables. (Carlos, s.f.) T de Student (una muestra) Permite comprobar si es posible aceptar que la media de la población es un valor determinado. Se toma una muestra y el Test permite evaluar si es razonable mantener la Hipótesis nula de que la media es tal valor. (Pérez., s.f.) T de Student (muestras independientes) Evaluar la diferencia significativa entre las medias de dos grupos o dos categorías dentro de una misma variable dependiente. La comparación de las 2 medias se da solo si las dos muestras se han sacado de manera independiente entre sí. (independientes, s.f.) ANOVA con un factor INTERsujetos Sirve para comprar varios grupos en una variable cuantitativa. Se trata de una generalización de la prueba T para dos muestras independientes al caso de diseños con más de dos muestras. (VARIANZA, s.f.) T de Student (muestras relacionadas) El procedimiento Prueba T para muestras relacionadas compara las medias de dos variables de un solo grupo. El procedimiento calcula las diferencias entre los valores de las dos variables de cada caso y contrasta si la media difiere de 0. (IBM, s.f.) Ejemplo. En un estudio sobre la hipertensión sanguínea, se toma la tensión a todos los pacientes al comienzo del estudio, se les aplica un tratamiento y se les toma la tensión otra vez. De esta manera, a cada sujeto le corresponden dos medidas, normalmente denominadas medidas pre y post. Un diseño alternativo para el que se utiliza esta prueba consiste en un estudio de pares relacionados o un estudio de control de casos en el que cada registro en el archivo de datos contiene la respuesta del paciente y de su sujeto de control correspondiente. En un estudio sobre la tensión sanguínea, pueden emparejarse pacientes y controles por edad (un paciente de 75 años con un miembro del grupo de control de 75 años). ANOVA para medidas repetidas (INTRAsujetos) Los modelos de análisis de varianza (ANOVA) con medida repetidas sirven para estudiar el efecto de uno o más factores cuando al menos uno de ellos es un factor intra-sujetos. (REPETIDAS, s.f.) EJERCICIOS T-student (una muestra) Una investigadora cree que, en años recientes, las mujeres han aumentado su estatura. Ella sabe qué hace 10 años el promedio de estatura de una mujer adulta joven, en la ciudad donde habita ésta investigadora, fue de 63 pulgadas. No se conoce la desviación estándar. Ella toma una muestra aleatoria de ocho mujeres jóvenes adultas que residen en dicha ciudad y mide sus estaturas. Se obtienen los datos siguientes: a) ¿Cuál es la hipótesis nula? b) ¿Cuál es la hipótesis alterna? c) Si utilizamos =0,01 2cola ¿Qué se puede concluir? a) no existe un aumento de estatura en las mujeres jóvenes adultas que habitan en la ciudad. b) existe un aumento de estatura en las mujeres jóvenes adultas que habitan en la ciudad. Se concluye que se rechaza la hipótesis nula y se acepta la hipótesis de investigación, T-student (muestras independientes) Se desea determinar si los promedios de puntos de calificación (PPC) son diferentes para niños y niñas. Se considera que el PPC se distribuye normalmente con varianza idéntica para ambos sexos. Dos muestras independientes de 5 estudiantes cada una proporcionan lo siguiente: PPC para niños: 2.9 3.1 2.7 3.3 3.0 PPC para niñas: 3.6 2.8 3.6 3.2 2.8 a) Utilizando α = 0.05, pruébese la hipótesis de que el PPC medio para niños es el mismo que el PPC medio para niñas, contra la hipótesis alternativa de que las dos medias son diferentes. b) Obténganse los límites de confianza del 95% para la verdadera diferencia entre las dos medias poblacionales. T de Student (muestras relacionadas) Se desea determinar si una clase de 16 estudiantes pueden desempeñarse igualmente bien en español que en matemáticas. Las calificaciones de prueba listadas a continuación no son independientes: Estudiante Español Matemáticas _________________________________________ A 84 84 B 55 57 C 85 90 D 98 97 E 80 74 F 55 53 G 80 75 H 64 63 I 91 90 J 85 82 K 90 88 L 94 98 M 75 77 N 86 90 O 91 85 P 92 86 a) Considerando que las calificaciones de prueba se distribuyen normalmente, pruébese la hipótesis de que la puntuación media de la población en español es la misma que en matemáticas contra la hipótesis alternativa de que son diferentes para α = 0.05. b) Establézcase el intervalo de confianza del 95 % para la verdadera diferencia. Ho= no existe la puntuación media de la población en español es la misma que en matemáticas. Hi= si existe una diferencia en la puntación media de la población en español es la misma que en matemáticas. Nivel de confianza = 0.05 Se rechaza la hipótesis de investigación y se acepta la hipótesis nula. Bibliografía atípicos., H. d. (s.f.). Obtenido de http://dm.udc.es/asignaturas/estadistica2/sec4_6.html Carlos, U. S. (s.f.). Obtenido de file:///C:/Users/VANE/Downloads/79177879-Bondad- de-Ajuste-a-traves-de-distribucion-Binomial-1.pdf IBM. (s.f.). Obtenido de https://www.ibm.com/support/knowledgecenter/es/SSLVMB_24.0.0/spss/base/i dh_ttpr.html independientes, T. d. (s.f.). SlideShare. Obtenido de https://es.slideshare.net/jab2801/t- de-student-para-dos-muestras-independientes-9249928 parametrica, E. n. (s.f.). Obtenido de http://tesis.uson.mx/digital/tesis/docs/10048/Capitulo4.pdf Pérez., C. d. (s.f.). LA ESTADÍSTICA: UNA ORQUESTA HECHA INSTRUMENTO. Obtenido de https://estadisticaorquestainstrumento.wordpress.com/2012/12/16/test-de-la-t- de-student-para-una-muestra/ REPETIDAS, A. D. (s.f.). Obtenido de http://halweb.uc3m.es/esp/Personal/personas/jmmarin/esp/GuiaSPSS/16anovar.p df UNIVERSIDAD DE VALENCIA. (s.f.). Obtenido de https://www.uv.es/webgid/Descriptiva/23_valores_faltantes.html VARIANZA, A. D. (s.f.). Obtenido de http://stel.ub.edu/sites/default/files/agenda/documents/14anova1_spss.pdf