Notas Módulo NoParamétrica

Estadística No Paramétrica. Introducción ____________________________________________ INTRODUCCION Tradicionalmente se suele clasificar a la Estadística en descriptiva e inferencial. La primera se asocia a la recolección de datos, resumen, presentación de tablas gráficas y mediciones que describen en forma general el comportamiento de una muestra o una población. La inferencia estadística por otra parte se vincula con la labor de investigación científica en la búsqueda de relaciones causales y asociaciones entre fenómenos y variables diversos. Se ocupa del ajuste de modelos que permiten generalizar y pronosticar comportamientos ante cambios en las variables independientes. En sus inicios, la investigación y desarrollo en torno a la estadística inferencial se orientaron a los métodos llamados “paramétricos”, tales métodos de estimación y procedimientos de pruebas de hipótesis se apoyan a una serie de supuestos para su aplicación y correctas conclusiones. Los científicos especialistas en ciencias que requieren del uso de inferencia estadística, pero cuyas observaciones no siempre cumplen con los supuestos necesarios para la aplicación de las pruebas clásicas, tales como la normalidad la homogeneidad de varianzas y la precisión de las mediciones. Estas restricciones motivaron la investigación en el terreno de procedimientos inferenciales que no se apoyaran en esos supuestos y que sin embargo, coadyuvarán a conclusiones científicamente válidas. La estadística no paramétrica se desarrolló rápidamente debido a que sus procedimientos cumplen en general con las siguientes ventajas: Los métodos no paramétricos hacen pocos supuestos acerca de las poblaciones a partir de las cuales se obtienen las observaciones. • Soportan escalas y unidades de medida más laxas que los métodos paramétricos. En general, son fáciles de aplicar y los paquetes de software para análisis estadístico más populares incluyen múltiples opciones no paramétricas en sus menús. Se pueden aplicar en situaciones donde los métodos tradicionales no son factibles de aplicación, tales como aquellas en las que las observaciones no son mediciones en el sentido preciso de la palabra, sino solamente rangos. Notas Históricas. El desarrollo de la inferencia estadística no paramétrica, cuyo nombre más adecuado sería inferencia estadística de distribución libre, se inició vigorosamente por la tercera década del siglo pasada. .R. Savage señala el año de 1936 como el punto de arranque debido a la publicación de un artículo sobre correlación por 1 Estadística No Paramétrica. Introducción ____________________________________________ rangos debido a Hotelling y Pabst. Otros autores como Scheffé identifican sus antecedentes en fechas anteriores. En el período de 1900 a 1911 se publican algunos artículos debidos a Karl Pearson y años después se presenta la prueba de los signos en la primera edición de Statistical Merhods for Research Workers (1925) escrita por Ronald A. Fisher. Por el año de 1943 Scheffé escribía: “Solamente una pequeña fracción de la extensa literatura dedicada a la estadística matemática está orientada al caso no paramétrico y la mayor parte ha sido escrita en esta década. Esperamos, sin embargo, un rápido crecimiento para esta rama. Las perspectivas de una teoría libre de supuestos específicos acerca de la forma de las distribuciones de las poblaciones debe excitar la mente tanto de teóricos como prácticos, ya que tal teoría combina la elegancia estructural con amplias posibilidades de aplicación.” En 1947 F. Wilcoxon promueve los métodos estadísticos no paramétricos con la publicación de un libro titulado Some Rapid Aproxímate Statistical Procedures,. Para el año siguiente M.G. Kendall publica el primer libro orientado a métodos apoyados en rangos: Rank Correlation Methods. Kendall cita las posibilidades de aplicación de tales métodos en campo tan diversos como psicología, educacuón, economía y experimentación industrial. Por 1956 Sidney Siegel publica el que posiblemente sea el texto más popular de métodos estadísticos no paramétricos de la actualidad: Nonparametric Statistical for the Behavioral Sciences. Para 1962 el impulso de la estadística no paramétrica es tal que Savage publica sus Bibliography of Nonparametric Statistical con referencia a más de 3000 artículos relacionadas con el tema. J. Hájek uno de los más notables investigadores de esta rama de la estadística escribe en 1969 “Los métodos no paramétricos constituyen una de las ramas más exitosas de la estadística moderna. Ellos son ampliamente aplicables, de rápida ejecución y fáciles de entender. La teoría no paramétrica es elegante y dos décadas de vigoroso desarrollo no han agotado sus posibilidades de estimular a los investigares”. En 2010 esta afirmación tiene plena validez Concepto de Medición Se le atribuyen al científico escocés del siglo XIX, Lord Kelvin las siguientes palabras: “Cuando uno puede medir aquello de lo que está hablando y expresarlo en números, sabe algo acerca de ello; pero cuando no puede medirlo, cuando no puede expresarlo en números sus conocimientos es escaso e insatisfactorio; podrá ser un principio de conocimiento a la etapa de una ciencia”. Esta puede ser una afirmación exagerada, pero ilustra claramente la importancia que la medición ha tenido para los científicos. En términos muy simplistas decimos que medimos cuando somos capaces de asociar números a objetos y eventos de acuerdo a ciertas reglas. El problema reside entonces en determinar claramente las reglas de asignación de números a los objetos y fenómenos, las propiedades matemáticas de los grupos a estructuras 2 el valor del número no refleja magnitud de la característica. La única operación válida con esos números es el conteo de las frecuencias absolutas y posteriormente la obtención de frecuencias relativas. la posterior identificación de las personas de acuerdo al lugar de nacimiento por algún número del 1 al 32 no tiene una intención cuantitativa. como por ejemplo. 3 . Los números asignados a los objetos y fenómenos solamente representa etiquetas y cualquier otro tipo de símbolo podría servir para el mismo fin. S.3 no significa que en promedio la gente nació cerca de Michoacán. La relación de equivalencia es reflexiva. hacerlo y obtener un valor como 16. Multinominal o Ji cuadrada. Si en la clasificación de un grupo de empleados por el turno en que trabajan. sino tan solo un medio de diferenciación.Estadística No Paramétrica. En la escala nominal la operación de escalamiento consiste en una clase dada y la formación de un conjunto de subclases exhaustivas y que se excluyen mutuamente. Stevens publicó en 1946 en la revista Science un artículo titulado On the theory of scales of measurement en donde propone una clasificación que contempla cuatro tipo s básicos de mediciones: • • • • Nominal Ordinal Intervalar Razón Escala Nominal Representa la menos restringida asignación de números. simétrica y transitiva. Los miembros de cualquier subclase deben ser equivalentes en la propiedad medida. Introducción ____________________________________________ de las escalas resultantes y el tipo de operaciones estadística aplicables a las mediciones efectuadas con cada tipo de escala. Niveles de Medición. La identificación de las entidades federativas de México mediante los números 1 al 32 ilustran la aplicación de una escala de este tipo. las letras. se designa a los pertenecientes al turno matutino con 1 al turno vespertino con 2.S. Las escalas son posibles en la medida en que guardan un isomorfismo entre lo que podemos hacer con las características de los objetos y las propiedades de los números. Es claro que no tendría sentido obtener el promedio de los números que identifican a un grupo de personas de acuerdo al lugar de nacimiento. Con la disposición de frecuencias es válida la identificación del valor que aparece con mayor frecuencia y la realización de pruebas cuyos datos de ingreso son frecuencias como aquellas basadas en la Binomial. La única relación válida es la equivalencia. Estadística No Paramétrica. y C. B. No es estrictamente válido el cálculo de las medias y desviación estándares. El cero es una escala intervalar es motivo de una convención arbitraria. dados tres elementos que ocupan puntos consecutivos de la escala A>B>C no necesariamente presentan proporcionalidad en las magnitudes de la característica.Mann y Whitney. pues estas estadística suponen el conocimiento de algo más que el orden relativo de los datos. pero no a la ausencia total de calor en el concepto físico del término. como en el caso de la medición de la temperatura en grados centígrados. Las estadísticas válidas en el nivel ordinal son las cuantiles (cuartiles. La 4 . Casi todas las estadísticas son aplicables en este caso. La diferencia entre las escala ordinal y la escala intervalar es que en la primera. percentiles) y la medida de tendencia central que la caracteriza es la mediana. Escala Intervalar Corresponde a la cuantificación en el sentido común de la palabra. como el de Spearman y el de Kendall. en la escala intervalar esta proporcionalidad si se preserva. sin embargo. La diferencia entre la escala nominal y la ordinal. La diferencia entre A y B no necesariamente es la misma que entre B y C. la cual solamente descubre en forma gruesa los efectos percibidos por la gente. donde el cero se asocia al punto de fusión del hielo en condiciones normales. las escalas de preferencia de productos que utilizan los investigadores de mercados en el público. deciles. la escala de medición de la magnitud de temblores de tierra propuesta por Mercalli. es que ésta incorpora además de una relación de equivalencia un a relación de orden. La escala ordinal tiene una estructura llamada isotónica porque preserva el orden de un grupo. Introducción ____________________________________________ Escala Ordinal Está asociada a la operación de ordenamiento por rango. Entre tres elementos arbitrarios A. Entre los ejemplos clásicos de este tipo se pueden referir: la escala de dureza de los minerales. es posible decir A>B y a su vez B>C. a menos que se requiera el conocimiento de un pinto cero verdadero. pruebas como la de la Mediana y la U de .. Entre las pruebas estadísticas que se basan en este tipo de escala se pueden mencionar las asociadas a coeficientes de correlación por rangos. lo mismo que entre 5 y 6 grados centígrados. Para convertir yardas a metros multiplicamos por la constante aproximada 0. etc. Todas las operaciones aritméticas tienen cabida en la escala de razón y en consecuencia se calculan medias. coeficiente de correlación producto momento de Person.914. como media aritmética. potencias. La transformación de una unidad x en otra unidad x’ medidas ambas en escala de razón se efectúa mediante una relación de proporcionalidad de la forma x’ = ax. Un valor x medido en una escala intervalar se puede transformar en otro valor x’ de otra escala por medio de una relación de la forma x’= a+bx. Tf = (9/5)Tc+32 Valores medidos en escala intervalar son susceptibles de cálculo para todo tipo de estadísticas. también llamadas fundamentales u derivadas como densidad. Escala de Razón Las escalas de razón se relacionan de manera más frecuentes con las magnitudes físicas tales como distancia. desviación estándar. siempre y cuando se cumplan los supuestos adicionales de comportamiento estadístico de las mediciones. la cual se ha modificado levemente: 5 . media geométrica. esto es hay una ausencia absoluta de calor. fuerza y elasticidad. varianza. Las pruebas estadísticas son aplicables en la medida en que las observaciones cumplen supuestos probabilísticos. a tal temperatura las moléculas de cualquier elemento dejan de moverse.Estadística No Paramétrica. En la escala de razón el cero significa ausencia de la característica. cuya relación de equivalencia responde a la siguiente fórmula. resistencia eléctrica. Nuestras escalas para medir el tiempo bajo diferentes calendarios son ejemplos clásicos de este tipo. por ejemplo la temperatura medida en grados Kelvin o de escala absoluta asociada el cero a lo que en grados centígrados corresponde a –273 y que de acuerdo con la física. Otro ejemplo clásico es el de la temperatura medida en grados centígrados y su equivalente en grados Farenheit. Y aquellas pruebas basadas en estas estadísticas. Introducción ____________________________________________ diferencia entre 23 grados y 24 grados es de un grado. varianzas.S. S. peso. Stevens presenta la siguiente tabla resumen de las estadísticas aplicables a las escalas de medición. etc. sus resultados no deben diferir. Introducción ____________________________________________ Escala Localización Moda Medidas Dispersión Frecuencias Indice de Shannon H Asociación Coeficiente de Contingencia Correlaciòn Tetracórica Indice de Inf. el investigador debe buscar ciertas propiedades en las mediciones para brindar congruencia entre los hechos y los conceptos teóricos que son objeto de estudio. resulta francamente inválida. mida lo que pretende medir. sin embargo al no considerar la forma como se distribuyen esa riqueza. La objetividad plantea la independencia del sujeto que efectúa la medición. Transmitida T Coeficiente de Correlación de Spearman Coeficiente de Correlaciòn de Pearson Nominal Ordinal Mediana Percentiles Rango semicuartil Desvación Media Desvación Estándar Varianza Coeficiente de Variación Error Estándar Intervalar Media Aritmética Razón Media Geométrica Media Armónica Propiedades de la Medición Más allá de la escala de medición. La consistencia se refiere a que al tener un fenómeno no alterado. 6 . es definido como el conjunto del valor monetario que representan los bienes y servicios producidos anualmente dividido entre el tamaño de la población. • Validez • Consistencia • Objetividad Una medida es válida cuando. mediciones repetidas sobre éste. Si dos observadores diferentes toman medida sobre un fenómeno. deben arrojar resultados iguales.Estadística No Paramétrica. aunque suena redundantes. el ingreso per cápita. La falta de consistencia se suele presentar por ejemplo en series de tiempo en la cuales los componentes de un concepto general cambian y afectan en forma implícita la definición operacional. Por ejemplo. El ingreso per cápita es adoptado como una medida de desarrollo económico y bienestar de los países. Y1 ) . un signo (-) si sucede lo contrario y no se asocia ningún signo (de hecho se elimina la pareja) cuando X i = Yi . Para este tipo de experimentos existen alternativas no paramétricas más poderosas.. en el sentido de que si P(+)>P(-) para una pareja.. Yi).. sexo. 2.. La Hipótesis La hipótesis nula que se plantea en la prueba de los signos tiene la siguiente expresión: 1 Ho: P( X i > Yi ) = P( X i < Yi ) = 2 Donde Xi es el valor observado antes del tratamiento (o después del tratamiento). La prueba de los signos en cambio. como es el caso de los experimentos en los cuales cada sujeto es su propio control. Prueba de los Signos _______________________________________ PRUEBA DE LOS SIGNOS I. El único requisito es que el investigador haya logrado en cada pareja un nivel de medición ordinal. En otro sentido la hipótesis nula expresa que la diferencia de las medianas de las dos condiciones es cero. Introducción Esta prueba. Las parejas pueden incluso. A cada pareja se le asocia un signo (+) si el valor de X i sobrepasa al correspondiente Yi . Y2 ) . Yn ) .Estadística No paramètrica.. junto con la de Wilcoxon se utiliza para probar hipótesis que involucran a dos grupos correlacionados. ( X 2 . 1. Las hipótesis alternativa para pruebas de una cola pueden ser: H1: P( X i > Yi ) > P( X i < Yi ) ó bien H1: P( X i > Yi ) < P( X i < Yi ) 1 .. II.n son mutuamente independientes b) La escala de medición es ordinal en cada pareja c) Las parejas son internamente consistentes...( X n . La misma afirmación sería válida en los casos P(+)<P(-) y P(+)=P(-). como la prueba de Wilcoxon. Los supuestos básicos de la prueba son los siguientes: a) Las parejas (Xi. Yi es el valor observado después del tratamiento (o antes del tratamiento). pero esta prueba requiere un nivel de medición en la variable observada que permita establecer una magnitud relativa entre las diferencias de las diferentes parejas. etc. provenir de distintas poblaciones con respecto a edad.. no hace ningún supuesto a cerca de la forma de la distribución de las diferencias ni pide que todos los sujetos se tomen de la misma población. Se supone que la muestra se compone de n parejas relacionadas ( X 1 . entonces P(+)>P(-) para todas las parejas. en caso de tener alternativas de dos colas. las parejas con valores iguales y que por lo tanto carecen de signo son eliminadas de la muestra. ésta tiene la siguiente forma: H1 : P( X i > Yi ) ≠ P( X i < Yi ) III. se presenta a continuación 2 . o se calculan probabilidades mediante hoja de cálculo. El empleo de estas tablas es conveniente sobre todo con valores n≤25. La probabilidad asociada con la ocurrencia de un número particular de signos (+) y (-) puede calcularse haciendo uso de la distribución binomial. La estadística z. si Ho fuera verdadera aproximadamente la mitad de las parejas tendría signo (+) y la otra mitad signo (-). Se establecen los 1 valores de los parámetros en la siguiente forma p = y n= número de parejas en 2 la muestra. Aunque las funciones incorporadas a las hojas de cálculo han dejado obsoletas a las tablas. Es decir. Prueba de los Signos _______________________________________ En el caso de proponer una hipótesis alternativa de dos colas. el argumento x se toma como el número menor de signos en el calculado de la probabilidad asociada a pruebas de una sola cola. Cuando se usan tablas acumulativas de la Binomial. Estadística de Prueba Se ha mencionado que en la aplicación de la prueba de los signos se asocia un signo (+) si en la pareja observada el valor Xi sobrepasa a su correspondiente Yi. El cálculo de la probabilidad mencionada se realiza mediante la siguiente fórmula: P( X ≤ x) = ∑ t =0 x ( )( ) n t 1 n 2 Donde ( ) = ( n −nt!) !t ! n t Cuando n>25 en el cálculo de la expresión anterior se puede emplear la aproximación Normal a la distribución Binomial.Estadística No paramètrica. La hipótesis nula Ho se rechaza cuando ocurre muy pocas parejas de determinado signo. correspondiente a una variable aleatoria que se distribuye Normal estándar. se asocia un signo (-) si sucede lo contrario. Como es sabido existen varias versiones de tablas de valores calculados para la distribución Binomial. De acuerdo con la hipótesis nula se espera que el número de signos (+) sea muy parecido al número de signos (-). esa probabilidad debe duplicarse. IV. son similares. tendría mayor conocimiento de las relaciones disciplinarias de su esposo con su hijo que él mismo. El número de esposas cuyo conocimiento de sus propias relaciones disciplinarias con sus hijos es mayor que el de sus esposos es igual al de esposas cuyo conocimiento de las relaciones disciplinarias es menor que el de sus esposos. y un psicólogo. Se selecciona un nivel de significancia del 5% 3 . Prueba de los Signos _______________________________________ Z= x − np np(1 − p) x ± 0. fué llamado para que estimara las declaraciones en cuanto al grado de conocimiento exhibido por cada padre acerca de la esencia de la disciplina paterna. fueron entrevistados individualmente. 17 matrimonios que habían sido separados por la guerra y cuyo primer hijo nació durante la ausencia del padre. debido a una unión más prolongada y cerca con el niño y a diversas circunstancias. típicamente asociadas con la separación del padre a causa de la guerra.5 − n 4 n 2 Este valor se compara con tablas de Normal estándar para obtener la probabilidad asociada.5 − np np (1 − p ) o bien al incluir la corrección por continuidad: Z= El valor 0. Ho: La mediana de las diferencias es cero.5 se suma si x<np o se resta en caso contrario. 1 Como p = se tendrá 2 x− n 2 n 4 Z= o con la corrección Z = x ± 0.Estadística No paramètrica. Estas declaraciones fueron extraídas de grabaciones de las entrevistas. H1: La mediana de las diferencias es positiva El conocimiento de las relaciones disciplinarias de la esposo con sus hijos es mayor en la mayoría de los casos. A cada uno de los cónyuges se le pidió que examinara diversos temas concernientes al hijo que había pasado su primer año sin padre. que conocía a cada familia. La predicción suponía que la madre. referentes a las relaciones disciplinarias de padre a hijo durante los años que siguieron a su regreso. Ejemplo En un estudio de los efectos de la ausencia del padre sobre el desarrollo de los hijos. Prueba de los Signos _______________________________________ Los psicólogos midieron el conocimiento de la relación disciplinaria con una escala ordinal de uno a cinco en la que uno significaba gran conocimiento y cinco muy escaso o nulo. Entonces hay suficiente evidencia para decir que las esposas conocen mejor las relaciones disciplinarias de sus esposos con sus hijos que ellos mismos. 4 .05 la hipótesis nula se rechaza. pues el signo (-) fué el menos frecuente. por ello el cálculo se hará con n=14 y para x=3.0286865 1 16. Procediendo al cálculo por el método exacto: 1 Pr = ∑ ( 14 ) ( 2 ) t 3 t =0 14 = (1 + 14 + 91 + 364) = 0.Estadística No paramètrica.384 Como la probabilidad Pr es menor a 0. Los resultados se concentran en la siguiente tabla Parej Madre Padre Signo a 1 4 2 + 2 4 3 + 3 5 3 + 4 5 3 + 5 3 3 0 6 7 8 9 10 11 12 13 14 15 2 5 3 1 5 5 5 4 5 5 3 3 3 2 3 2 2 5 2 5 + 0 + + + + 0 Nota Se anula Se anula Se anula 16 5 3 + 17 5 1 + Note que la muestra original de 17 parejas se eliminan 3 por tener el mismo valor. Introducción. (X2. Para las variables aleatorias Di se tienen los siguientes supuestos: a) Las Di son variables aleatorias continuas b) Son mutuamente independientes c) Tienen la misma mediana d) La distribución de las Di es simétrica e) La escala de medición es al menos intervalar II.. La prueba de Wilcoxon resulta de gran utilidad cuando el investigador tiene dudas acerca de la distribución de la variable observada y considera que la normalidad no se cumple razonablemente. Sin embargo. Prueba de Wilcoxon _______________________________________ PRUEBA DE WILCOXON I. La Hipótesis Si se denota por Md la mediana común de las Di . es posible establecer la hipótesis nula de forma simple o compuesta.Y2). (Xn. de acuerdo al deseo de investigador de hacer una prueba de una cola o una prueba de dos colas. la prueba de Wilcoxon constituye una prueba mas poderosa. Se considera que la muestra se compone de n parejas relacionadas (X1. La prueba de los signos y la prueba de Wilcoxon utilizan información referente a las diferencias de las parejas de observaciones relacionadas. Para el caso de pruebas de una sola cola se tiene Ho: Md ≤ 0 o bien Ho: Md ≥ 0 vs Hi: Md < 0 vs Hi: Md > 0 1 . como sucede en los experimentos que plantean condiciones “antes” y “después” para el mismo grupo de sujetos. La prueba de Wilcoxon. Si el nivel de medición de la variable permite agregar la magnitud relativa. al igual que la prueba de los signos.. A cada pareja se le asocia su diferencia Di =Xi-Yi.. constituyen las alternativas no paramétricas para probar hipótesis referentes a dos grupos correlacionados.Yn).Y1). la prueba de los signos utiliza solamente información acerca de la dirección de las diferencias. de tal suerte que se pueda dar mayor peso a una diferencia grande que a una pequeña. requisito establecido para el empleo de la prueba de t para dos grupos relacionados.. entonces.Estadística No Paramétrica. Cuando se desea una prueba de dos colas las hipótesis nula y alternativa se definen: Ho: Md = 0 vs Hi: Md ≠ 0 III.Yi) con el signo menos frecuente T = ∑ Ri i =1 Los valores de T con diferentes tamaños de muestra y niveles de significancia para pruebas de una o dos colas fueron tabulados por Wilcoxon. Al final del período los 16 niños se sometieron al instrumento de medición de la percepción social. La Estadística de Prueba La estadística de prueba se denotará por T y se define como la suma de los rangos Ri asignadas aquellas parejas (Xi . H0: la percepción social en los niños asignados al jardín es igual a la de los niños que se quedaron en casa. Cuando el tamaño de la muestra n es mayor de 25. la tabla anexa no se puede usar. el otro permaneció fuera de la escuela. H1: la percepción social de los niños asignados al jardín es diferente de la de los niños que se quedaron en casa. . En el experimento se contó además con 8 pares de gemelos idénticos. la distribución de la suma de los rangos de T para tales casos se aproxima a la normal. Ejemplo (1) Un psicólogo desea comprobar si la asistencia al jardín de niños tiene algún efecto en la capacidad de percepción social cuenta con un instrumento cuyo nivel de medición se sitúa en el nivel ordinal. Sin embargo. Para estandarizar se consideran las siguientes expresiones n(n + 1)(2n + 1) n(n + 1) UT = σT = 4 24 De donde la estandarización adopta la siguiente forma: n(n + 1) T− 4 Z= n(n + 1)(2n + 1) 24 IV. Un gemelo de cada par seleccionado al azar fue asignado al jardín por un tiempo. Estadística No Paramétrica. se rechaza la hipótesis. pues el valor crítico es 6. V Ejemplo (2) A 28 parejas de gemelos se les sometió a una prueba psicológica para determinar si el gemelo que nació primero tendía a ser más agresivo que el otro. Al consultar la tabla de Wilcoxon se observa que para N=8 una T=4 permite rechazar Ho con un nivel de α=0. H1: la agresividad de los gemelos que nacieron primero tiende a ser mayor.05. Si T es menor que el valor crìtico. Pareja Gemelo 1 Gemelo 2 1 86 88 2 71 77 3 77 76 4 68 64 5 91 96 6 72 72 7 77 65 8 91 90 9 10 11 12 70 71 88 87 65 80 81 72 Los cálculos para obtener la estadística de prueba se presentan en la siguiente tabla: 3 . Prueba de Wilcoxon _______________________________________ Los datos y cálculos se resumen en la siguiente tabla Puntaje de Puntaje de Diferencias niños niños Diferencias en Absoluto asignados al asignados a su Casa Jardín Rango de Diferencia con signo Rango de Signos menos Frecuentes Pareja 1 2 3 4 5 6 7 8 82 69 73 43 58 56 76 65 63 42 74 37 51 43 80 62 19 27 -1 6 7 13 -4 3 19 27 1 6 7 13 4 3 7 8 -1 4 5 6 -3 2 3 1 T = 4 Note que al asignar el Rango de la Diferencia se toman los valores en valor absoluto y la estadística de prueba T es el valor absoluto de la suma de rangos menos frecuentes. Ho: la agresividad no esta relacionada con el orden en el nacimiento. 5 se compara contra la tabla y podemos observar que su probabilidad asociada se encuentra con probabilidades asociadas entre 0.5 ‐9 8 11 T = ‐3 ‐7 ‐5. El valor de la estadística T =24.5 Observe que la pareja 6 se elimina por coincidir los valores de ambos gemelos (72) y la muestra de referencia n = 11.5 5.5 ‐9 24.20 y 0.Diferencias Rangos sin Pareja Gemelo 1 Gemelo 2 Diferencias en Absoluto ajuste Rangos ajustados por Ligas Rango de Signos menos Frecuentes 1 2 3 4 5 6 7 8 9 10 11 12 86 71 77 68 91 72 77 91 70 71 88 87 88 77 76 64 96 72 65 90 65 80 81 72 ‐2 ‐6 1 4 ‐5 0 12 1 5 ‐9 7 15 2 6 1 4 5 0 12 1 5 9 7 15 3 7 1 4 5 10 2 6 9 8 11 ‐3 ‐7 1.5 10 1.5 4 ‐5.30 por lo cual no se rechaza la hipótesis nula y no hay evidencia de que el primer gemelo sea más agresivo que el segundo. . de tamaño n1. La hipótesis que se plantea es: Ho: FX(a)=FY(a) para toda a Contra cualquiera de las alternativas ⎧ FX (a ) > FY (a ) ⎪ H1: ⎨ FX (a ) < FY (a ) ⎪ F (a ) ≠ F (a ) Para alguna a ⎩ X Y Lo anterior se puede considerar equivalente a Ho: P( X > Y ) = P( X < Y ) = 1 2 1 .Estadística No Paramétrica. de tamaño n2.Xn1.. no solamente entre los dos grupos considereados. Sean FX(x) y FY(y) las funciones de distribución correspondiente a las dos variables X. la prueba t en muestras pequeñas (n<30).. Introducción Con frecuencia se pretende comparar dos muestras independientes y las condiciones de los datos no permiten hacer los supuestos de normalidad e igualdad de varianzas que requiere para su aplicación. b) Ambas muestras provienen de variables continuas (sin embargo.. la potencia de la prueba U con respecto a la potencia de la t. se afirma que es estocásticamente más pequeña que Y si FX(a)<FY(a) para toda a.. nunca es menor al 83% y en el caso de que los supuestos de la t se cumplen la potencia de la U alcanza el 95%.. Se considera que los datos provienen de dos muestras aleatorias X1. la prueba U de Mann-Whitney resulta una excelente alternativa. sino además dentro de cada grupo. Hodges y Lehmon mencionan que al menos teóricamente. si se ha logrado al menos un nivel ordinal en los datos.Yn2. Prueba U de Mann Whitney _________________________________ PRUEBA U DE MANN WHITNEY I.. Y.. Los supuestos básicos de la prueba son: a) Las muestras se han tomado aleatóriamente y en forma independiente. La variable aleatoria X. y Y1. Sin embargo. Y2. La hipótesis. X2. se puede tolerar un moderado número de “ligas” u observaciones con el mismo valor) c) La escala de medida es al menos ordinal. II.. . como aparecerían si se ordenasen de menor a mayor. Prueba U de Mann Whitney _________________________________ Contra cualquiera de las alternativas ⎧ P( X > Y ) > ⎪ H1: ⎨ P( X > Y ) < ⎪ P( X > Y ) ≠ ⎩ P( X < Y ) P( X < Y ) P( X < Y ) III.2. al ser colocadas en una situación nueva. pero identificables.. con i=1. Cinco ratas 2 .. La Estadística de Prueba Considérese la sucesión de observaciones de ambas poblaciones mezcladas... pues por el teorema del límite central se tiene que la variable Z expresada por Z= Ux − n1n2 2 1 12 n1n2 ( n1 + n2 + 1) Se distribuye aproximadamente como una normal estándar o normal (0. j=1. Para cada par de observaciones Xi Yi. lo que da Uy.n1..2. Ejemplo 1 En un estudio sobre el problema de la generalización de la imitación que un grupo de ratas había aprendido. la media y la varianza de Ux se pueden calcular a partir de las siguientes expresiones E (U x ) = n1n2 2 V (U x ) = 1 n n n + n + 1 2 12 1 2 1 ( ) Estos resultados son de particular utilidad en el caso de muestras grandes.n2 se define ⎧1 si X i < Yj Wij = ⎨ ⎩ 0 si X i > Y j La suma de las w´s es el estadístico UX U x = ∑ ∑Wij i =1 j =1 n1 n 2 Un resultado semejante se define para y. Ambas Ux y Uy cumplen con la relación Ux + Uy = n1n2 de donde U x = n1n2 − U y Media y Varianza de la Ux Apoyándose en la hipótesis nula.Estadística No Paramétrica..1) IV.. Prueba U de Mann Whitney _________________________________ fueron adiestradas para imitar a ratas “lideres” en un laberinto en T. Sean denotadas por T las ratas sometidas al entrenamiento previo y sean denotadas por C las ratas del grupo control. Su conducta al evitar descargas fue comparada a la de cuatro controles sin adiestramiento previo para seguir a sus lideres. La hipótesis fue que las cinco ratas adiestradas en la imitación transferían este adiestramiento a la nueva situación y alcanzarían el criterio de aprendizaje correspondiente a la nueva situación antes que las cuatro ratas del grupo control. Se les enseño a seguir a sus lideres cuando tenían hambre para lograr un incentivo de comida. La hipótesis nula Ho: ambos grupos de ratas responden de forma semejante. Después.Estadística No Paramétrica. donde la imitación de las ratas lideres les permitieran liberarse de dichas descargas. las cinco ratas fueron transferidas a una situación consistente en evitar descargas eléctricas. La comparación se hace en términos de los ensayos de cada rata previos a un criterio de 10 respuestas en 10 ensayos. se plantea por Ho: P( T > C) = P( T < C) = 1 2 La hipótesis alternativa Hi: Las ratas sometidas al entrenamiento T aprenden en menos sesiones que las ratas control C H1: P( T < C ) > 1 2 se selecciona un nivel de significancia para la prueba de 5% Rata 1 2 3 4 5 Tratamient o 78 64 45 75 82 (ensayos) Control (ensayos) 110 51 70 53 - se cumple la siguiente relaciones U x = n1n2 + U Y = n1n2 + Donde n1 ( n1 + 1) n2 ( n2 + 1) 2 2 − R1 − R2 3 . 05 correspondiente al nivel de significancia seleccionada se puede concluir que Ho no se rechaza.452 Como el valor 0. a la que además. Procedimiento 2 RT=1+4+6+7+8=26 U T = 4(5) + UT = 9 5( 6 ) 2 − 26 = 9 Valor calculado que coincide con el del procedimiento 1 4 . se requiere la sucesión mezclada y etiquetada. Procedimiento de Cálculo Procedimiento 1 Ordenar la sucesión mezclada e identificada 45 51 53 64 70 75 78 82 110 T C C T C T T T C Calcular el número de puntajes T que preceden a cada puntaje C T C C T C T T T C 1 1 2 5 La suma 1+1+2+5=9 es el valor de U En las tablas para n=4 y n=5 se puede observar que P(U≤9)=0.Estadística No Paramétrica. se le asignan rangos Rang o 1 2 3 4 5 6 7 8 9 45 51 53 64 70 75 78 82 110 T C C T C T T T C IV. Prueba U de Mann Whitney _________________________________ R1 R2 es la suma de los rangos asignados al grupo cuyo tamaño muestral es n1 es la suma de los rangos asignados al grupo cuyo tamaño muestral es n2 Para aplicarse el ejemplo mencionado.452>0. se ha mencionado que a la celda correspondiente a observaciones ligadas se le asigne 1/2. no importa que no esten ordenadas. Cuando son rangos los resultados de las mediciones se acostumbra asignar el promedio de los rangos correspondientes a las observaciones ligadas y hacer algunos ajustes al cálculo manual. la cual se distribuye aproximadamente como una normal (0. Tamaños de Muestra Grandes Si los tamaños de muestra son superiores a 20 observaciones es posible utilizar la variable Z definida en 3. es frecuente tener observaciones con empates o ligas En general la perturbación causada por rangos ligados no es importante. Suponga que se tienen dos muestras de tamaño n1=16 y n2=23 correspondientes al grupo A y al grupo B. En caso de empate se asigna 1/2 C\T 82 78 64 75 45 51 0 0 0 0 1 110 1 1 1 1 1 53 0 0 0 0 1 70 0 0 1 0 1 La estadística UT está dada por la suma de las celdas en la matriz.1). En el caso particular del procedimiento de cálculo de la estadística U mediante la matriz. al margen de una matriz en la siguiente forma C\T 82 78 64 75 45 51 110 53 70 En cada celda de la matriz.Estadística No Paramétrica. se asigna el valor 1 si la observación del renglón supera a la observación de la columna y un cero si sucede lo contrario. en este caso UT =9. pero debido a la limitación de los dispositivos de medición de los fenómenos en estudio. Prueba U de Mann Whitney _________________________________ Procedimiento Alternativo Propuesto Las dos muestras se colocan. El Caso de Ligas o Empates Teóricamente este caso no debe darse. Se plantea la hipótesis 5 . 10. 10. 10.5 0 0. 14. 12. Z= 6 .5 0. 7.43 16(23)(16 + 23 + 1) n1 n2 (n1 + n2 + 1) 12 12 ( Z ≤ −3. 13. 8.5 0. 8 El cálculo de U mediante el procedimiento de la matriz da el valor siguiente 1 2 3 4 5 6 7 13 12 12 10 10 10 10 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 16 17 15 15 15 14 14 14 13 13 13 12 12 12 12 11 11 10 10 10 6 8 8 1 1 1 1 1 1 1 1 0. 11. 15.5 0. 7. 6. 6. 7. 15. 12. 7.5 0 0. 12.5 0.5 0 0. 12. 10. 11.5 0.5 0.5 0. 8. Grupo A Grupo B 13.5 0. 14. 15.5 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 8 7 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 1 1 9 10 11 12 13 14 15 16 7 7 7 7 6 9 8 8 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 0 0.43) < 0.5 Uy=304 De donde Ux = 64 U − n1 n2 2 64 − (16)(23) 2 Z= = -3. 14. 17. 13.5 0. 12.5 0.5 0.5 0.5 0. 10.5 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0.5 0 0.5 0 0. 10. 9.05. Prueba U de Mann Whitney _________________________________ Ho: P( B > A) = P( B < A) = H1 : P( B > A) = 1 2 1 2 Nivel de significancia α=0. 13. 12. 10.5 0.5 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0.5 0 0.5 0.5 0.Estadística No Paramétrica. 7. 8 16.5 0. Por lo tanto se puede Como se cumple que P concluir que hay evidencia estadística de que el grupo B es superior al grupo A.5 0 0.05 se rechaza Ho. b) Como hipótesis de independencia entre dos criterios de clasificación aplicables a los elementos de una misma población. una tabla de contingencia es un arreglo matricial de c renglones y k columnas en cuyas C x K celdas se registran conteos o frecuencias referentes a la muestra y cuyos elementos se han medido en un nivel nominal. los elementos de una muestra deben ser categorizados de acuerdo a dos o más criterios de clasificación y es de interés para el investigador.2. pero las diferencias básicas entre las dos aplicaciones justifican discusiones separadas. Se denotará por Oij el número de observaciones de la i-ésima categoría perteneciente a la j-ésima muestra. La Hipótesis 1) Hipótesis de Igualdad de Proporciones Suponga que se tiene k poblaciones y que se extrae una muestra aleatoria de tamaño nj de cada población (j=1. Cada observación de las k muestras puede ser clasificada en una de c diferente categorías. Tablas de Contingencia _________________________________________ LA PRUEBA JI CUADRADA PARA TABLAS DE CONTINGENCIA I. En un sentido más estricto.k). Introducción Son frecuentes los estudios en los cuales. tienen básicamente dos sentidos diferentes: a) Como hipótesis de igualdad de proporciones en los diferentes niveles de cierta clasificación. En este tipo de problemas el análisis de los resultados mediante el uso de la distribución Ji-cuadrada aplicada a tablas de contingencia es sin duda. determinar si los criterios de clasificación son independientes.. cuando el objetivo es valorar la relación que existe entre los dos criterios o variables. uno de los procedimientos estadísticos más populares. aún cuando los procedimientos de cálculo son los mismos. Denótese además por mi el total de observaciones pertenecientes a todas las muestras que quedan contenidas en la i-ésima categoría. cuando las observaciones provienen de dos o más poblaciones. La información se dispone en forma tabular de la manera siguiente: Muestras (Tratamientos) 1 .. ambos casos son tratados idénticamente desde el punto de vista de los cálculos estadísticos.. En este punto resulta conveniente aclarar que las hipótesis a probar mediante tablas de contingencia. Como se mencionó. II.Estadística No Paramétrica.. . . . .. Oc1 Oc2 c n2 Total n1 En la tabla se debe verificar lo siguiente: .= Pic La probabilidad (proporción) de pertenecer a cualquiera de las c clases es la misma para cualquier elemento de la i-ésima muestra. . . . quede clasificada en la i-ésima categoría..... Ock nk Total m1 m2 .. 2) Hipótesis de Independencia 2 . .. . H1: Pij ≠ Pij´ para al menos una pareja j ≠ j´ La probabilidad de pertenecer a cualquier de las c clases es diferente para al menos una clase.. .Estadística No Paramétrica. Tablas de Contingencia _________________________________________ Clase 1 2 s O11 O12 1 O21 O22 2 .. ... . .. . .. .... . mc N ∑ mi = ∑ nj = N i =1 c j =1 c k ∑ Oij = nj i =1 ∑ Oij = mi j=1 k Se consideran los siguientes supuestos básicos en el planteamiento de la hipótesis a) Las k muestras son aleatorias b) Los resultados de las diferentes muestras son mutuamente independientes c) Cada observación puede ser categorizada en una y sólo una de las c diferentes clases Sea Pij la probabilidad de que un elemento de la j-ésima población seleccionado al azar. La hipótesis nula y alternativa se plantea como sigue: Ho: Pi1 = Pi2 =... k O1k O2k . . . La disposición de las observaciones es igual que en 1) con la excepción de que en este caso.j. La proposición anterior puede traducirse en términos probabilísticos de la siguiente forma Sea Pi la probabilidad de pertenecer al i-ésimo renglón Pj la probabilidad de pertenecer a la j-ésima columna Ho: Pij = PiPj H1: Pij ≠ PiPj para toda i. b) Las observaciones pueden ser clasificadas en una de c diferente categorías de acuerdo al segundo criterio. independientemente de cualquier otra observación. La Estadística de Prueba Para ambos casos 1 y 2 de la sección anterior se define la frecuencia esperada Eij correspondiente a la celda con coordenadas (i. sino que son aleatorias.j III. Los supuestos para este caso son los siguientes: a) Cada observación tiene la misma probabilidad de ser clasificada en el i-ésimo renglón y en la j-ésima columna. Tablas de Contingencia _________________________________________ Suponga que se dispone de una muestra aleatoria de tamaño N y que las observaciones de la muestra pueden clasificarse de acuerdo a dos criterios. las n no se establecen previamente .Estadística No Paramétrica.j para alguna i.j) como Eij = minj N La estadística de prueba se denota por W y su fórmula de cálculo es: 3 . Al usar el primer criterio cada observación puede asociarse con uno de los c renglones y al usar el segundo criterio se asocia con una de las k columnas. La hipótesis nula correspondiente se puede plantear en los siguientes términos: Ho: El evento “la observación pertenece al i-ésimo reglón” es independiente del evento “la misma observación pertenece a la j-ésima columna” para toda i. En el caso de tablas cuadradas si consideramos a R como el número de renglones su cota superior es: Cota = R R +1 4 . CC = W W+N Un valor alto de CC significa un alto grado de asociación. La introducción de la corrección para la continuidad cambia la expresión de W en la forma siguiente: W= N O 11 O22 − O12 O21 − m1 m 2 n1 n 2 ( N 2 2 ) IV Otras estadísticas e Indices complementarios 1) El Coeficiente de Contingencia Para medir el grado de relación o dependencia de las clasificaciones de una tabla de contingencia se utiliza el coeficiente de contingencia CC. Tablas de Contingencia _________________________________________ W = ∑∑ i =1 J =1 c K (Oij − Eij )2 Eij La distribución de W se aproxima a una Ji-cuadrada con (c-1)(k-1) grados de libertad. Un valor cercano a 1 refleja una fuerte asociación entre las variables. Para este caso la fórmula para el cálculo de W se puede simplificar con la siguiente expresión. ya que se aproxima la distribución de una continua.Estadística No Paramétrica. es posible mejorar el cálculo de W con la introducción de Yates para la continuidad. como lo es la Ji-cuadrada. cuyo valor máximo está determinado por el número de filas y columnas de la tabla. N (O11O22 − O12 O21 ) W= m1 m 2 n1 n 2 2 Sin embargo. Atención especial en las tablas de contingencia merecen las tablas 2x2. Está acotado entre 0 y 1. MH = ( N − 1) R 2 5 . Este coeficiente se calcula a partir de los rangos de dos grupos de observaciones que corresponden a las variables. Una alternativa de la Ji Cuadrada de Mantel-Haenszel. φ= W N 5) Ji Cuadrada de Mantel-Haenszel Para medir la asociación lineal entre variables medidas en nivel ordinal se frecuenta el uso del coeficiente de correlación de Spearman. Tiene la ventaja de alcanzar un valor máximo de 1 sin importar la estructura de la tabla. V= W N (m − 1) Donde m es el mínimo entre el número de columnas y renglones. medida de asociación lineal. Una prueba de significancia alternativa para la estadística Ji cuadrada es la estadística G de la razón de verosimilitud (Fisher 1928). Tablas de Contingencia _________________________________________ 2) La G Razón de Verosimilitud. La primera se basa en las diferencias entre frecuencias esperadas y frecuencias observadas. ⎛ eij G = −2∑∑ Oij ln⎜ ⎜O i =1 j =1 ⎝ ij C K 2 ⎞ ⎟ ⎟ ⎠ 3) La V de Cramer. La segunda se basa en los logaritmos de las razones de las frecuencias esperadas respecto de las frecuencias observadas.Estadística No Paramétrica. Cramér introdujo una variable del coeficiente de contingencia conocida como la V de Cramér. En tablas 2x2 coincide con la V de Cramer. suya asociación se pretende medir. 4) El Coeficiente Phi de Pearson Se calcula mediante el cociente de la estadística W (Ji-Cuadrada) dividida entre el tamaño de muestra y después se extrae raíz cuadrada. Se distribuye asintóticamente como Ji cuadrada con (k-1)(c-1) grados de libertad. que se calcula multiplicando el cuadrado del coeficiente de correlación de Spearman por el número de casos menos 1. O.1 O.Estadística No Paramétrica. Tablas de Contingencia _________________________________________ La estadística MH tiene un grado de libertad y no es aplicable a mediciones efectuadas en nivel nominal.2 N La probabilidad exacta se obtiene mediante una distribución hipergeométrica ⎛ O. O21 O22 O2. la prueba se apoya en el cálculo de la probabilidad exacta de observar un conjunto particular de frecuencias en una tabla 2x2. La estadística de Lambda Asimétrica mide la proporción de mejoría en la capacidad predictiva de la variable independiente.k Donde: ∑ max O k jk Es la suma de las frecuencias máximas de las celdas por columna Es el máximo de las sumas por renglón max O.2 ⎞ ⎜ ⎟⎜ ⎟ ⎝ O11 ⎠⎝ O12 ⎠ P= ⎛N⎞ ⎜ ⎟ ⎝ O1. cuando los totales marginales se consideran fijos. Este concepto se conoce como reducción proporcional del error.1 ⎞⎛ O. 6) La Prueba exacta de Fisher Una popular prueba no paramétrica aplicable a tablas de contingencia 2x2 es la prueba exacta de Fisher. Si se considera la tabla: O11 O12 O1. La fórmula de cálculo para la Lambda Asimétrica es de: Lambda = λa = ∑ max O k jk − max O. Se basa en el supuesto de que la mejor estrategia para predecir es seleccionar la categoría con más casos (categoría modal).k N − max O. ⎠ 7) Lambda Asimétrica Es una medida de asociación para tablas cruzadas basadas en variables medidas a nivel nominal.k 6 . 9) Coeficiente de Incertidumbre. El concepto tiene su origen en teoría de la información y se relaciona con el concepto y medida de entropía. La Lambda Simétrica no establece cual variable es la dependiente y cual la independiente. Es aplicable en variables medidas en nivel nominal y existen al igual que en el caso de la Lambda versiones simétricas y asimétricas.k − max O j .k max Oj. Como la alternativa se suele calcular la Lambda Simétrica la cual es una especie de promedio entre las dos lambdas asimétricas.Estadística No Paramétrica. Lambda = λs = ∑ max O k jk + ∑ max O j k − max O. j 2 N − max O. Mide la mejoría predictiva promedio en ambaa direcciones. 8) Lambda Simétrica El cálculo de la Lambda Asimétrica se realiza para cada una de las dos variables que intervienen en la tabla y los resultados pueden diferir. Un valor de Lambda de 0. Su interpretación es similar a la Lambda Asimétrica. Si x es la variable independiente y es la variable dependiente Entonces las tres versiones se calculan con las siguientes fórmulas. Tablas de Contingencia _________________________________________ El valor de Lambda oscila entre 0 y 1. 7 . Donde ∑ max O k jk Es la suma de frecuencias máximas de las celdas por columna Es la suma de frecuencias máximas de las celdas por renglón Máximo de las sumas por renglón Máximo de las sumas por columna ∑ max O j jk max O. El coeficiente de incertidumbre asimétrico mide la proporción en la que la incertidumbre en el conocimiento de la variable dependiente se reduce por el conocimiento de la variable independiente.20 indicaría que el conocimiento de la variable dependiente es un 20%.k − max O j . Cada pareja es verificada en la concordancia del orden relativo de la primera y segunda variable (rangos).0 y significa ausencia total de incertidumbre La versión simétrica no supone una especificación de las variables independientes y dependientes.Estadística No Paramétrica. la estadística Tau será positiva. 10) Tau b La Tau b y las otras medidas de asociación entre dos variables ordinales. Si la relación es inversa. Gamma y D de Somers. si existe preponderancia de parejas ordenadas en la misma dirección de ambas variables (relación directa). Mide la ganancia global de conocimiento en la distribución conjunta de ambas variables. Consideran la información de todos los posibles pares de casos en la tabla. es decir. Tablas de Contingencia _________________________________________ U ( y / x) = I ( y ) + I ( x) − I ( xy ) I ( y) I ( y ) + I ( x) − I ( xy ) I ( x) I ( y ) + I ( x) − I ( xy ) I ( x) + I ( x) U ( x / y) = U ( xy ) = 2 Donde I ( y ) = −∑ j Oj ⎛O ln⎜ j n ⎜ n ⎝ ⎞ ⎟ ⎟ ⎠ I ( x) = −∑ i Oi ⎛ Oi ⎞ ln⎜ ⎟ n ⎝ n ⎠ I ( xy ) = −∑∑ i j Oij ⎛ Oij ln⎜ n ⎜ n ⎝ ⎞ ⎟ ⎟ ⎠ Su valor máximo es de 1. Inicialmente se calcula el número de parejas concordantes (P) y el número de parejas discordantes (Q). La Tau se calcula con la fórmula: 8 . se construyen bajo una base común. como la Tau C. la estadística Tau será negativa. El valor 1 es tomado por Tau b cuando solamente se registran frecuencias en la diagonal principal. La aplicación de Tau b es apropiada para tablas con el mismo número de columnas y renglones. el que sea menor.Estadística No Paramétrica. Una interpretación alternativa de la Gamma supone que las probabilidades de predecir correctamente el orden de una pareja a partir del conocimiento del valor de la primera variable. es -1 cuando solamente se registran frecuencias en la diagonal secundaria (ascendente). 11) Tau c Cuando el número de columnas difieren del número de renglones. 12) Gamma de Kruskal y Goodman Está muy asociada a las estadísticas Tau b y Tau c y se calcula: G= P−Q P+Q Esta estadística se puede interpretar intuitivamente de la manera siguiente: el número de parejas concordantes P menos el número de parejas discordantes Q se divide entre el total de parejas P+Q. En la primera. Esta se calcula con la fórmula: Tau c = 2 m( P − Q) N 2 ( m − 1) Donde m es el número de renglones o columnas. La gamma toma valores positivos si las parejas P son dominantes y negativos si sucede lo contrario. como en otras estadísticas. es más apropiada la estadística Tau C. Tablas de Contingencia _________________________________________ Tau b = ( ( N ( N − 1) − ∑ T (T 1 2 1 P−Q 1 − 1)) ) ( N ( N − 1) − ∑ T (T 1 2 2 2 − 1)) 2 1 Donde T1 es el número de ligas en las variables del renglón y T2 es el número de ligas en las variables de la columna. se 9 . Existen las versiones Asimétrica y Simétrica. 13) D de Somers Es una modificación de la Tau c que incluye las ligas en el denominador. 315 49.343 47.535 6. Hay una tendencia a buscar pareja en condiciones similares. Al observar la tabla nos podemos percatar que el número de parejas formadas por hombres y mujeres. Tablas de Contingencia _________________________________________ define una variable independiente y otra como dependiente. P−Q DA = P + Q + T1 Donde T1 representa las ligas por columna con la variable columna como dependiente. Ejemplo prueba de Independencia. adopte la fórmula: P−Q DA = P + Q + T2 Donde T2 representa las ligas por renglón. Se tiene una estadística de 56. 10 .216 1.458 56.347 5.405 375 2. Verifique la hipótesis de independencia del estado civil previo en la decisión de contraer nupcias tanto para hombres.Estadística No Paramétrica.567 978 581 580 2. como para mujeres.021 parejas de las cuales se registró el estado civil de ambos cónyuges antes de contraer matrimonio. La siguiente fórmula supone que la variable renglón es la dependiente. Soltera Soltero Viudo Divorciado Total Viuda Divorciada Total 44. se tienen realmente 2. La alternativa simétrica de la D de Somers toma en cuenta ambas ligas DS = P−Q P+Q+ 1 2 (T 1 + T2 ) V. El número esperado parejas previamente divorciadas es de 613. ambos solteros no difiere sensiblemente del valor esperado. Sin embargo.833 391 2.535 parejas.139 3.021 El càlculo de las frecuencias observadas bajo el supuesto de independencia celda a celda se presenta en la siguiente tabla. sin embargo. la principal discrepancia se da entre hombres y mujeres divorciadas. 347.0 432.466040 15. Tablas de Contingencia _________________________________________ Soltera Soltero Viudo Divorciado Total Viuda Divorciada Total 41. CC = 15.0 56. Ejemplo de indicadores asociados.372461 N (m − 1) 56.0 1.0 49.7 VI.6 6.315.634.86602 3 −1 R+N Cota = La V de Cramér tiene la ventaja de que está siempre acotada entre 0 y1. V= 15.0 5.3 Divorciado 827.481.9 1.1 7.021 W+N 3 R = = 0.0 La contribución celda a celda a la estad{istica W se presenta en la siguiente tabla.4 2.3 6.543.2 51.9 151.6 6.558 es muy elevado. Soltera Soltero Viudo Total Viuda Divorciada Total 221.7 4.547.458.0 1.143. El valor de la T=15.3 W = = 0.452.0 5.547. En este caso refleja una clara asociación que desde luego contradice la independencia.788.4 208.543.021(3 − 1) 11 .5 1.6 15.850.567.021.145. supera por mucho al valor crítico de tablas Ji cuadrada al 95% con (3-1)(3-1) = 4 grados de libertad (9.4 1.3 47.9 1.1 7.216.276.2 5.49) Por tanto la hipótesis de independencia no es sostenible.8 662.3 W = = 0.879. Se presenta el cálculo de algunos indicadores adecuados para variables de tipo nominal o categórico.7 328.139.3 − 56. El Coeficiente de Contingencia de Pearson CC es uno de los más usuales.990.785.0 5.132.Estadística No Paramétrica.543.543.7 495.8 615. 04518571.458 56.324..4 ‐ 2.7 Divorciado 3. Su cálculo parte directamente de la tabla de contingencias. φ= 15.347 5.2 ‐ 1. ⎛ eij G = −2∑∑ Oij ln⎜ ⎜O i =1 j =1 ⎝ ij C K 2 ⎞ ⎟ ⎟ ⎠ Total Soltera Soltero Viudo Total Viuda Divorciada ‐ 6.169.k k Lambda = λa = N − max O.8 ‐ 2.817.9 9.532.567 978 581 580 2. Tablas de Contingencia _________________________________________ El coeficiente ø de Pearson.343 47.269.315 El valor obtenido es 0. Su cálculo se facilita mediante una tabla de estructura análoga a la de frecuencias.5267402 N 56.3 W = = 0. pero su valor máximo depende de las dimensiones de la tabla.304.k Soltera Soltero Viudo Total Viuda Divorciada Total 44.543.1 ‐ 2.Estadística No Paramétrica.405 375 2.2 1.3 ‐ 1.5% la predicción del estado civil previo de la mujer.0 ‐ 5.656. 12 .139 49.833 391 2. adopta el valor cero en caso de independencia.7 839.187. como se mencionó tiene un objetivo similar a la Estadística Jicuadrada.535 6.4 ‐ 2.7 ‐ 4.528.021 Divorciado 3. Tiene aplicación específica en modelos Log Lineales y se aproxima su distribución a una Jicuadrada con 1 grado de libertad.5 ‐ 678.216 1.1 ‐ 7.021 La razón de verosimilitud.702. ∑ max O j k − max O.277.178.727. A continuación se han sombreado las celdas que intervienen en el cálculo. lo que indica que el conocimiento del estado civil previo del hombre aumenta en 4.196.3 Lamda Asimétrica mide la proporción de mejoría en la capacidad predictiva de la variable que se adopta como independiente. Evidentemente resulta significativa.4 3. 2269 ‐ I ( y ) = −∑ j Divorciado ‐ 0.1247 ‐ 0. Su cálculo se simplifica con la ayuda de una tabla: Soltera Soltero Viudo Total Viuda Divorciada Total ‐ 0. la cual da cero. Es decir que el conocimiento previo del estado civil de la mujer no mejora la predicción para el estado civil del hombre. Tablas de Contingencia _________________________________________ De forma análoga se obtiene la Lamda Asimétrica para mujeres.0707 ‐ 0.1783 ‐ 0.0347 ‐ 0.2461 U ( y / x) = I ( y ) + I ( x) − I ( xy ) I ( y) i Oj ⎛O ln ⎜ j n ⎜ n ⎝ ⎞ ⎟ ⎟ ⎠ I ( x) = −∑ Oi ⎛ Oi ⎞ ln⎜ ⎟ n ⎝ n ⎠ I ( xy ) = −∑∑ i j Oij ⎛ Oij ln⎜ n ⎜ n ⎝ ⎞ ⎟ ⎟ ⎠ El valor del coeficiente de incertidumbre para hombres es 0.1138 ‐ 0.19764899 y finalmente el coeficiente de incertidumbre simétrico es 0.1809626274 13 . Tiene interpretación semejante a la de la Lamda.1702 ‐ 0.0474 ‐ 0.1401 ‐ 0.0896 ‐ 0. El coeficiente de incertidumbre para mujeres es 0.0335 ‐ 0. La Lamda Simétrica es 0.1328 ‐ 0.0250344 El Coeficiente de incertidumbre asimétrico mide la proporción en la que la incertidumbre en el conocimiento de la variable dependiente se reduce por el conocimiento de la variable independiente.166874383 lo cual indica que la incertidumbre del estado civil previo se reduce 17%.0473 ‐ 0.Estadística No Paramétrica.1389 ‐ 0. b) Las mediciones consideradas alcanzan el nivel ordinal al menos. entonces.. su eficiencia es relativamente baja y puede ser mejor alternativa utilizar la prueba U de Mann y Whitney debido a su mayor potencia. y no se puede hacer el supuesto de normalidad requerido por la prueba t de Student para dos muestras independientes. II. las dos poblaciones tienen la misma probabilidad p de que una observación exceda a la mediana de ambas poblaciones. Y2... Introducción Cuando se cuenta con dos muestras independientes y se desea probar si la localización de las distribuciones que las originaron es la misma desde el punto de vista de la mediana. Como se ve.637.. Sean G1 y G2 las dos poblaciones Ho: Mediana de G1 = Mediana de G2 Las hipótesis alternativas pueden ser H1: Mediana de (G1) ≠ Mediana de (G2) H1: Mediana de (G1) > Mediana de (G2) H1: Mediana de (G1) < Mediana de (G2) III. Posteriormente las observaciones se comparan con la mediana combinada para obtener las frecuencias de observaciones de ambas muestras 1 .. sino además dentro de cada grupo. Yn2 de tamaño n2 y que además. La Estadística de Prueba Para proceder a calcular la estadística de prueba. no solamente entre los dos grupos considerados..Xn1 de tamaño n1 y Y1. La Hipótesis En la hipótesis nula se supone que si las dos poblaciones tienen la misma mediana.. Prueba de la Mediana _______________________________________ PRUEBA DE LA MEDIANA I. Para la aplicación de la prueba se considera que se dispone de dos muestras aleatorias X1. la prueba de la mediana ha sido una de las más populares por su facilidad de aplicación.Estadística No Paramétrica. se toman las observaciones de las dos muestras y se rechazan para calcular la mediana de las dos muestras combinadas. La eficiencia relativa de la prueba de la mediana con respecto a la prueba t cuando se cumplen las condiciones de normalidad es aproximadamente de 0. se cumplen con los siguientes supuestos: a) Las dos muestras se han tomado en forma independiente. X2.. Si no se dispone de este apoyo.Estadística No Paramétrica. estudiaron la relación entre las prácticas de crianza de los niños y las costumbres relacionadas con la enfermedad dentro de los contextos culturales de grupos analfabetas. Ejemplo 2 Whiting y Child realizarón una prueba de transcultura de algunas hipótesis de la teoría del comportamiento tomadas de la teoría psicoanalítica. Una hipótesis de su grupo afirmaba que las explicaciones de tipo oral de las enfermedades (decir que las enfermedades son causadas por: ingestión de veneno. 2 . entonces la distribución muestral de O11 y O12 bajo la hipótesis nula es la distribución hipergeométrica. o12 ( )( ) )= () n1 O11 n2 O12 N A Si el número de casos es pequeño N < 30. Las estadísticas de prueba W (Ji-cuadrada) correspondiente a este último caso tiene la siguiente fórmula. para N ≥ 30 se puede utilizar la aproximación de una Ji-cuadrada con 1 grado de libertad. Este número puede incrementarse con el apoyo de funciones de una hoja de cálculo. por hechizos y brujerías verbales de otros. con frecuencia se utiliza la prueba exacta de Fisher. por beber ciertos líquidos. la cual se basa en el cálculo de la expresión anterior. Prueba de la Mediana _______________________________________ que exceden a la mediana. P (o11 . Esas frecuencias se arreglan a una matriz 2x2 tal como se ilustra a continuación Grupo 1 Grupo 2 Observaciones Menores a la Mediana Observaciones Mayores o Iguales a la Mediana Total OII OI2 A O21 n1 O22 n2 B N Total Si O11 es el número de observaciones del grupo 1 mayores a la mediana y O12 es el número de observacione del grupo 2 en el mismo caso. N ( o11o22 − o12o21 − N 2 ) W= ABn1n2 IV. Nivel de significancia de la prueba α=0.). esta última medición abarcó un rango de 6 a 17. Prueba de la Mediana _______________________________________ etc.Estadística No Paramétrica.84.4350 El valor de tablas de Ji-cuadrada con un grado de libertad y una significancia de 5% es 3. Se estudiaron 39 comunidades analfabetas a través de reportes etnológicos concernientes a las enfermedades y se dividieron en las que daban explicaciones de tipo oral (16). Como 6. 3 . Hi: La mediana del grado de socialización de la ansiedad oral en las comunidades que dan explicaciones de tipo oral de las enfermedades es mayor a la mediana del grado de socialización de la ansiedad oral en las comunidades que no dan explicaciones de tipo oral de las enfermedades. Por otra parte se clasificaron de acuerdo a las prácticas de crianza de los niños y se midió el grado ansiedad típica de socialización oral en sus niños. 13 12 12 10 10 10 10 9 8 8 7 6 Comunidades con explicación oral de las enferemedades. Ho: La mediana de grado de socialización de la ansiedad oral en las comunidades que dan explicaciones de tipo oral de las enfermedades es igual a la mediana del grado de socialización de la ansiedad oral en las comunidades que no dan explicaciones de tipo oral de las enfermedades. se encontrarían con mayor frecuencia en las sociedades donde la socialización de los impulsos orales es tal que produce ansiedad.05 Grupo 1 Comunidades sin explicación oral de las enferemedades.84 la hipótesis Ho se rechaza. 17 16 15 15 15 14 14 14 13 13 12 11 11 10 10 10 8 8 6 7 7 7 7 Grupo 2 13 12 12 12 La mediana combinada de los dos grupos combinados es 11 Grupo 1 > Me <= Me Total 3 13 16 Grupo 2 15 8 23 Total 18 21 39 Cálculo de las estadísticas de prueba mediante Ji cuadrada W= 39( 3(8) − 15(13) − 39 / 2) 2 (18)(21)(16)(23) W = 6.4350>3. se rechaza la hipótesis y la conclusión es consistente en ambos procedimientos.Estadística No Paramétrica. V. o12 ) = ⎝ ⎠⎝ ⎠ = 0. eia = A nj N e jb = n j − e ja Con las frecuencias esperadas y observadas se calcula la estadística de prueba W cuya distribución se aproxima a una Ji cuadrada con k-1 grados de libertad. Prueba de la Mediana _______________________________________ Si se procede con la prueba exacta de Fisher para el cálculo de la probabilidad.. se deben calcular las frecuencias esperadas en cada celda del renglón superior (a) y celda del renglón superior (b).00440314 ⎛ 39 ⎞ ⎜ 18 ⎟ ⎝ ⎠ Como la probabilidad calculada es sensiblemente menor a 0. OIK A O21 n1 O22 n2 …. Los K grupos se pueden esquematizar en la siguiente forma: Grupo 1 Grupo 2 Observaciones Menores a la Mediana Observaciones Mayores o Iguales a la Mediana …. …. W = ∑ (o1 j − e ja ) / e ja + ∑ ((o2 j − n j ) − e jb ) / e jb K 2 K 2 j =1 j =1 La fórmula de cálculo mediante la función de distribución Hipergeométrica Generalizada es la siguiente: 4 . Grupo K Total OII OI2 …. se obtiene: ⎛ 16 ⎞⎛ 23 ⎞ ⎜ 3 ⎟⎜ 15 ⎟ P (o11 . Generalización de la Prueba de la Mediana La prueba de la mediana se puede generalizar a K grupos utilizando para su prueba una función hipergeométrica generalizada o la estadística Ji cuadrada usual en tablas de contingencia. O2K nK B N Total Para aplicar la prueba basada en la Jicuadrada.05. Grupo 1 2 3 4 1 2 83 91 91 90 101 100 78 82 3 94 81 91 81 4 89 83 93 77 5 89 84 96 79 6 96 83 95 81 7 91 88 94 80 8 92 91 81 9 90 89 10 84 Para verificar si existe diferencia atribuible al método de cultivo.. Ejemplo 2 Cuatro diferentes métodos de cultivo de maíz fueron aleatoriamente asignados a 8 diferentes parcelas y los rendimientos por unidad de superficie fueron registrados.... Ha: Al menos un método de cultivo difiere de los restantes Se calcula la mediana común a los 4 grupos y cada observación se compara con ésta para obtener los siguientes resultados..⎜ ⎟ ⎜ o ⎟⎜ o ⎟ ⎜ o ⎟ ⎝ 11 ⎠⎝ 12 ⎠ ⎝ 1k ⎠ P (o11 .. 5 . Observe que las sumas de renglones y columnas coinciden con las correspondientes a frecuencias observadas.. Frecuencias Observadas Grupo 1 Grupo 2 Grupo 3 Grupo 4 Observaciones Menores a la Mediana Observaciones Mayores o Iguales a la Mediana Total 6 3 7 0 16 3 9 7 10 0 7 8 8 18 34 Total A continuación se calculan las frecuencias esperadas y se obtiene la siguiente tabla.Estadística No Paramétrica. o1k ) = ⎛ N⎞ ⎜ ⎟ ⎜A⎟ ⎝ ⎠ VI. se aplica la prueba de la mediana: Ho: Los cuatro métodos tienen la misma mediana de rendimiento. Prueba de la Mediana _______________________________________ ⎛ n1 ⎞⎛ n2 ⎞ ⎛ nk ⎞ ⎜ ⎟⎜ ⎟. o12 .. Si se compara este valor con el correspondiente valor de tablas al 95% y 3 grados de libertad (7. cuyo valor alcanza 17.6536 0.7059 3.2353 4.5497 3.7647 9.3464 8.1691 3.2353 9 10 7 8 18 34 Total Finalmente se obtienen las contribuciones de cada celda al cálculo de la estadística W.2941 3.875 7.Estadística No Paramétrica.81) se concluye que la hipótesis nula se rechaza y por tanto hay evidencia de que la mediana del rendimiento de los métodos de cultivo difiere sustancialmente.11111 17. Prueba de la Mediana _______________________________________ Frecuencias Esperadas Grupo 1 Observaciones Menores a la Mediana Observaciones Mayores o Iguales a la Mediana Grupo 2 Grupo 3 Grupo 4 Total 4.54.7059 3.7647 5.38889 1.7353 0. Contribuciones a la estadística W Grupo 1 Grupo 2 Grupo 3 Grupo 4 Observaciones Menores a la Mediana Observaciones Mayores o Iguales a la Mediana Total 0.6184 4.2875 0.16806 7.2941 3.5431 Total 6 .7059 4.25556 1.7647 16 4. . X1n1 X21 X22 . La prueba de Kruskal-Wallis es recomendable para aquellos problemas en los que los supuestos de normalidad u homogeneidad de varianzas no se cumplen adecuadamente y por lo tanto. .. como es el caso de la prueba antes mencionada. En el año de 1952 Kruskal y Wallis propusieron un equivalente no paramétrico a la prueba F empleada en el análisis de un criterio de clasificación. . Desde el punto de vista de la potencia se le asigna 95.k) no necesariamente iguales. X2n2 . emergen como una fuente limitante en la aplicación de la prueba F.Estadística No Paramétrica...5% relativa a la F. . . La prueba que desarrollaron se presentó como una extensión a k muestras independientes de la prueba U de Mann y Whitney para dos muestras independientes y fue identificada a partir de entonces con los nombres de sus autores. sin embargo.. Introducción.. la prueba de Kruskal-Wallis incorpora más información ya que toma en consideración los rangos de las observaciones y no solamente la posibilidad de que éstos sean inferiores o superiores a la mediana. Xknk Los supuestos básicos que sustentan la prueba son: a) Las k muestras son aleatorias b) Las k muestras son independientes c) Las variables observadas son continuas d) La escala de medición es al menos ordinal 1 . Prueba de Kruskal Wallis __________________________________ ANALISIS DE LA VARIANZA POR RANGOS DE KRUSKAL WALLIS I.2. Los datos consisten de k muestras independientes de tamaños (ni...... . por lo que se le puede considerar bastante confiable. .. . ... X2n2 Muestra k Xk1 Xk2 .. .. Otra prueba no paramétrica con la cual se puede resolver el mismo problema es la extensión de la prueba de la mediana para k grupos independientes.. i=1. los cuales se pueden esquematizar en la siguiente forma: Muestra 1 Muestra 2 X11 X12 . . Estadística No Paramétrica. primero con referencia a la distribución. Prueba de Kruskal Wallis __________________________________ II. Estos empates o ligas pueden dar lugar a ciertas perturbaciones. La Hipótesis Las hipótesis nula y alternativa se plantean en dos formas opcionales. k Ri2 12 H= ∑ − 3( N + 1) N ( N + 1) i =1 ni Donde k Número de grupos Tamaño de la i-ésima muestra k ni N = ∑ ni i =1 Total de observaciones Ri = ∑ Rij Suma de rangos del grupo i-ésimo j =1 ni La significancia de un valor calculado de H se verifica mediante tablas de Jicuadrada. Ho: Las distribuciones de las k poblaciones son idénticas H1: Al menos una de las k distribuciones es diferente Con referencia a las medianas ya que la prueba es sensible a sus diferencias Ho: Las medianas de las k muestras son iguales H1: De las k poblaciones al menos una tiene la mediana diferente III. En el procedimiento de cálculo de la estadística de prueba se sustituyen los valores Xij por sus rangos correspondientes (Rij) al tomar en consideración todas las observaciones en forma simultánea. La aproximación es mejor a medida que se dispone de tamaños de muestra más grandes. la estadística de prueba sigue una distribución aproximada a la Ji-cuadrada con k-1 grados de libertad. Cuando ocurre que dos o más observaciones tienen el mismo valor se asigna a cada una de ellas el promedio de los rangos que les corresponderían. La Estadística de Prueba Designada por H. pero para los casos k ≤ 3 y ni ≤ 5 se aconseja el empleo de valores tabulados. razón por la cual se 2 . 74 7.70 7.74 7.78 7.81 7.71 7. excepto en la laguna número 3.69 7. Ejemplo Un especialista en limnología pretende establecer si hay diferencia en el PH del agua de 4 lagunas. 1− ∑T N3 − N Donde T = t 3 − t (t es el número de observaciones con los mismos puntajes) IV. Prueba de Kruskal Wallis __________________________________ recomienda introducir un factor de corrección.73 7. el cual consiste en dividir H entre la siguiente expresión.85 7. Ho: El PH es el mismo en los 4 lagos H1: El PH es diferente en los 4 lagos El nivel de significancia de la prueba es de α=0.84 7.78 7. para ello tomó series de 8 muestras en cada lago.75 7.68 7. en la cual tomo 7 muestras.80 7. los rangos que se les asigna quedan como sigue 3 .77 7.76 7.Estadística No Paramétrica.91 n1=8 n2=8 n3=7 n4=8 Una vez que se mezclan y ordenan las observaciones de los 4 grupos.70 7.71 7.74 7.73 7.71 7.78 7.80 7.81 7.87 7.72 7.81 7.79 7.05 PH PH PH PH LAGO 1 LAGO 2 LAGO 3 LAGO 4 7.73 7. Se utilizará la prueba de KruskalWallis para probar la hipótesis.74 7. 5 ** 23.815.378 El valor de tablas de Ji-cuadrada con 3 grados de libertad y 0.5 (*) Rangos ligados N=8+8+7+8=31 H= k Ri2 12 ∑ − 3( N + 1) N ( N + 1) i =1 ni ⎡ 932 94. 4 .95 es de 7.5 143 Rangos LAGO 4 6 ** 6 ** 13.Estadística No Paramétrica.5 ** 3.7336 Número de grupos de rangos ligados m=7 ∑ T = ∑( t = 168 3 i − ti ) ºe11 = ( 2 3 − 2) + ( 33 − 3) + ( 33 − 3) + ( 4 3 − 4) + ( 33 − 3) + ( 2 3 − 2) + ( 33 − 3) La H corregida tiene el valor Hc = 1− H ∑T = N3 − N 7. Prueba de Kruskal Wallis __________________________________ Rangos LAGO 1 1 3.5 ** 16 6 ** 18 10 ** 20 ** 13.336 168 1− 3 31 − 31 Hc = 7.52 1432 165.5 ** 22 28 29 30 31 165.5 ** 26 ** 20 ** 26 ** 26 ** 94.52 ⎤ 12 = + + + ⎢ ⎥ − 3( 31 + 1) 31(31 + 1) ⎣ 8 8 7 8 ⎦ = 7.5 ** 8 10 ** 10 ** 17 20 ** 23.5 ** 93 Rangos Rangos LAGO 2 LAGO 3 2 13.5 ** 13. por lo tanto Ho no se puede rechazar. .. Para el caso del análisis de la varianza con dos criterios de clasificación sin interacciones. la Xij observación de la tabla (i-ésimo bloque.. como es el caso de la normalidad y homocedasticidad. Los renglones representan bloques o sujetos y las columnas tratamientos. ... Friedman propuso una prueba no paramétrica que ha sido probada con excelentes resultados. . Con frecuencia la distribución de la variable en estudio o limitaciones en los dispositivos de medición dan lugar a severos desvíos en los datos con relación a las hipótesis de trabajo que sustentan el análisis clásico de la varianza.. . introduccion. . .n) del j-ésimo tratamiento (j=1. R nk ( k + 1) 2 Bloques 42 . Estos desvíos pueden inducir al investigador a llegar a conclusiones equivocadas en las pruebas de hipótesis mediante la F de Snedecor. . .k). n Rn1 Rn2 ..2.. . .. La suma de los rangos de cualquier renglón será por ser la sima 2 de los primeros k naturales.. Los datos pueden adoptan la siguiente forma tabular Tratamientos 1 2 . .PRUEBA DE FRIEDMAN PARA ANALISIS DE LA VARIANZA CON 2 CRITERIOS DE CLASIFICACION I. . R2k k ( k + 1) 2 . j-ésimo tratamiento) es sustituida por el rango que corresponde dentro del renglón. Así Rij es el rango de la observación correspondiente al i-ésimo sujetos o bloque (i=1. II Datos.. . . . . . Los datos se organizan en una tabla de doble entrada con n renglones y k columnas.2. . .. . . . k 1 R11 R12 . Se denotará por Rj la suma de los rangos de la j-ésima k ( k + 1) columna.. Rnk k ( k + 1) 2 R1 R2 ... . R1k k ( k + 1) 2 2 R21 R22 ... a pesar de la conocida robustez de esta prueba. . . Los supuestos básicos que permiten el empleo de la estadística de Friedman son los siguientes: a) Las observaciones independientes. = Rk H1: Los rangos asignables a las observaciones de un bloque cualquiera tienen mayor probabilidad de ser distintos para cierto tratamiento. H1: Rj ≠ Rj´ ∀ j ≠ j´ IV. Ho: R1 = R2 = . . se distribuye aproximadamente como una Ji-Cuadrada con k-1 grados de libertad y tiene la siguiente expresión: K 12 T= ∑ R 2j − 3n( k + 1) nk ( k + 1) j =1 Donde n K Rj Tamaño de muestra en cada tratamiento Número de tratamientos Suma de rangos del tratamiento j 43 . . La estadistica de prueba La estadística T propuesta por Friedman. de los diferentes bloques (renglones) son b) Las observaciones de diferentes columnas están relacionadas por algún criterio de asociación o apareamiento. permite determinar si existen diferencia significativa entre las sumas de los rangos de los k tratamientos. III La hipótesis Ho: Los rangos asignables a las observaciones de un bloque cualquiera son igualmente probables para todos los tratamientos. 1 3. V. A cada uno de los cuatro cerdos le fue asignado una dieta. La información registrada fue la ganancia de peso medida en Kg.4 1.0 3. Ho: La ganancia de peso es la misma para las cuatro dietas. la cual se denotará por W. Ejemplo Se realizó un experimento con cerdos de guinea para probar 4 tipos de dieta.815 lo que permite rechazar la hipótesis Ho.5 4 1.5 1.1 2.4 2 2.0 2. los criterios de bloqueo fueron dados por las condiciones de laboratorio. ya que si la T excede en 1-α un cuantil.3 1.4 1. H1: La ganancia de peso no es la misma para las cuatro dietas.3 3 2.2 1. La estadística W mide el grado de concordancia en términos de rangos entre los n bloques.3 1.9 2. La fórmula de la W de Kendall en términos de la T de Friedman es la siguiente: W= T n( k − 1) Cualquier hipótesis a probar mediante la W puede ser probada mediante la T.7 2.1 1. en un periodo de una semana.V. entonces W excede también en 1-α su propio cuantil.521 44 .5 La estadística T calculada tiene un valor de 7. Se establecieron 5 bloques de 4 animales cada uno.0 1.05 Bloque 1 2 3 4 5 1 1.4 2. El valor del coeficiente de concordancia de Kendall es de W=0.2 2. α=0. Relacion de la estadistica t de Friedman con el Coeficiente de Concordancia de Kendall Kendall y Babington introdujeron en 1939 en forma independiente una estadística llamada coeficiente de concordancia. Regla de decisión. Datos: La muestra consiste de n observaciones independientes que constituyen una muestra de una variable aleatoria agrupada en c clases. Los números de observaciones en las c clases se presentan en forma de una tabla con 2xc celdas y una columna adicional para las estadísticas de prueba. El investigador debe calcular esas frecuencias esperadas a partir de la función de distribución del modelo. 1 .Estadística No Paramétrica. ∞) Ha: F(x) ≠ F*(x) para al menos un valor de x Estadística de Prueba Sea T la estadística de prueba en donde las Ei. Ho: F(x) = F*(x) para toda x ∈ ( −∞. Fue propuesta por Karl Pearson y se basa en la comparación de frecuencias observadas y esperadas de acuerdo al modelo probabilístico seleccionado. La hipótesis Ho se rechaza para un nivel de significancia α% si P(T> t) ≤ α donde t es el percentil correspondiente a la distribución Ji cuadrada. Prueba Ji Cuadrada de Bondad de Ajuste _______________________ Prueba de Bondad de Ajuste Ji cuadrada Es una de las pruebas más populares para verificar el ajuste de una serie de datos a una distribución teórica. Oi representan frecuencias esperadas y observadas respectivamente. T=∑ i =1 C (Oi − Ei )2 Ei La estadística de prueba sigue una distribución aproximada por una Ji8 cuadrada con c-k-1 grados de libertad. Hipótesis: Sea F(x) la distribución que caracteriza a los datos y sea F*(x) la distribución propuesta por el investigador. Las observaciones (frecuencias observadas) se asocian celda a celda con el número de observaciones que cabría esperar si hubieran sido originadas por el modelo probabilístico. en donde k es el número de parámetros estimados a partir de los propios datos. 4978672 48 42.236223 0.132876 0.000000 3.0 0. Prueba Ji Cuadrada de Bondad de Ajuste _______________________ Ejemplo Un producto se presenta en cajas con 12 unidades y se tiene la experiencia de que la probabilidad de falla es 0.….068719 0.3 0.44486179 El valor de la estadística Ji cuadrada es 3.0572992 8 8.5 y n=12.5 0.2. 2 .9 0.0000946 5 2.053150 0.206158 0.019405 1.9 0.9 0. ⎛n⎞ P(X = x) = ⎜ ⎟ P x (1 − P) n− x ⎜ x⎟ ⎝ ⎠ para x=0.1.283468 0.4995200 150 150 1.4484.2487 y por lo tanto la hipótesis nula no se rechaza y se concluye que los datos se ajustan razonablemente a una Binomial con los parámetros propuestos. Se tomó una muestra de 150 cajas de la producción para contar el número de unidades defectuosas en cada caja..n AJUSTE DE DISTRIBUCION BINOMIAL 60 50 40 30 20 10 0 Frecuencia Observada Frecuencia Esperada 0 1 2 3 4 5 6 o Más Resumen de Cálculos Número de Defectuosos 0 1 2 3 4 5 6 Frecuencia Frecuencia Probabilidad de Ji Cuadrada Observada Esperada Defectuoso 8 10. La probabilidad de obtener ese valor o mayor para una Ji cuadrada con 7-1=6 grados de libertad es 0.7062169 33 35.2.5167387 27 30.Estadística No Paramétrica.1671252 21 19. Con los datos se pretende ajustar una distribución Binomial con parámetros P=0.4 0. X2.. . La forma lógica de comparación de la muestra aleatoria con la distribución propuesta F(x) es su distribución empírica S(x).. Hipótesis: a) Dos colas Ho: F(x) = F*(x) para toda x ∈ ( −∞. mientras que la Ji-cuadrada asume que el número de observaciones es suficientemente grande. porque la prueba de Kolmogorov es exacta.. aun para muestras pequeñas.Estadística No Paramétrica. ∞) Ha: F(x) ≠ F*(x) para al menos un valor de x 1 . El problema reside entonces en determinar el tipo de prueba que mida la discrepancia entre S(x) y F*(x). Kolmogorov sugirió tomar como base la mayor distancia entre ambas funciones como se ilustra en la gráfica siguiente: La prueba de Kolmogorov puede ser preferida sobre la Ji-cuadrada para bondad de ajuste si el tamaño de muestra es pequeño. Datos: Una muestra aleatoria X1. Una prueba de bondad de ajuste usualmente envuelve el análisis de una muestra aleatoria de alguna distribución desconocida con objeto de probar la hipótesis nula de que la distribución desconocida F(x) es de hecho conocida y corresponde a una distribución específica. Prueba de Kolmogorov Smirnov_______________________________ Prueba de Bondad de Ajuste de Kolmogorov Smirnov Esta prueba fue introducida por Kolmogorov en 1933 como una alternativa a la prueba basada en la Ji-cuadrada. Esto es la hipótesis nula define una distribución F*(x). Xn que se supone asociada con una distribución F*(x). . nuestro ficticio investigador decide tomar fotografías de cada uno de diez sujetos negros. la 2 . por medios experimentales.Estadística No Paramétrica. X2. El fotógrafo obtiene cinco copias de cada fotografía. ∞) Ha: F(x) < F*(x) para al menos una X c) Una cola Ho: F(x) = F*(x) para toda x ∈ ( −∞. la observación sociológica de que los negros americanos parecen tener una jerarquía de preferencias entre distintos matices de piel. Prueba de Kolmogorov Smirnov_______________________________ b) Una cola Ho: F(x) = F*(x) para toda x ∈ ( −∞. T1(+) ó T1(-) excede el valor del cuartil (1-α)%. Ejemplo (Sidney Siegel). Xn. de la más obscura a la más clara. la cual se define: a) Sea T1 la mayor distancia vertical entre S(x) y F*(x) T1 = Sup x F * ( x ) − S ( x ) b) Sea T1(+) la mayor distancia vertical positiva con F*(x) por arriba de S(x). Para probar cuán sistemáticas son las preferencias de los negros por el tono de piel. así. La estadística de prueba para cada tipo de hipótesis es T1. Supongamos que un investigador está interesado en confirmar.. cada copia ligeramente diferente de las otras en cuanto a la obscuridad. la fotografía que presenta el color de la piel más oscuro recibe el rango 1. T1 (+ ) = Sup x ( F * ( x ) − S ( x )) c) Sea T1(-) la mayor distancia vertical negativa con F*(x) por abajo del S(x).. Se rechaza Ho al nivel de significancia α% si la estadística T1 . las cinco copias pueden obtenerse según el color de la piel. T1 (− ) = Sup x ( F * ( x ) − S ( x )) Regla de decisión. ∞) Ha: F(x) > F*(x) para al menos un valor de x Estadística de Prueba Sea S(x) la distribución empírica basada en la muestra X1. . Sean α=0. I Hipótesis nula: Ho: no hay diferencias entre el número esperado de elecciones para cada uno de los cinco negros y las diferencias observadas son meramente variaciones casuales esperadas en una muestra aleatoria proveniente de una población rectangular donde f1=f2=.. su propia fotografía.01.. Supongamos que un sujeto escoge la impresión 2 (la siguiente a la más oscura). En este estudio hipotético. Consiste en todos los valores de D son tan grandes que la probabilidad asociada con su ocurrencia conforme a Ho es igual o menor que α=0. como se ha supuesto. y así sucesivamente hasta la más clara.f5. IV. Distribución muestral. Región de rechazo. III.. la prueba de una muestra de Kolmogorov-Smirnov se escoge porque el investigador dese comparar una distribución de puntajes observados en una escala ordinal con distribución teórica.. V. junto con sus probabilidades asociadas de ocurrencia conforme a Ho. VI. entonces los sujetos consistentemente mostrarán preferencias a uno de los rangos extremos.=f5. Prueba de Kolmogorov Smirnov_______________________________ siguiente oscuridad el 2. Si el matiz de la piel es importante. Nivel de significancia.. La tabla siguiente muestra los datos y los muestra en la forma apropiada para aplicarlos a la prueba de una muestra de KolmogorovSmirnov. Después se le pide a cada sujeto que escoja. cada sujeto escoge una de las cinco impresiones de la misma fotografía. cinco sujetos escogen la impresión 4 (la siguiente a la más clara) y cuatro sujetos escogen la impresión 5 (la impresión más clara).f2. las fotografías de cada rango a menudo serán escogidas igualmente. Prueba estadística.Estadística No Paramétrica. no son todas iguales. que recibe el rango 5.. Decisión.01 y N (el número de sujetos negros que sirvieron como tales en el estudio)=10. 3 . II. diferentes valores críticos de D de la distribución muestral se presenta en la tabla de valores críticos de D para la prueba de una muestra de Kolmogorov-Smirnov. exceptuando las diferencias aleatorias. de entre las cinco impresiones. Si el matiz de la piel no es importante para los sujetos. H1: las frecuencias f1. 2 1. Resumen del procedimiento.6 0.3 3 0 0.500.1 0. S10(x) es la distribución acumulativa de las elecciones observadas de los 10 sujetos.0 0. donde Ho supone que cada una de las 5 impresiones recibiría una quinta parte de las elecciones.1 0. Prueba de Kolmogorov Smirnov_______________________________ Tono de piel Número de sujetos que escogieron cada tono Frecuencia Relativa Frecuencia Relativa Acumulada S(x) Probabilidad Teórica Distribución Teórica F(x) F(x)-S(x) 1 0 0.01. Concluimos que nuestros sujetos muestran preferencias significativas entre los colores de piel.0 0. es decir.0 0. Se disponen los puntajes observados en una distribución acumulativa.Estadística No Paramétrica.2 5 4 0.0 0.5 0.8 0.2 .4 1.6 0. Así la primera desviación absoluta es de 0.500 tiene una probabilidad asociada conforme a Ho de p<0. Así la primera desviación absoluta del valor real de la muestra con respecto a su valor esperado tomado comparativamente.2 0. comparando cada intervalo de SN(x) con el intervalo correspondiente de Fo(x).4 0.0 0. Se muestra que para N=10. En el cálculo de la prueba de Kolmogorov-Smirnov se siguen estos pasos: 1. Se especifica la función acumulativa teórica. La inspección del último renglón de la tabla señala que la T máxima es 0.2 0. la distribución acumulativa esperada conforma a Ho.5 4 5 0.2 0. En vista de que p asociada con el valor observado de T es menor que α=0. 2.2 0.0 Nótese que Fo(x) es la distribución acumulativa teórica conforme a Ho. En el último renglón de la tabla encontramos la desviación absoluta del valor real de la muestra con respecto a su valor esperado tomado comparativamente.2 0. nuestra decisión en este estudio es rechazar Ho a favor de H1. se sustrae SN(x) de Fo(x) 4 .2 2 1 0.01. 3. En cada peldaño de las distribuciones acumulativas.1 0. T≥0. 10 y 0. Prueba de Kolmogorov Smirnov_______________________________ 4. no pierde necesariamente información al combinar categorías.01. porque las frecuencias esperadas son solamente 2 cuando N=10 y k=5. la prueba Χ2 es definitivamente menos poderosa que la de Komogorov-Smirnov.05. Cualquier elección de un sujeto es simplemente clasificada como inclinación al tono de piel claro u obscuro. las gradaciones más finas serán ignoradas. Estos hechos sugieren que la prueba de Kolmogorv-Smirnov puede en todos los casos ser más poderosa que su alternativa. Χ2 (no corregida por continuidad)=3. así. Esto es. Nótese que la p encontrada con la prueba Kolmogorov-Smirnov es menor que 0. Esta diferencia nos da alguna indicación de la potencia superior de la prueba Kolmogorov-Smirnov. Además. Un nuevo análisis mediante la prueba Χ2 de los datos del ejemplo anterior destaca la potencia superior de la prueba de Kolmogorov-Smirnov. Si esa p tiene un valor igual o menor que α. cuando gl=k1=1.2) 1 Clara (rangos 3.Estadística No Paramétrica. las categorías adyacentes deben combinarse antes de que Ji-cuadrada pueda calcularse apropiadamente. la prueba Χ2. Tenemos que combinar las categorías adyacentes para incrementar la frecuencia esperada por celdilla. sin embargo. Este valor de p no nos permite rechazar Ho. a diferencia de la prueba Ji-cuadrada para una muestra. Se desea verificar que la población de donde proviene la muestra se distribuye normal. 5 . la de Kolmogorov-Smirnov sí lo es. la prueba Χ2 no es aplicable en modo alguno. 0. Se muestra que la probabilidad asociada con la ocurrencia conforme a Ho de ese valor.05.10>p>0. En la norma en que los datos están presentados en la tabla de preferencias hipotéticas.05. En la tabla de Kolmogorov se encuentra la probabilidad (de dos colas) asociada con la ocurrencia conforme a Ho de valores tan grandes como el valor observado de D. Oscura (rangos 1. lo que nos lleva al análisis de dos categorías que aparecen en la tabla siguiente. Cuando las muestras son pequeñas y. Ejemplo 2 Supongamos que se toma una muestra de 90 costales de un cargamento de azúcar. Χ2 no puede calcularse. por consiguiente.4) 9 Total Frecuencia de Elección 10 Para estos datos. al nivel 0. Potencia La prueba de una muestra de Kolmogorov-Smirnov trata las observaciones individuales separadamente y. y desviación estándar. está entre 0.01 de significación. se rechaza Ho. mientras la de la prueba Χ2 es mayor que 0.75. Se supone que el peso de los costales se distribuye normal con media 50 Kg. para muestras muy pequeñas. 6 46.3 48.0253219 0.5 En este caso el procedimiento se aplica para los datos en forma agrupada.36/raíz(90)= 0.0302336 0.0109706 ‐0.7 49.1 50.3 49.9888889 0.5 53.0 49.0331928 y en valor absoluto T (Abs) =0.3 51.5 51.5 47.0222222 0.3 45.0196486 6 .2 50.0196486.0331928 ‐0.9 47. para ello se construye una tabla de frecuencias con los 90 datos.1 52.5 53.3 49.5 48.9 48.2 51.1 48.1 50.3 51.1 49.9 50.0222222 0. Para la referencia de cálculo se tomó el límite superior de cada clase.4 50.0005279 ‐0.0062097 ‐0.6 48.8413447 5 0.1000000 0.0331928.1586553 9 0.1 51.8 51.7 53.5 52.9 47.8 52.4 46.8 46.4 50.5 49.6 50.7 48.1888889 0.4 52.7 51.6914625 17 0. relativas acumuladas (S(x)) y las probabilidades acumuladas correspondientes a la función de distribución normal correspondietnes a una media 50 y desviación estándar 2.0 47.3 49.0331928 0.9222222 0.7 51.5 49.000000 Min Max F(x)‐S(x) ti 0.9 49.8 51.8 46.3 50.8666667 0.1 51.0196486 0.Estadística No Paramétrica.0668072 8 0.0000000 0.5000000 0.4 50.6 49.0 45.0111111 1.6 51.9 50.9 49.8 53.6 47.8 50. Prueba de Kolmogorov Smirnov_______________________________ Ho: La población se distribuye normal con media 50 y desviación estándar 2 H1: La población No se distribuye normal con media 50 y desviación estándar 2 51.6777778 0. valor que permite no rechazar la hipótesis nula pues el valor de tablas para 5% es 1.2 52. La estadística T(+) = 0.9331928 6 0.0136847 ‐0.6 49.9 53.0 49.0888889 0.5 47.4 50.9 50.0 49.8 48.4 46.1888889 0.6 52.0116390 ‐0.9 48.3 50.4 52. la T(-) = 0.5 49.5 47.0227501 7 0.2 50.9 46.1777778 0.2 51.1000000 0.7 50. Posteriormente se calculan las frecuencias relativas.9 46.0666667 0.6 51.5 50.7 47.1 50.9 51.0 54.3 48.9772499 1 0.1433 y se considera que los datos muy probablemente proceden de una Normal con media 50 y desviación estándar 2.0000000 0.6 51.5000000 16 0.9937903 90 1.2111111 0.0555556 0.3085375 19 0.4 49.0777778 0.5 53. Límite de Clase Inferior Superior 45 46 46 47 47 48 48 49 49 50 50 51 51 52 52 53 53 54 54 55 Frecuencia Probabilidad Absoluta Relativa Acumulada S(x) Normal Acum F(x) 2 0.2888889 0. 60 0. Prueba de Kolmogorov Smirnov_______________________________ En la siguiente gráfica se observan las funciones F(x) y S(x) para el ejemplo de ajuste a una distribución normal.80 0. Funciones F(x) y S(x) datos Normal 1.20 0.00 44 46 48 50 52 54 56 Límite Superior de Clase S(x) F(x) 7 .20 1.40 0.00 0.Estadística No Paramétrica. X2.. Prueba de Lilliefors ________________________________________ Prueba de Bondad de Ajuste de Lilliefors para Normalidad I Introducciòn Esta prueba fue introducida por Hubert Lilliefors en 1967 ("On the Kolmogorov– Smirnov test for normality with mean and variance unknown". µ=x= ˆ 1 n ∑ xi n i =1 σ2 = ˆ 1 n 2 ∑ ( xi − x ) n − 1 i =1 A continuación los datos se estandarizan Zi = xi − x σ ˆ Ho: la muestra aleatoria procede de una distribución Normal Ha: La muestra no procede de una problación normal. . Se obtiene en forma análoga a la prueba de Kolmogorov y Smirnov la diferencia entre S(x) y F*(x) donde esta última corresponde a una normal estándar. Se supone que se desconocen la media y la varianza de la población y estos parámetros se deben estimar a partir de los propios datos. III Estadística de Prueba.Estadística No Paramétrica. II Datos: Una muestra aleatoria X1..) Es unja variación de la prueba de Kolmogorov y Smirnov específica para probar normalidad de la distribución de los datos de una muestra. 62.. Vol. 1 . Journal of the American Statistical Association. Xn que se supone asociada con una distribución F*(x). 2 . T1(+) ó T1(-) excede el valor del cuartil (1-α)%. V Ejemplo Se tiene una muestra de 100 paquetes de café con la leyenda “500 g. .. T1 (− ) = Sup x ( F * ( x ) − S ( x )) IV Regla de decisión.. Xn. 487 515 497 490 501 509 497 502 506 486 490 487 502 492 509 521 512 489 495 494 511 496 493 513 507 504 489 516 503 485 509 511 490 499 511 499 485 507 513 493 501 511 494 514 502 522 496 512 487 515 498 502 503 504 506 500 487 505 496 508 519 498 509 474 519 501 523 481 504 508 486 493 508 496 507 497 508 499 499 494 497 503 498 512 503 492 509 500 496 517 La media artimética de los datos es 501. Se rechaza Ho al nivel de significancia α% si la estadística T1 . X2. La estadística de prueba para cada tipo de hipótesis es T1.103 g. Prueba de Lilliefors ________________________________________ Sea S(x) la distribución empírica basada en la muestra X1.Estadística No Paramétrica.42 g y la desviación estándar 10. la cual se define: a) Sea T1 la mayor distancia vertical entre S(x) y F*(x) T1 = Sup x F * ( x ) − S ( x ) b) Sea T1(+) la mayor distancia vertical positiva con F*(x) por arriba de S(x). contenido neto” y en una prueba de control de calidad se midió el peso preciso y además se pretende verificar que los datos se distribuyen normalmente. Se procede a continuación a estandarizar los datos para tener una variable con media 0 y varianza 1. T1 (+ ) = Sup x ( F * ( x ) − S ( x )) c) Sea T1(-) la mayor distancia vertical negativa con F*(x) por abajo del S(x).. 5367 ‐0.2398 ‐0.03919 3 .07671 ‐ 0.2398 S(z) 0.1444 0.01338 0.2556 0.6255 ‐1.4111 0.131 ‐ 0.626 0.8337 ‐0.255 0.834 ‐ 0.0214 ‐1.3556 0.651 1.4275 ‐1.5367 ‐0.042 0.23127 ‐ 0.7347 ‐0.552 1.4333 0.2222 F(z) T(z) 0.00685 0.03440 0.29574 0.245 0.1000 0.1306 ‐1.00426 0.26249 ‐ 0.01280 0.5265 ‐1.047 0.948 ‐ 0.01037 0.00585 0.29574 ‐ 0.29574 ‐ 0.0889 0.01998 i 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 Zi ‐0.5367 ‐0.750 0.02162 ‐ 0.3778 0.1755 ‐ 0.428 1.00887 0.453 ‐ 0.4444 F(z) T(z) 0.02391 0.057 ‐ 0.3674 ‐ 0.2296 ‐1.339 0.02649 0.20224 ‐ 0.02476 0.438 0. Posteriormente se calculan las probabilidades asociadas a los valores de Z mediante una normal estándar F(zi)=P(Zi≤zi).00323 0.834 1.8337 ‐0.5367 ‐0.3111 0.01696 0.01869 0.2667 0.146 0.156 ‐ 0.2333 0.0778 0.6357 ‐0.12911 ‐ 0.141 ‐ 0.1333 0.40526 ‐ 0.438 ‐ 1.3387 ‐0.057 2.131 ‐ 1.537 0.735 1.33079 ‐ 0.40526 ‐ 0.3674 ‐ 0.735 ‐ 0.0222 0.438 0.06344 ‐ 0.Estadística No Paramétrica.01796 0.7143 ‐2.05203 0.01365 0.141 ‐ 1.4275 ‐1.3889 0.00107 0.948 ‐ 0.1755 ‐ 0.136 ‐ 2. T(-) y T(+).1889 0.03260 0.6255 ‐1.20224 ‐ 0.2398 ‐0.255 ‐ 1.23127 ‐ 0.735 0.5367 ‐0.12911 ‐ 0.042 0.00061 0.4377 ‐0.3667 0.0333 0.537 1.40526 ‐ 0.0556 0.2398 ‐0.4275 ‐1.01533 0. Prueba de Lilliefors ________________________________________ ‐ 1. i 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Zi ‐2.834 0.344 ‐ 0.714 1.9326 ‐0.01538 0.537 1.240 ‐ 0.428 0.3387 ‐0.3444 0.3000 0.0111 0. Finalmente se obteienen las diferencias y se identifican los valores de T.037 ‐ 0.750 ‐ 0.2778 0.4222 0.230 1.02329 0.240 ‐ 0.651 ‐ 0.626 0.240 0.750 1.527 ‐ 0.8337 S(z) 0.5265 ‐1.230 ‐ 0.2889 0.339 0.933 0.1306 ‐0.10943 ‐ 0.542 A continuación se utilizará un procedimiento sin agrupar para obtener la función de distribución empìrica S(z) y que consiste en ordenar las observaciones Z de menor a mayor y asignar el valor de orden i/n de tal suerte que a la n-esima observación ordenada le corresponde 1.042 2.40526 ‐ 0.02149 0.00206 0.651 ‐ 0.1111 0.057 0.740 ‐ 0.4377 ‐0.00758 0.0444 0.3222 0.255 0.443 0.12911 ‐ 0.02428 0.552 ‐ 0.00788 0.00254 0.06344 0.29574 ‐ 0.01218 0.00224 0.240 ‐ 1.948 ‐ 1.428 1.3333 0.2444 0.537 0.344 ‐ 0.537 ‐ 0.23127 ‐ 0.354 ‐ 0.3387 ‐0.07671 ‐ 0.651 ‐ 1.33079 ‐ 0.00227 0.07671 ‐ 0.3674 ‐ 0.156 ‐ 0.339 1.047 ‐ 1.740 ‐ 0.2000 0.1667 0.9326 ‐0.0667 0.02644 0.7347 ‐0.33079 ‐ 0.07671 ‐ 0.131 ‐ 0.021 0.4377 ‐0.636 ‐ 0.33079 ‐ 0.00418 0.156 0.03755 0.10943 ‐ 0.00332 ‐ 0.047 ‐ 1.428 0.156 ‐ 1.938 1.1778 0.1556 0.1306 ‐1.4275 ‐1.00779 0.527 ‐ 1.438 0.552 0.4377 ‐0.750 ‐ 0.03587 0.4000 0.948 ‐ 0.750 ‐ 2.057 0.453 ‐ 1.933 0.7347 ‐0.1222 0.146 ‐ 0.2296 ‐1.20224 0.01317 0.05203 0.02807 0.2111 0.29574 0. 1408 ‐0.93845 ‐ 0.70956 0.70956 0.00439 0.6007 ‐ 0.01170 0.6556 0.00505 0.6000 0.01921 0.00310 0.45312 0.65108 S(z) 0.70956 0.7556 0.00410 0.73989 1.8333 0.91052 ‐ 0.48333 ‐ 0.01169 0.01421 0.44402 ‐ 0.9000 0.042894.15617 0.5667 0.02028149 Las diferencias entre S(z) y F(z) son identificadas: Min Max T abs ‐ 0.7778 0.56205 0.03919 0.75007 0.25515 0.5778 0.85245 0.04289 0.77339 ‐ 0.63838 0.82844 ‐ 0.02067161 0.15617 0.8000 0.00673 0.75007 0.7425 0.14599 1.77339 0.00650 0.8889 0.48333 ‐ 0.7425 0.71111 0.97917 ‐ 0.89343 ‐ 0.02152 0.5228 0.02264 0.7 0.00761 0.9333 0.9667 0.5521 0.97368 ‐ 0.6444 0.95906 ‐ 0.82844 0.44294 1.5333 0.00070 0.03178272 0.00368 0.9889 1.82844 0.5111 0.7425 0.00801 0.24498 1.0418 ‐0.44402 ‐ 0.92548 ‐ 0.75007 0.73989 1.5889 0.5521 0.01153 0.5222 0.8667 0.25515 0.34396 1.03684 2.56205 ‐ 0.25515 0.8111 0.6333 0.00059 0.6222 0.04701 1.98365 ‐ 0.9444 0.45312 0.8444 0.01635 i 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 Zi ‐0.00555 0.54192 1.6007 0.4667 0.9556 0.04701 1.0418 ‐0.00351 0.94803 0.00785 0.00972 0.7889 0.01667 0.75007 0.1408 ‐0.15617 0.48333 0.0313926 0.01053 0.01041 0.67477 0.9778 0.35414 0.15617 0.04701 1.95906 0.85245 ‐ 0.34396 1.5228 ‐ 0.77339 0.0418 0.7333 0.7444 0. se utiliza la fórmula aproximada para un nivel de significancia del 5%: W = 0.4778 0.56205 ‐ 0.67778 0.02844 0.65108 0.6007 ‐ 0.7667 0.042894 Para evaluar la significancia del valor de la estadística de prueba T = 0.886 0.00462 0.94803 0.05719 0.02684 0.77339 0.93785 2.0000 F(z) T(z) 0.03032 0.82844 0.05719 0.8741 ‐ 0.00058 0.5228 ‐ 0.00489 0.886 = = 0.77339 ‐ 0.00917 0.56205 ‐ 0.5521 0.94803 0.01479 0.14599 1.02164 0. Prueba de Lilliefors ________________________________________ i 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 Zi 0.00556 0.65108 0.13582 S(z) 0.8741 ‐ 0.5000 0.65108 0.85245 ‐ 0.9222 0.Estadística No Paramétrica.67477 0.02895 0.8556 0.00599 0.68889 0.8222 0.5556 0.01784 0.6111 0.5228 0.00622 0.9111 0.04289 0.6667 0.093393 como T<W la hipótesis nula no se rechaza 90 n 4 .00657 0.04250371 0.05719 0.91052 ‐ 0.01573 0.4556 0.94803 1.7425 0.75007 0.01733 0.4889 0.72222 F(z) T(z) 0.05719 0.8778 0.01550 0.5444 0. 1.00 0.20 1.60 0. Prueba de Lilliefors ________________________________________ La siguiente gráfica de las funciones S(z) y F(z) permite una apreciación visual del grado de ajuste.20 0.Estadística No Paramétrica.00 S(z) F(z) ‐3 ‐2 ‐1 0 1 2 3 5 .40 0.80 0. Yi ) pueden ser (0. II.1). La prueba de McNemar es equivalente a la prueba de los signos. Yi = 1) − P( X i = 1.Y. (0.. la cual puede en consecuencia. Yi = 0) = 1 2 ∀ i con la alternativa Ha: P( X i = 0. a “favor” o en “contra”. (1.n. Prueba de Mc Nemar __________________________________________ PRUEBA DE Mc MENAR I. en los cuales cada sujeto es su propio control. Yi ) i=1. Los supuestos básicos que permiten la aplicación de la prueba son los siguientes: a) Los n pares ( X i .2. Introducción La prueba de McNemar (Quinn Mc Nemar 1947) para la significancia de los cambios ha sido diseñado para ser utilizada en el tipo de experimentos conocidos popularmente como “antes” y “después”. tomar solamente valores “0” y “1” o ser etiquetado por + ó -. o cero para toda i o positiva para toda i.. Yi = 1) ≠ P( X i = 1. La escala de medición es nominal con dos categorías a las cuales llamaremos “0” y “1”. Yi ) son mutuamente independientes b) La escala de medición es nominal con dos categorías para toda X. cuando esta última se plantea una prueba de hipótesis de dos colas. La Hipótesis La forma usual de plantear la hipótesis nula es la siguiente Ho: P( X i = 0. Yi = 1) = P( X i = 1. Yi = 0) 1 . Entre las aplicaciones más frecuentes de esta prueba se puede mencionar los experimentos cuyo objetivo es la evaluación del efecto de la información en la opinión de la gente. Yi = 0) es negativa para todo i. Por tanto los posibles valores observables para las parejas ( X i ... (1. La prueba es específica para los casos en que las condiciones antes y después son valuadas por variables dicotómicas.0).1).Estadística No Paramétrica. c) La diferencia de las probabilidades P( X i = 0. Los datos consisten en n parejas de observaciones ( X i .0). Si los las frecuencias B+C<25.5 ) T= B+C 2 El número 0. entonces la aproximación a ji cuadrada puede funcionar en forma inadecuada y se debe optar por una prueba exacta mediante la distribución Binomial. La Estadística de Prueba Los valores observados en la prueba de Mc Nemar se suelen presentar en forma de tabla de contingencia 2x2 como a continuación se ilustra. Elección Antes 0 Después 0 Después 1 A Pares (0.1) D Pares (1.5. Las celdas B y C concentran las frecuencias de los pares que presentaron un cambio.0) C Pares (1. ( B − C − . A partir de estas frecuencias se elabora la estadística T. La prueba se reduce a una prueba de los signos.1) B+D Total A+B Antes 1 Total C+D N Las celdas A y D que se considera que no aportan información referente a cambios.Estadística No Paramétrica. En otra forma de interpretación se considera que P(B)=P(C). cuya distribución se aproxima mediante una Ji-Cuadrada con 1 grado de libertad. C ) ∑ x =0 ⎛n⎞ ⎜ ⎟(0. pues corresponden a observaciones ligadas y se eliminan de la prueba.5) n ⎜x⎟ ⎝ ⎠ 2 . P( X ≤ Menor ( B. C) = Menor ( B . con parámetros n=B+C y P=0. ya que se aproxima una distribución discreta a través de una distribución continua como es la Ji-cuadrada.5 dentro del paréntesis permite hacer una corrección por continuidad (Factor de Yates).0) A+C B Pares (0. El número de “éxitos” en la Binomial se toma igual al menor valor entre B y C para obtener la probabilidad de ocurrencia. Prueba de Mc Nemar __________________________________________ III. (0.0) 41. Al concluir el debate 45 estabas a favor de W y 15 a favor de J.(1.(0.0) 27. IV.1) 51.1) 24.0) 11. Con la ayuda de una hoja de càlculo se puede utilizar la distribución binomial.(1.(0.(0.(0. Ejemplo En un debate televisado se presenta dos candidatos W y J. de las 60 personas 50 estabas a favor de W y 10 a favor de J.(1.0) 43.0) 16.(0.0) 58. incluso para n>25.(1.(0.(0. Se desea probar la hipótesis Ho: El debate no tuvo ningún efecto en la opinión del auditorio contra H1: El debate produjo un sensible cambio de opinión en los votantes.(1.(0.0) 56. Se usará un nivel de significancia de α=5% Denotado con cero el voto a favor de W y con uno el voto a favor de J se dan los resultados en la siguiente tabla.(0.1) 59.(0.(0.0) 50. De hecho cambiaron de candidato 15 personas.(0.1) 49.(0.(0.(0.(0.0) 57.(0.1) Tabla de Concentración Posición Antes 0 W Antes 1 J Total Después 1 Después 0 W J 40 5 45 10 5 15 Total 50 10 60 3 .0) 60.(1.0) 2.(0.0) 48.1) 3.(0.(0.(0.1) 28.0) 23.(0.(0.0) 4.(1.0) 37.1) 36.0) 19.(0.1) 9.0) 10.1) 15.(0.0) 5.(0.(1.0) 35.(0.0) 32.0) 54.(0.(0.1) 20. Prueba de Mc Nemar __________________________________________ En una prueba de 2 colas esta probabilidad se duplica.(0.0) 25.0) 31.(1.(0.0) 29. Ello no significa que simplemente cambiaron de opinión 5 personas.(0.(0.1) 52.0) 14.(0. Datos 1.(0.(0.0) 33. De hecho los paquetes estadísticos recurren a esta opción.0) 26.0) 44.0) 7. A un auditorio de 60 personas se les pregunta antes del debate a favor de que candidato estaban.(0.0) 21.0) 18.0) 42.(1.(0.0) 13.0) 53.0) 22.(0.0) 8.1) 55.0) 39.(0.0) 30.(0.1) 46.(0.(0.0) 40.(0.0) 47.0) 12.0) 34.(0.(0.(0.0) 45.Estadística No Paramétrica.0) 38.1) 17.(0.(0.0) 6. Estadística No Paramétrica. Prueba de Mc Nemar __________________________________________ Como la suma B+C= 15 se procede con el cálculo de la probabilidad exacta mediante la Binomial. El menor valor entre B y C es 5. ⎛15 ⎞ P ( X ≤ 5 = ∑ ⎜ ⎟(0.5)15 = 0.1508789 ⎜ ⎟ x=0 ⎝ x ⎠ 5 Al multiplicar por 2 esta probabilidad se obtiene la probabilidad asociada a la prueba de 2 colas P= 0.3017578. Por lo tanto, no se rechaza la hipótesis nula y se concluye que el debate no tuvo un efecto significativo en las preferencias de los electores. Aunque esta conclusión pudiera considerarse muy conservadora en este contexto, si se considera que el candidato J pasó de 10 a 15 votos y el efecto neto le reditúa una ganancia de 5 votos. 4 Estadística No paramètrica. Prueba de Cox y Stuart_____________________________________ PRUEBA DE COX Y STUART PARA TENDENDECIAS I. Introducción La prueba de Cox y Stuart es realmente una aplicación específica de la prueba de los signos para verificar la existencia de tendencias crecientes o decrecientes. Se pude considerar como la alternativa no paramétrica a la prueba sobre el coeficiente del modelo de regresión simple basada en el estadístico t de Student: Ho : β = 0 vs Ha : β ≠ 0 correspondiente al modelo Y = α + β X + ε II. Datos e Hipótesis Sea X1,..., Xn una sucesión de v.a. ordenadas según algún criterio, usualmente el tiempo. Si los Xi están aleatoriamente distribuidos sobre la sucesión, entonces la probabilidad de que una observación supere a otra observación separada k perìodos es ½. En caso de que se presente una tendencia creciente o decreciente, esta probabilidad será diferente de ½. La serie usualmente se divide en 2 segmentos con parejas separadas k perìodos. Si la observación Xi es mayor a la Xi+k se asigna 1 y 0 en otro caso. Ho :P(Xi – Xj < 0 ) = P(Xi – Xj > 0 ) = 1/ 2 para todo i ≠ j. Ha: P(Xi – Xj < 0 ) > P(Xi – Xj > 0 ) si i < j P(Xi – Xj < 0 ) < P(Xi – Xj > 0 ) si i < j. III- Estadística de Prueba Se define a x como el número de parejas etiquetadas con el signo (número 0,1) menos frecuente. Se supone que X se distribuye Binomial con parámetros n=número de parejas y P=0.5. Se obtiene entonces la probabilidad acumulada. Si P(X≤x) es menor o igual al nivel de significancia, se rechaza la hipótesis de tendencia plana. P( X ≤ x) = ∑ t =0 x ( )( ) n t 1 n 2 IV. Ejemplo La organización Federal Crop Insurance Corporation's Annual Report to Congress 1973, contiene la información sobre predios agrícolas asegurados en el período 1948- 1972. Se pretende verificar si los datos presentan una tendencia a la baja. Aplique la prueba de Cox y Stuart con 10% de significancia. Ho; Los datos no presentan una tendencia ascendente o descendente. H1: Los datos presentan una tendencia a la baja. 1 Estadística No paramètrica. Prueba de Cox y Stuart_____________________________________ Año 1948 1949 1950 1951 1952 1953 1954 1955 1956 1957 1958 1959 1960 Asegurados 19,479 26,667 63,969 57,715 18,086 18,434 24,196 19,319 29,975 25,451 20,410 19,910 15,628 Año 1961 1962 1963 1964 1965 1966 1967 1968 1969 1970 1971 1972 Asegurados 25,375 21,312 26,526 24,865 21,152 23,458 25,774 32,646 31,786 24,821 19,593 14,960 Predios Asegurados 70,000 60,000 50,000 40,000 30,000 20,000 10,000 0 1945 1950 1955 1960 1965 1970 1975 Los 25 datos permiten configurar 12 parejas a las cuales se les aplica la regla del signo. Observe que la observación eliminada es la central. Esta práctica no es válida para observaciones mensuales que presentan un patrón estacional. Año 1948 1949 1950 1951 1952 1953 1954 1955 1956 1957 1958 1959 1960 Asegurados 19,479 26,667 63,969 57,715 18,086 18,434 24,196 19,319 29,975 25,451 20,410 19,910 15,628 Año 1961 1962 1963 1964 1965 1966 1967 1968 1969 1970 1971 1972 Asegurados 25,375 21,312 26,526 24,865 21,152 23,458 25,774 32,646 31,786 24,821 19,593 14,960 Signo Valor 0 1 1 1 0 0 0 0 0 1 1 1 6 + + + + + + A continuación se calcula la probabilidad de que x sea menor o igual a 6 considerando una función de distribución Binomial con parámetros P=0.5 y n = 12 La probabilidad calculada es 0.6127, esto lleva a no rechazar la hipótesis de tendencia plana. 2 05371094 0.61279297 0.05371094 0.Estadística No paramètrica.12084961 0.00292969 0.01611328 0.01928711 0.00000000 3 .19335938 0.00000000 P( X ≤ x) 0.12084961 0.80615234 0.38720703 0.92700195 0.98071289 0.01611328 0. Prueba de Cox y Stuart_____________________________________ Valor de x 0 1 2 3 4 5 6 7 8 9 10 11 12 Suma P( X=x) 0.99682617 0.00024414 0.99975586 1.00024414 0.00292969 0.19335938 0.22558594 0.19384766 0.00024414 1.07299805 0.00317383 0. los dos grupos de observaciones son sustituidos por sus respectivos rangos R(x). Si no hay ligas (medidas con el mismo rango) el coeficiente de correlación de Spearman se puede obtener utilizando los rangos en la fórmula del coeficiente de correlación de Pearson. las diferencias positivas se cancelarían con las negativas. Spearman propuso en 1904 la estadística que lleva su nombre. tal forma que las observaciones realizadas sobre los objetivos en estudio se puedan colocar en dos series ordenadas. a los cuales se les han medido dos características X. entre las dos variables se cumplirá R(x)=R(y). el coeficiente de correlación de Spearman. Coeficiente de Correlación de Spearman _____________________ COEFICIENTE DE CORRELACION POR RANGOS DE SPEARMAN I. por lo que parece lógico utilizar las diferencias de rangos di = R(Xi) . mayor será ∑d 2 i . Y.R(Yi) Si se toman solamente tales diferencias para medir la corrección. Esta estadística es una medida de asociación que requiere que ambas variables sean medidas al menos en escala ordinal. Sin embargo. por lo que Γ no puede ser usada para pruebas no paramétricas.. Considere n sujetos.Y).Estadística No Paramétrica. La Estadística. por lo que puede resultar más conveniente tomar sus cuadrados d i2 . R(y). la distribución de Γ depende de la distribución bivariada de (X. II. que se obtiene mediante el coeficiente de la covarianza muestral de las variables de interés entre el producto de sus respectivas desviaciones estándares. El coeficiente de correlación de Pearson se usa con datos numéricos sin ningún requerimiento específico con respecto a la escala y a la distribución subyacente. Si existiera una correlación directa perfecta. Es evidente que cuando mayores (en valor absoluto) sean las di.Y) es el coeficiente de correlación producto momento de Pearson. La fórmula que se deriva para el coeficiente de correlación de Spearman es la siguiente: rs = ∑⎢ R ( X ⎣ i =1 n ⎡ i )− n + 1⎤ ⎡ n + 1⎤ ⎥ ⎢ R (Yi ) − 2 ⎥ ⎦ 2 ⎦⎣ 2 n(n − 1) 2 Sin embargo una forma equivalente que además simplifica mucho los cálculos es 1 . Introducciòn Sin lugar a dudas la estadística más conocida para medir el grado de asociación lineal entre dos variables (X. la expresión utilizada en tal caso es como sigue rs ∑x = 2 + ∑ y 2 − ∑d 2 2 ∑x ∑ y 2 2 Donde n3 − n ∑ x = 12 − ∑ Tx n3 − n ∑ y 2 = 12 − ∑ Ty 2 III. es recomendables especificar en la hipótesis alternativa el tipo de dependencia que se espera detectar. Debido a que el coeficiente de correlación de Spearman puede ser insensibles a ciertos tipos de dependencia. Prueba de Hipótesis El coeficiente de correlación de Spearman es usado a menudo como una estadística de prueba para probar independencia entre dos variables aleatorias. En el caso de que se presenten demasiadas ligas. Coeficiente de Correlación de Spearman _____________________ rs = 1 − 6∑ d i2 n −n i =1 3 n Cuando rs = 1 existe relación directa perfecta entre las dos variables. cuando rs = 1 existe relación inversa perfecta y cuando rs = 0 no existe relación. el cual se calcula para la variable dependiente y la independiente en forma separada. Y son mutuamente independientes (ps =0) Ha: a) Existe una tendencia a que los valores grandes de X se presenten asociados con valores grandes de Y (correlación positiva ps >0) b) Existe una tendencia a que valores grandes de X se presenten asociados con valores pequeños de Y y viceversa (correlación negativa ps <0) 2 . Los enunciados de las hipótesis pueden plantearse en la siguiente forma Ho: Las variables X.Estadística No Paramétrica. es necesario hacer algunas correcciones con el factor de corrección T. t3 − t T= 12 Donde t es el número de observaciones ligadas en un rango dado. Nivel de significancia α=0. por lo que las sumas de los cuadrados corregidas por la presencia de ligas serán. cuando se tienen muestras pequeñas. un grupo de investigadores aplicaron un test para medir grado de condecendencia con el grupo y otro para medir el grado de búsquedad de posición social. 3 . la cual presenta 3 casos de observaciones ligadas (con t=2 observaciones ligadas por caso) en el índice de condecendencia. Cuando n≥10 la significancia de se puede probar mediante la siguiente aproximación a la distribución t de Student propuesta por Kendall t = rs N −2 1 − rs2 La estadística t se distribuye aproximadamente como una t de Student con n-2 grados de libertad. Cuando se dispone de muestras pequeñas n<10 la significancia de una prueba se puede establecer mediante la consulta de la tabla correspondiente. la hipótesis Ho: ps =0 se rechaza en favor de H1: (a ó b consideradas en forma simultánea) si rs excede el cuartil 1-α/2. si para un nivel α la estadística rs excede el cuartil correspondiente a 1-α. La hipótesis Ho: ps =0 se rechaza a favor de H1: (a ó b según sea el caso). Ho: La condecendencia con el grupo y la búsqueda de posición social son independientes (p=0). IV. Se pretende probar la independencia de ambos aspectos mediante el coeficiente de correlación de Separan. En un proyecto cuyo objetivo era investigar el efecto de las presiones del grupo social para crear la conformidad en un individuo sujeto a una situación que involucra riesgo monetario. Coeficiente de Correlación de Spearman _____________________ Los dos incisos considerados en H1 pueden dar lugar a una prueba de dos colas cuando se toman simultáneamente o a pruebas de una cola cuando se toman en forma separada. Ejemplo. H1: Los sujetos con altos índices de condecendencia presentan también altos índices en la búsquedad de posición social (p>0).05 En la tabla anexa se puede observar la asignación de rangos.Estadística No Paramétrica. Para establecer la significancia de una prueba se puede recurrir a la consulta de la tabla de calores críticos. Estadística No Paramétrica. Coeficiente de Correlación de Spearman _____________________ Estudiante A B C D E F G H I J K L Condecendencia (Concesiones) 0 0 1 1 3 4 5 6 7 8 8 12 Indice de Busquedad de Posición Social 42 46 39 37 65 88 86 56 62 92 54 81 Diagrama de Dispersión de Valores Unidades Originales 100 90 80 70 60 50 40 30 20 10 0 0 2 4 6 8 10 12 14 ∑x 2 = n3 − n − ∑ Tx 12 = (12 ) 3 − 12 ⎡ 2 3 − 2 2 3 − 2 2 3 − 2 ⎤ −⎢ + + 12 12 12 ⎥ ⎣ 12 ⎦ = 141 .5 (12 ) 3 − 12 12 = 143 = ∑y 2 = n3 − n − ∑T y 12 ( ∑T y =0 ) 4 . 95 el cual con n=12 tiene un valor de 0.5 12 42 46 39 37 65 88 86 56 62 92 54 81 3 4 2 1 8 11 10 6 8 12 5 9 ‐1.616 Como se deseaba probar Ho: p=0 vs H1:P>0 se consulta en la tabla el cuartil 0.5 5 6 7 8 9 10.5 3 2.25 6.5)(143) = 0.5 1. Coeficiente de Correlación de Spearman _____________________ El coeficiente de correlación de Spearman corregido por la presencia de ligas queda finalmente.5 3. rs ∑x = 2 + ∑ y 2 − ∑d 2 2 ∑x ∑ y 2 = 2 141 .5 ‐5.5 10.5 ‐3 ‐5 ‐3 2 2 ‐1.25 30.Estadística No Paramétrica.4965 y puesto que r =0. la conclusión es rechazar Ho.5 3.616 es mayor.5 ‐2. Sujeto Conseciones Rango (X) Búsqueda Rango (Y) Diferencias Cuadrado d d A B C D E F G H I J K L 0 0 1 1 3 4 5 6 7 8 8 12 1.25 2.5 2.5 1.25 9 Diagrama de Dispersión de Valores en Rangos 14 12 10 8 6 4 2 0 0 2 4 6 8 10 12 14 5 .25 6.5 + 143 − 109 .5 2 (141 .25 9 25 9 4 4 2. Los correspondietnes coeficientes son r = 0. Coeficiente de Correlación de Spearman _____________________ El coeficiente de Spearman tiene particularmente ventajas cuando los datos presentan una dispersión acmpañada de heteroscedasticidad.Estadística No Paramétrica.8909 en rangos. Observe los siguientes diagramas de dispersión en unidades orignales (personas) de población total y Poblaciòn desocupada correspondiente a los datos censales por AGEB de la Delegación de Coyoacàn. Dispersión Unidades Originales 120 Ppoblaciòn Desocupara Población Desocupada Dispersión por Rangos 160 140 120 100 80 60 40 20 0 100 80 60 40 20 0 0 2000 4000 6000 8000 10000 12000 14000 0 20 40 60 80 100 120 140 160 Poblaciòn Total Poblaciòn Total 6 .8841 en unidades originales y rs= 0. Ho: El proceso que genera la sucesión es aleatorio H1: Las variables aleatorias en la sucesión dependen de otra variable aleatoria. Hipótesis. Estadística de Prueba Ejemplo Muestras Pequeñas. la alternancia de personas de sexo masculino y femenino es poco probable que se observe en la realidad. Datos: Los datos consisten en una sucesión de observaciones. Si tanto n1 como n2 son menores a 20 el número r de carreras se compara con dos valores extremos para el menor y mayor número de carreras observables dada una cierta probabilidad. en el primer caso hay 10 carreras de una persona cada una y en el segundo caso hay dos carreras de 5 personas.05 se encuentran tabulados en las tablas FI y FII del anexo. sean n1 el número de elementos del tipo a y n2 el número de elementos del tipo b. Los valores críticos de r para α=0. sea r el número de rachas en la sucesión de elementos. Las observaciones son de dos tipos que denotaremos por a y b. Si llamamos carrera a un conjunto de elementos de la misma clase. considerando a los individuos de sexo femenino. Tampoco un patrón como el siguiente podría suponerse aleatorio.Estadística No Paramétrica. tomadas en orden de ocurrencia. 1 . FFFFFMMMMM Ahora las personas forman conglomerados del mismo sexo también es poco probable que se puedan observar realmente. Lo cierto que un patrón aleatorio debe de alejarse de ambos extremos. Prueba de Rachas _______________________________________ Prueba de Rachas de una Muestra Suponga que al observar la fila de personas que esperan adquirir un boleto para entrar al cine tiene el siguiente aspecto de acuerdo al sexo: MFMFMFMFMF ¿Podría considerar que se trata de un orden aleatorio? Definitivamente no. Cualquier valor observado de r igual o menor que el designado por la tabla FI lleva al rechazo de la hipótesis y cualquier valor de r mayor o igual al determinado por FII. la tabla FI no puede usarse. conforme a Ho aproximadamente distribuidos en forma normal con media cero y varianza uno. Ho puede probarse así: z= r− µr = σr ⎛ 2n n ⎞ r − ⎜ 1 2 + 1⎟ ⎝ n1 + n2 ⎠ 2n1n2 (2n1n2 − n1 − n2 ) (n1 + n2 ) 2 (n1 + n2 − 1) (a) Los valores de z que son dados por la fórmula (a) son. Esto es. Prueba de Rachas _______________________________________ La tabla FI contiene valores de r tan pequeños que la probabilidad asociada con su ocurrencia conforme Ho: es p=0. Muestras grandes. con Media = µ r = 2n1n2 +1 n1 + n2 Desviación Estándar = σ r = 2n1n2 (2n1n2 − n1 − n2 ) (n1 + n2 ) 2 (n1 + n2 − 1) Por tanto. Se colocan las observaciones n1 y n2 en su orden de ocurrencia. Para muestras tan grandes. Se determina la probabilidad conforme a Ho asociada con un valor tan extremo como el valor observado de r.025 y la tabla FII contiene valores de r tan grandes que la probabilidad asociada con si ocurrencia conforme Ho: es p=0. En el siguiente ejemplo trata la aproximación de la curva a la distribución muestral de r con una muestra grande. Se cuenta el número de rachas. se 2 . una buena aproximación a la distribución muestral de r es la distribución normal. Si esta probabilidad es igual o menor que α. por tanto la significación de cualquier valor observado de z calculado con esta fórmula puede determinarse por medio de la tabla de curva normal. se encuentran las probabilidades de una cola asociadas con la ocurrencia conforme a Ho de valores tan extremos como el de cierta z observada. 2.Estadística No Paramétrica. también lleva al rechazo de Ho. n1 o n2 es mayor que 20. Si n1 o n2 es mayor que 20. r 3. Resumen de procedimiento 1.025. b) Si n1 y n2 es mayor que 20. Los valores de n1 y n2 se determinarán una vez reunidos los datos. Prueba estadística.Estadística No Paramétrica. (número de valores observados) 150. en consecuencia. Nivel de significación. Ho: la serie de números aleatorio es al azar Hipótesis alternativa. la región de rechazo en α=0. Para una prueba de dos colas. conforme a Ho están normalmente distribuidos. Si la p asociada con el valor observado de r es igual o menor que α. se usa una región de rechazo de dos colas que abarca todos los valores de z. para muestras grandes.025 consiste en el valor tabulado de r en la dirección supuesta (demasiado pequeño o demasiado grande) y de todos los valores más extremos. Distribución Muestral. se duplica la p encontrada en esa tabla. Ejemplo de Muestras grandes Se tiene una secuencia de 150 números supuestamente aleatorios con valores entre 1 y 100. Para una prueba de una cola. La prueba de rachas de una muestra se escogió porque la hipótesis concierne a la aleatoriedad de un solo grupo de eventos. Se desea verificar que la secuencia es efectivamente aleatoria. Región de rechazo. La región de rechazo. por lo tanto.96. que su probabilidad asociada conforme a Ho es p=0. para una prueba de dos colas. La técnica para determinar el valor de p depende del tamaño de los grupos n1 y n2: a) Si n1 y n2 tienen un valor de 20 o menor.025. H1: la serie de números no es al azar. la región de rechazo en α=0. Hipótesis de nulidad. Sean α=0.05 y n.05. Prueba de Rachas _______________________________________ rechaza Ho. 3 . incluye todos los valores de z iguales a o más extremos que ±1.05 consiste en los dos valores tabulados de r y de todos los valores más extremos. H1 no predice la dirección de la desviación respecto al azar. la tabla FI abarca valores de r tan pequeños. La tabla de la normal muestra la probabilidad de una cola asociada con la ocurrencia conforme a Ho de valores tan extremos como el de cierta z observada. los valores de z que se calculan con la fórmula (a). tan extremos que la probabilidad asociada con su ocurrencia conforme a Ho es igual o menor que α=0. se determina el valor de z calculado con la fórmula (a) mencionada con anterioridad. se rechaza Ho. Con ello se genera una secuencia de ceros y unos. Prueba de Rachas _______________________________________ 41 42 1 37 13 15 14 19 9 27 33 38 1 26 5 33 11 20 12 18 28 33 4 3 16 27 35 43 11 38 33 36 29 43 41 24 35 42 10 31 15 31 26 48 42 34 6 6 42 15 38 46 26 21 2 14 15 4 49 30 22 21 47 31 5 47 33 34 42 37 5 10 14 31 50 35 42 42 12 9 28 49 25 21 21 20 41 28 36 9 8 41 6 36 45 32 2 40 13 41 40 35 31 3 39 1 16 15 44 49 37 44 32 46 43 13 46 30 5 41 34 40 39 2 3 11 2 3 36 17 30 2 33 8 36 13 45 39 21 23 18 33 6 39 18 32 22 20 37 36 SERIE ALEATORIIA 60 50 40 30 20 10 0 1 16 31 46 61 76 91 106 121 136 Se toma como referencia el valor 50 y se asigna 1 si la observación es menor a 50 y 0 si es mayor o igual al 50. 4 . El número de rachas contabilizadas es r = 74.Estadística No Paramétrica. El número resultante de ceros es n1 = 74 y el de unos n2 = 76. 7454 σr La tabla de la normal muestra las probabilidades de ocurrencia conforme a Ho de z ≤ -0. p es mayor que el nivel de significación. Como se trata de una prueba de 2 colas la probabilidad se multiplica por 2 y así se tiene p=0.45602 Puesto que la probabilidad asociada con la ocurrencia observada. µr= 2n1 n 2 + 1 = 75.Estadística No Paramétrica.52 n1 + n 2 σr= 2n1 n2 (2n1 n2 − n1 − n 2 ) (n1 + n 2 ) 2 (n1 + n 2 − 1) = 6. 5 .22801.7454 es 0.05. no se rechaza la hipótesis de nulidad. Se concluye que la serie es aleatoria. Prueba de Rachas _______________________________________ Ahora se calculan la media y desviación estándar correspondientes a una secuencia de valores aleatorios. α=0.0638 z= r−µ r = -0. Documents Similar To Notas Módulo NoParamétricaSkip carouselcarousel previouscarousel nextmetodo uslesantu.docxCurso de EstadisticaQué Es La Estadística2 Marco TeoricoClase 6 unidad 2-Cartas Control.pdfError de Lab OratorioGuiainforme 1 quimica analítica47 Espacial19 Sesión - Tipologíactp1UNIDAD I TIPOS DE INVESTIGACIÓNHerramientas de Análisis EstadísticosIntro Historia Variables EstadísticaAntologia de Estadistica Aplicada a La Inv EducCartas de ControlTEORIA ESTADSTICAPractica 2DIAPOS Prevalencia de Dismenorrea74583590-Probabilidad-y-Estadistica-I.pdfGuia Primer Examen MedicionFisica Labmetodologia investigacionEnfoques comparaciónMc NemarScoring Podra FuncionarDISEÑOS INVESTIGACION.pptxEl Número Efectivo de Grados de Libertadpre informeFooter MenuBack To TopAboutAbout ScribdPressOur blogJoin our team!Contact UsJoin todayInvite FriendsGiftsLegalTermsPrivacyCopyrightSupportHelp / FAQAccessibilityPurchase helpAdChoicesPublishersSocial MediaCopyright © 2018 Scribd Inc. .Browse Books.Site Directory.Site Language: English中文EspañolالعربيةPortuguês日本語DeutschFrançaisTurkceРусский языкTiếng việtJęzyk polskiBahasa indonesiaSign up to vote on this titleUsefulNot usefulYou're Reading a Free PreviewDownloadClose DialogAre you sure?This action might not be possible to undo. Are you sure you want to continue?CANCELOK

Comments

Description