Ingeniería de Sistemas e InformáticaFÓRMULAS Y TABLAS ESTADÍSTICAS ALUMNO (A) : ........................................................................... CICLO : IV SEMESTRE : 2015-II PROFESORA : Lic. Gladys Enríquez Mantilla. [email protected] 05 N Tamaño de la muestra para estimar el promedio poblacional: Población Infinita: n z / 2 2 e Profesora: Gladys Enríquez Mantilla Población Finita: n Z2 / 2 2 N e2 ( N 1) Z2 /2 2 1 .05 N DISTRIBUCIÓN DE LA PROPORCIÓN MUESTRAL Muestreo con reemplazo: z p P PQ n Muestreo sin reemplazo: z p P PQ n Nn N 1 n 0.P( Z z1 ) z1 z2 DISTRIBUCIÓN DE LA MEDIA MUESTRAL Muestreo con reemplazo: z x n Muestreo sin reemplazo: x Nn N 1 n z n 0.P( Z z 2 ) z2 c) P( z1 Z z 2 ) = P( Z z 2 ) . z1 b) P( Z > z 2 ) = 1 .UAP Ingeniería de Sistemas e Informática Inferencia Estadística DISTRIBUCIÓN NORMAL a) P( Z z1 ) = F( z1 ) Lectura directa. n 0.UAP Ingeniería de Sistemas e Informática Inferencia Estadística INTERVALO DE CONFIANZA PARA LA MEDIA POBLACIONAL Li Ls Se conoce σ 2 : 1.05 N t0 t1 /2 . Población infinita: Población finita: Nn x z /2 n N 1 x z /2 n 2. n 1 2 . n1 Si n < 30 : x Nn N 1 S n S n x t0 S n Población finita: Nn N 1 n 0. n 1 Profesora: Gladys Enríquez Mantilla 2 ( n 1 ) S2 2 / 2 .05 N Error máximo probable: Si n ≥ 30: Si n < 30: E Z /2 E n t0 S n INTERVALO DE CONFIANZA PARA LA VARIANZA POBLACIONAL L i 2 L s ( n 1 ) S2 12 / 2 .05 N No se conoce σ 2 : a) Si n 30: Población infinita: x b) z /2 Población finita: S n x z /2 Población infinita: t0 n 0. 05 N INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE PROPORCIONES POBLACIONALES L i P1 P2 L s 1 1 P Q n1 n2 ( p1 p2 ) z /2 Donde: P x1 x 2 n1 n 2 P ó n1 p1 n 2 p 2 n1 n 2 INTERVALO DE CONFIANZA PARA LA RAZÓN DE VARIANZAS L i 2 1 2 Ls 2 S12 S2 2 F1 / 2 . v2 n 2 1 Grados de libertad del denominador. v . v 1 2 Donde: v1 n 1 1 Grados de libertad del numerador. v . v 1 2 12 2 2 S12 S2 2 F / 2 .UAP Ingeniería de Sistemas e Informática Inferencia Estadística INTERVALO DE CONFIANZA PARA LA PROPORCIÓN POBLACIONAL Li P Ls Población infinita: p Z /2 Población finita: pq n pq n p Z /2 Nn N 1 n 0. Profesora: Gladys Enríquez Mantilla 3 . se supone: 12 2 2 ( n2 1) S22 1 n 1 n1 n2 2 t0 n1 n2 30 . Profesora: Gladys Enríquez Mantilla 4 . t0 t1 /2 . 1 n2 se supone: 12 2 2 S2 S12 2 n1 n2 . g 2 2 t1 /2 .UAP Ingeniería de Sistemas e Informática Inferencia Estadística INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS POBLACIONALES Li 1 2 Ls 1) i2 conocidas: ( x1 x 2 ) 2 2) i desconocidas: i2 desconocidas: ( x1 x 2 ) Donde: t0 ( x1 x 2 ) n1 z /2 S12 n1 n1 n2 30 t0 ( n1 1) S12 n2 S2 2 n2 . n1 n2 2 i2 desconocidas: 4) 12 n1 n2 30 ( x1 x 2 ) 3) z /2 g 2 S2 1 S2 n n2 1 2 S2 1 n 1 n1 1 2 2 S2 2 n 2 n2 1 Para el valor de g siempre se toma sólo la parte entera. n1 Estadística de Prueba: σ 2 desconocida: σ 2 conocida : Si n ≥ 30 : x 0 z / n z Si n < 30: x 0 S/ n t x 0 S/ n Valor P P 2 P ( Z ep ) P 2 P ( t n 1 ep ) P P ( Z ep ) P P ( t n 1 ep ) P P ( Z ep ) P P ( t n 1 ep ) Error Tipo II x c 0 VC P ( x c1 x x c2 ) P ( x xc ) P ( x xc ) n x c 0 VC n x c 0 VC n PRUEBA DE HIPÓTESIS PARA LA PROPORCIÓN POBLACIONAL H0 : P P 0 H1 : P P0 H0 : P P 0 H1 : P P0 Z1 Z Estadística de prueba: Z Profesora: Gladys Enríquez Mantilla H0 : P P 0 H1 : P P0 Z / 2 p P0 P0 Q0 n 5 . n1 0 H1 : 0 z1 t1 . n1 z / 2 t1 / 2 .UAP Ingeniería de Sistemas e Informática Inferencia Estadística PRUEBA DE HIPÓTESIS PARA LA MEDIA POBLACIONAL H0 : 0 H0 : 0 H0 : H1 : 0 H1 : 0 z t . 12 . n 1 2 Estadística de prueba: 2 /2 . n1 n 1 12 / 2 . n 1 ( n 1 ) S2 20 P. v . PRUEBA DE HIPÓTESIS PARA LA DIFERENCIA DE PROPORCIONES H0 : P1 P2 H1 : P1 P2 H0 : P1 P2 H1 : P1 P2 H0 : P1 P2 H1 : P1 P2 Z1 Z Z / 2 Estadística de prueba: Z p1 p 2 1 1 P Q n 2 n1 donde: Profesora: Gladys Enríquez Mantilla P x1 x 2 n1 n 2 ó P n1 p1 n 2 p 2 n1 n 2 6 . v .H. v 1 2 Estadística de prueba: F S12 v 2 n2 1 S22 v1 n1 1 .UAP Ingeniería de Sistemas e Informática Inferencia Estadística PRUEBA DE HIPÓTESIS PARA LA VARIANZA POBLACIONAL H0 : 2 2 0 H0 : 2 2 0 H0 : 2 2 0 H1 : 2 2 0 H1 : 2 2 0 H1 : 2 2 0 2 . v 1 2 F1 /2 . v 1 2 F /2 . PARA LA DIFERENCIA DE VARIANZAS POBLACIONALES H0 : 12 2 2 H0 : 12 2 2 H0 : 12 2 2 H1 : 12 2 2 H1 : 12 2 2 H1 : 12 2 2 F . v . v . v 1 2 F1 . UAP Ingeniería de Sistemas e Informática Inferencia Estadística P.H. PARA LA DIFERENCIA DE MEDIAS POBLACIONALES 1) σ2 i conocidas: 1 2 H1 : 1 2 H0 : H0 : H1 : 1 2 1 2 z1 z H0 : H1 : 1 2 1 2 z / 2 Estadística de prueba: z x1 x 2 12 n1 2) 22 n2 σ2 i desconocidas: a) n1 n2 30 : 1 2 H1 : 1 2 H0 : H0 : H1 : 1 2 1 2 z z1 H0 : H1 : 1 2 1 2 z / 2 Estadística de prueba: z x1 x 2 S12 n1 Profesora: Gladys Enríquez Mantilla S2 2 n2 7 . n1 n2 30 1 2 H1 : 1 2 H0 : H0 : H1 : t. g 1 2 1 2 t1 /2 . n1 n2 2 t1 /2 . g 1 2 1 2 H0 : H1 : t1 . n1 n2 2 1 2 1 2 H1 : t1 . g Estadística de prueba: t x1 x 2 S12 n1 S2 2 n2 g 2 S2 1 S2 n1 n2 2 2 2 S2 S2 2 1 n n1 2 n1 1 n2 1 * Para el valor de g sólo se toma la parte entera.UAP Ingeniería de Sistemas e Informática Inferencia Estadística b) se supone que σ12 σ 22 . n1 n2 30 1 2 H1 : 1 2 x1 x 2 ( n1 1) S12 ( n2 1)S22 n1 n2 2 Se supone que σ12 σ 22 H0 : H0 : 1 1 n n 2 1 H1 : t . Profesora: Gladys Enríquez Mantilla 8 . n1 n2 2 H0 : 1 2 1 2 Estadística de prueba: t c) . n 1 H0 : H1 : t1 .05 N Tamaño de muestra: n0 n n 1 0 N .UAP Ingeniería de Sistemas e Informática Inferencia Estadística PRUEBA DE HIPÓTESIS PARA DATOS PAREADOS H0 : D 0 H1 : D 0 H0 : D 0 H1 : D 0 t . Z /2 S n0 E 2 . E % x MUESTREO ALEATORIO SISTEMÁTICO Muestra Piloto: np 0. n 1 D D 0 0 t1 / 2 . n 1 Estadística de prueba: t x D D SD n MUESTREO ALEATORIO SIMPLE Muestra Piloto: n p 0. K N n 9 .05 N Tamaño de muestra: n0 n n 1 0 N . Z /2 S n0 E Profesora: Gladys Enríquez Mantilla 2 . E % x . 05 N . ( f 1 ) (c 1 ) 2 ( Oi j f : Nº de filas c : Nº de columnas ei j )2 . f. x ST Ni N x i PRUEBA CHI CUADRADO DE HOMOGENEIDAD O DE INDEPENDENCIA Valor Crítico: 12 Estadística de Prueba: . . k 1 2 : Nº de celdas Corrección de Yates: 2 Si ei j ( Oi j Donde: ei j )2 ei j pi ei j 1 k n pi Coeficiente de Contingencia: Oi j ei j 0. ei j ei j f i . n0 n 1 0 N N ni n i N E V Z /2 2 E % x ST .5 2 ei j C 2 n 2 5 en 20% o más de celdas Cuando algún ei j 1 Profesora: Gladys Enríquez Mantilla 10 .UAP Ingeniería de Sistemas e Informática Inferencia Estadística MUESTREO ALEATORIO ESTRATIFICADO Muestra Piloto: n Tamaño de muestra: 1 n0 V Ni 2 S N i N nip np i N n p 0. j n Si f=1 ó c=1: Valor Crítico: 12 k Estadística de Prueba: . ... n2 . k 2 VC 12 . S2 2 1 2 nk 1 N k Sk S2p Profesora: Gladys Enríquez Mantilla k donde: n i 1 S2i i 1 S2 p Nk 11 . nk ) n1 bk ( . n p x q n x Estadística de Prueba: 2 ( Oi j ei j )2 ei j donde: ei j n pi Oi j PRUEBA DE BARTLETT Valor Crítico: bk bk ( . S2 S1 2 k 2 Sp k 1 S2i k donde: S2p i 1 k Estadística de Prueba: para n i diferentes: 2 n11 S1 b n 1 2 . nk ) N Estadística de Prueba: para ni iguales: b 2 S2 . n1 ) n2 bk ( .. n1 . k 3 VC 12 . nk bk ( . n ) Para n i iguales: Para n i diferentes: bk ( . n2 ) ..UAP Ingeniería de Sistemas e Informática Inferencia Estadística PRUEBA CHI CUADRADO DE BONDAD DE AJUSTE Valor Crítico: VC NORMAL: POISSON: BINOMIAL: VC 12 ... k 2 P (X x i ) P(Zz ) F(z ) e x x! P (X x i ) C n x ˆ p x n ...... ... Nk F CM (tr ) CME Tabla de ANOVA Fuente de Variación Grados de Libertad Suma de Cuadrados k 1 Tratamientos SC (tr) Error N-k SCE Total N1 SCT Suma de Cuadrados del Total: k n SCT i 1 j1 CME F CM ( tr ) CME SCE N-k Suma de Cuadrados de Tratamientos: T2 N X2 ij Cuadrado Medio SC ( tr ) CM ( tr ) k 1 SC ( tr ) k T2 i.UAP Ingeniería de Sistemas e Informática Inferencia Estadística DISEÑO COMPLETAMENTE ALEATORIO (ANOVA con un factor) Valor Crítico: Estadística de Prueba: F1 . Nk CME n Para ni diferentes: x i xj q . k . ni i 1 T2 N SCE SCT SC ( tr ) Suma de Cuadrados del Error: INTERVALOS DE CONFIANZA DE TUKEY Para ni iguales: x i xj q . k . Nk Profesora: Gladys Enríquez Mantilla CME 1 1 2 ni nj 12 . k 1 . b1 . k 1 .UAP Ingeniería de Sistemas e Informática Inferencia Estadística DISEÑO EN BLOQUES COMPLETOS AL AZAR (ANOVA con dos factores) Hipótesis 1: Hipótesis 2: Valor crítico: Valor crítico: F1 . Nbk 1 Estadística de Prueba: F Estadística de Prueba: CM (tr ) CME F CMB CME Tabla de ANOVA Fuente de Variación Grados de Libertad k 1 Tratamientos Suma de Cuadrados SC (tr) b 1 SCB Error N b k 1 SCE Total N1 SCT Bloques Cuadrado Medio SC ( tr ) CM ( tr ) k 1 CMB CME F CM ( tr ) CME CMB CME SCB b 1 SCE N b k 1 Donde: Suma de Cuadrados del Total: k Suma de Cuadrados de Tratamientos: k Ti2. b T2 SCT X2 ij N i 1 j1 Suma de Cuadrados del Error: SC ( tr ) i 1 b Suma de Cuadrados de Bloques: b B2j SCE SCT SC ( tr ) SCB SC B Profesora: Gladys Enríquez Mantilla T2 N j1 k T2 N 13 . Nbk 1 F1 . b Ecuación de Regresión Lineal Conociendo r: Conociendo la Covarianza: ˆ r Y SY ( Xx ) y SX ˆ Y SXY ˆ r X SX (Yy ) x SY ˆ X SXY Profesora: Gladys Enríquez Mantilla S2X S2Y (Xx) y (Yy) x 14 .UAP Ingeniería de Sistemas e Informática Inferencia Estadística REGRESIÓN Y CORRELACIÓN LINEAL SIMPLE Ecuación de regresión de Y sobre X: Ecuación de regresión de X sobre Y: ˆ a b Y X ˆ abX Y Ecuaciones Normales: na b a Xi a b Xi X2i Ecuaciones Normales: Yi n a Xi Yi a Yi X2 Y X XY 2 n X2 X b a' XY X Y 2 n X2 X b Yi Yi2 Xi Yi Xi Y2 X Y YX 2 n Y2 Y b' n b YX Y X 2 n Y2 Y n Coeficiente de Correlación Lineal Simple Coeficiente de Correlación Lineal de Pearson: r Conociendo a y b : XY X Y 2 2 n X 2 X n Y 2 Y n SXY Usando la Covarianza: XY n r X . Y n a Y b XY n Y2 Y2 n Y2 Forma de Regresión: n r SXY r SX SY b . 1 .UAP Ingeniería de Sistemas e Informática Inferencia Estadística Error Estándar de Estimación: SL Y 2 a Y b n2 Intervalo de confianza para β : XY SL b to X X 2 2 n Intervalo de pronóstico para un valor de Y: a b x0 t0 SL 1 1 n ( x0 x )2 2 n n X2 ( X ) to t1 . n2 ANOVA en Regresión Valor Crítico Estadística de Prueba F1 .α/2 . n 2 F CMR CME Tabla de ANOVA Fuente de Variación Grados de Libertad Regresión 1 Suma de Cuadrados SCR Cuadrado Medio SCR CMR 1 SCE CME n.2 Error n-2 SCE Total n-1 SCT Suma de Cuadrados Total: SCT Y2 F CMR CME Suma de Cuadrados de Regresión: Y 2 n Suma de Cuadrados del Error: SCE SCT SCR Profesora: Gladys Enríquez Mantilla SCR b2 X2 X 2 n Coeficiente de Determinación: r2 SCR SCT 15 . Coeficiente de correlación exponencial: r n X2 X log Y X . log Y ( X )2 n ( log y )2 ( log Y )2 n Profesora: Gladys Enríquez Mantilla 16 .UAP Ingeniería de Sistemas e Informática Inferencia Estadística REGRESIÓN Y CORRELACIÓN CUADRÁTICA Ecuaciones Normales: Ecuación de Regresión: ˆ Y X c X2 a X b X2 c X3 a X2 b X3 c X 4 a n 2 a bX cX b Y XY X2 Y Coeficiente de correlación cuadrático: r a Y b XY c X2 Y 2 Y2 n Y n Y 2 Error estándar de Estimación cuadrático: SC Y2 a Y b XY c n 3 X2 Y REGRESIÓN Y CORRELACIÓN EXPONENCIAL Ecuación de Regresión: Ecuaciones Normales: ˆ a . bX Y Log Y = Log a + X log b log Y X log Y n log a log a . X2 log b . X X log b . X3 b3 X2 X3 b3 X2 3 b3 Y X2 Y X3 Y X3 y X 4 : ˆ b1. 345 X2 b13 . 245 X3 b14 .. 235 X4 b15 . 34 X2 b13 . 23 X4 Y Ecuación de Regresión de Y sobre X 2 . 2345 b12. de Regresión de Y sobre X 2 y X 3 : Y b1 b2 X 2 b3 X 3 Y b1. X 3 . 3 X2 b13.23 b12. 2 X3 Ecuaciones Normales: b1 n X2 b1 X3 b1 X2 b2 X2 2 b2 X2 X3 b2 Ecuación de Regresión de Y sobre X 2 . 234 X5 Y Error estándar de estimación múltiple: SM Profesora: Gladys Enríquez Mantilla ( Yi Yˆi )2 n m 1 17 .UAP Ingeniería de Sistemas e Informática Inferencia Estadística REGRESIÓN Y CORRELACIÓN MÚLTIPLE Ec. 234 b12. 24 X3 b14 . X 4 y X5 : ˆ b1. orden parcial Coeficiente de Correlación Parcial para cuatro variables: rij kl rij l rik l rjk l 2 2 ( 1 rik l ) ( 1 rjk l ) Profesora: Gladys Enríquez Mantilla Fórmula de 2do. 2 . 23 b1 Y R12. 1 Fórmula de 1er. 23 b2 X 2 Y b3 X 3 Y 2 Y2 n Y 2 2 r12 r13 1 nY 2 2 r12 r13 r23 2 r23 . 3 .UAP Ingeniería de Sistemas e Informática Inferencia Estadística Coeficientes de Correlación Lineal Simple Correlación simple entre Y y X 2 : n r12 n X22 Y X2 Y X2 ( X2 )2 n Y2 ( Y )2 Correlación simple entre Y y X3 n r13 n X23 Y X3 Y X3 ( X3 )2 n Y2 ( Y )2 Correlación simple entre X 2 y X3 X 2 X3 X 2 X 3 n X22 ( X2 )2 n X23 ( X3 )2 n r23 Coeficiente de Determinación Múltiple: R12. CORRELACIÓN PARCIAL Coeficiente de Correlación Parcial para tres variables: r12 . rij k rij rik rjk 2 ( 1 rik ) ( 1 r2 jk ) r13 . orden parcial 18 . r23 .