Tipificación y estandarización de variables aleatoriasClaudia Guerrero Sepúlveda TIPIFICACIÓN, ESTANDARIZACIÓN, transformación de variables Es un procedimiento que facilita la comparación entre: - Los valores de dos distribuciones distintas. Los valores de variables con unidades distintas Reconocimiento de valores atípicos o dentro de ciertos valores de acuerdo a la regla empírica Una variable está tipificada o estandarizada cuando a sus valores se les resta su media aritmética y se les divide por su desviación estándar zi = xi − x σ El resultado de esta operación es otra variable (tipificada) con media cero y de varianza y desviación estándar 1. A estas variables se les representa por la letra Z 1 Tipificación y estandarización de variables aleatorias Claudia Guerrero Sepúlveda Comparación entre los valores de dos distribuciones distintas Queremos comparar valores de distintas distribuciones, cómo sería el caso de las notas que se obtienen en por ejemplo matemáticas con dos profesores distintos. Alumno 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Medida Desv. Est Calificación 8 8 10 7 7 8 9 9 6 6 7 5 5 6 5 7 7 7 8 5 Valor Z Alumno 0.70710678 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 0.70710678 2.12132034 0 0 0.70710678 1.41421356 1.41421356 -0.70710678 -0.70710678 0 -1.41421356 -1.41421356 -0.70710678 -1.41421356 0 0 0 0.70710678 Calificación 8 7 7 6 9 8 9 5 9 8 9 9 7 8 8 9 8 9 7 Valor Z 0.09407209 -0.79961274 -0.79961274 -1.69329756 0.98775691 0.09407209 0.98775691 -2.58698239 0.98775691 0.09407209 0.98775691 0.98775691 -0.79961274 0.09407209 0.09407209 0.98775691 0.09407209 0.98775691 -0.79961274 -1.41421356 7 1.41421356 Medida Desv. Est 7.89473684 1.11896272 Con el profesor A la media es 7 mientras que quienes obtienen 7 están a .799 desviaciones estándar de la media. El valor Z es el número de desviaciones estándar a la izquierda o a la derecha Con el profesor B quien obtiene un cinco está a -2.58 desviaciones estándar de la media Conversión entre dos maestros. Un 8 del profesor A equivale a un X del profesor B zi = xi − x σ ziσ + x = xi 8 con el profesor A es igual a una Z=0.70710678 Una Z=0.70710678 del profesor B equivale a 2 Tipificación y estandarización de variables aleatorias Claudia Guerrero Sepúlveda 0.70710678*1.1189 + 7.894 = 8.6859 Alumno 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Medida Desv. Est Calificación 8 8 10 7 7 8 9 9 6 6 7 5 5 6 5 7 7 7 8 5 7 1.41421356 Valor Z 0.70710678 0.70710678 2.12132034 0 0 0.70710678 1.41421356 1.41421356 -0.70710678 -0.70710678 0 -1.41421356 -1.41421356 -0.70710678 -1.41421356 0 0 0 0.70710678 -1.41421356 Otro profesor 9 9 10 8 8 9 9 9 7 7 8 6 6 7 6 8 8 8 9 6 Alumno 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 Medida Desv. Est Calificación 8 7 7 6 9 8 9 5 9 8 9 9 7 8 8 9 8 9 7 Valor Z 0.09407209 -0.79961274 -0.79961274 -1.69329756 0.98775691 0.09407209 0.98775691 -2.58698239 0.98775691 0.09407209 0.98775691 0.98775691 -0.79961274 0.09407209 0.09407209 0.98775691 0.09407209 0.98775691 -0.79961274 Otro profesor 7 6 6 5 8 7 8 3 8 7 8 8 6 7 7 8 7 8 6 7.89473684 1.11896272 En este proceso se homogeneizaron las dos distribuciones, eliminando las características propias y reduciéndolas a un único patrón. 3 Tipificación y estandarización de variables aleatorias Claudia Guerrero Sepúlveda Los valores de variables individuos La variable que ha sido tipificada expresa el número de desviaciones típicas que difiere de la media, así es que en un mismo individuo se pude expresar el número de las desviaciones típicas que difiere de la media en las diferentes variables y unidades de medida. Por ejemplo la paciente señalada en verde tiene todos sus valores arriba de la media, a excepción del peso en el que está bajo de la media. La presión diastólica está a 2.85 desv. Estándar de la media. Media Desv 45.00 3.12 Edad Zedad 45 0.00 48 0.96 40 -1.60 42 -0.96 45 0.00 49 1.28 50 1.60 43 -0.64 46 0.32 48 0.96 41 -1.28 45 0.00 45 0.00 43 -0.64 44 -0.32 42 -0.96 42 -0.96 49 1.28 47 0.64 45 0.00 49 1.28 41 -1.28 46 0.32 50 1.60 121.64 16.66 Sexo Femenino Femenino Masculino Masculino Femenino Femenino Femenino Masculino Femenino Masculino Femenino Femenino Masculino Masculino Femenino Femenino Femenino Masculino Femenino Masculino Femenino Femenino Masculino Masculino 81.59 9.97 64.88 285.11 68.58 2.49 73.77 9.47 presió Zpresió n Zpresión ataque presión n diastó diastólic colester Zcoleste (0,no sistólica sistólica lica a ol rol altura IN Zaltura peso Zpeso 1,si) Est.Salud 124.00 0.14 80 -0.16 254 0.66 70 0.57 86.18 1.31 0 Bueno 110.00 -0.70 70 -1.16 240 0.61 73 1.78 97.98 2.56 0 Bueno 114.00 -0.46 80 -0.16 279 0.75 68 -0.23 80.74 0.74 0 Regular 100.00 -1.30 80 -0.16 284 0.77 68 -0.23 67.59 -0.65 0 Bueno 190.00 4.10 110 2.85 315 0.88 68 -0.23 82.55 0.93 1 Bueno 130.00 0.50 88 0.64 250 0.65 70 0.57 83.91 1.07 0 Muy Malo 130.00 0.50 94 1.24 298 0.82 68 -0.23 73.03 -0.08 0 Excelente 110.00 -0.70 74 -0.76 384 1.12 67 -0.63 79.38 0.59 0 Malo 120.00 -0.10 80 -0.16 310 0.86 66 -1.03 65.32 -0.89 0 Malo 120.00 -0.10 80 -0.16 337 0.95 67 -0.63 58.97 -1.56 0 Excelente 130.00 0.50 80 -0.16 367 1.06 69 0.17 73.48 -0.03 0 Excelente 120.00 -0.10 90 0.84 273 0.73 68 -0.23 79.38 0.59 0 Regular 130.00 0.50 75 -0.66 273 0.73 66 -1.03 70.31 -0.37 0 Bueno 120.00 -0.10 80 -0.16 314 0.87 74 2.18 70.76 -0.32 0 Muy Malo 115.00 -0.40 70 -1.16 243 0.62 65 -1.44 68.49 -0.56 0 Excelente 140.00 1.10 90 0.84 341 0.97 74 2.18 76.20 0.26 0 Excelente 138.00 0.98 80 -0.16 245 0.63 70 0.57 83.91 1.07 0 Bueno 115.00 -0.40 82 0.04 302 0.83 69 0.17 70.36 -0.36 0 Excelente 148.00 1.58 110 2.85 302 0.83 69 0.17 68.12 -0.60 1 Excelente 120.00 -0.10 70 -1.16 386 1.13 66 -1.03 66.22 -0.80 0 Muy Malo 110.00 -0.70 70 -1.16 312 0.87 71 0.97 77.11 0.35 1 Regular 132.00 0.62 90 0.84 302 0.83 69 0.17 73.03 -0.08 0 Malo 112.00 -0.58 80 -0.16 394 1.15 69 0.17 75.75 0.21 0 Muy Malo 114.00 -0.46 70 -1.16 358 1.03 69 0.17 89.81 1.69 0 Malo 4 Tipificación y estandarización de variables aleatorias Claudia Guerrero Sepúlveda Reconocimiento de valores atípicos o dentro de ciertos valores de frecuencia de acuerdo a la regla empírica La mayoría de experimentos con los que nos encontramos, cumplen a grandes rasgos un comportamiento que por lo pronto llamaremos normal. Si se miden los estudiantes de una universidad será probable que encontremos un buen número de estaturas alrededor de 1.75, habrá pocos arriba de 1.80 y prácticamente a nadie de 2.0 ms o de 1.40 Hay muchas variables que cumplen este tipo de comportamiento en forma de campana, siendo esta distribución básica en los estudios estadísticos. Una de sus características es que la mayor parte de sus observaciones se acumula alrededor de la media y decrece en forma simétrica cuando nos alejamos de la media La forma de esta campana dependerá de lo concentradas que estén las observaciones en torno a su media, concentración (dispersión) que vendrá dada por la varianza, esta característica se resume en la siguiente regla empírica: · media ± desviaciones estándar (s) contiene aproximadamente 68% de las observaciones. · media ± 2 desviaciones estándar (s) contiene aproximadamente 95% de las observaciones. · media ± 3 desviaciones estándar (s) contiene casi todas las observaciones. 99.7 % de las 5 Tipificación y estandarización de variables aleatorias Claudia Guerrero Sepúlveda Observaciones La regla empírica alrededor de la normal trata entonces de una estimación del % que se encuentra alrededor de la media en función de las desviaciones estándar. VALORES ATIPICOS Se considera que todos los valores a más menos 3 desviaciones estándar son valores atípicos El caso de la paciente señalada en rojo muestra un comportamiento más allá de las tres desviaciones estándar por lo que sugiere una nueva medición, tomar un medicamento o una visita médica. Media Desv 45.00 3.12 Edad Zedad 45 0.00 48 0.96 40 -1.60 42 -0.96 45 0.00 49 1.28 50 1.60 43 -0.64 46 0.32 48 0.96 41 -1.28 45 0.00 45 0.00 43 -0.64 44 -0.32 42 -0.96 42 -0.96 49 1.28 47 0.64 45 0.00 49 1.28 41 -1.28 46 0.32 50 1.60 121.64 16.66 Sexo Femenino Femenino Masculino Masculino Femenino Femenino Femenino Masculino Femenino Masculino Femenino Femenino Masculino Masculino Femenino Femenino Femenino Masculino Femenino Masculino Femenino Femenino Masculino Masculino 81.59 9.97 64.88 285.11 68.58 2.49 73.77 9.47 presió Zpresió n Zpresión ataque presión n diastó diastólic colester Zcoleste (0,no sistólica sistólica lica a ol rol altura IN Zaltura peso Zpeso 1,si) Est.Salud 124.00 0.14 80 -0.16 254 0.66 70 0.57 86.18 1.31 0 Bueno 110.00 -0.70 70 -1.16 240 0.61 73 1.78 97.98 2.56 0 Bueno 114.00 -0.46 80 -0.16 279 0.75 68 -0.23 80.74 0.74 0 Regular 100.00 -1.30 80 -0.16 284 0.77 68 -0.23 67.59 -0.65 0 Bueno 190.00 4.10 110 2.85 315 0.88 68 -0.23 82.55 0.93 1 Bueno 130.00 0.50 88 0.64 250 0.65 70 0.57 83.91 1.07 0 Muy Malo 130.00 0.50 94 1.24 298 0.82 68 -0.23 73.03 -0.08 0 Excelente 110.00 -0.70 74 -0.76 384 1.12 67 -0.63 79.38 0.59 0 Malo 120.00 -0.10 80 -0.16 310 0.86 66 -1.03 65.32 -0.89 0 Malo 120.00 -0.10 80 -0.16 337 0.95 67 -0.63 58.97 -1.56 0 Excelente 130.00 0.50 80 -0.16 367 1.06 69 0.17 73.48 -0.03 0 Excelente 120.00 -0.10 90 0.84 273 0.73 68 -0.23 79.38 0.59 0 Regular 130.00 0.50 75 -0.66 273 0.73 66 -1.03 70.31 -0.37 0 Bueno 120.00 -0.10 80 -0.16 314 0.87 74 2.18 70.76 -0.32 0 Muy Malo 115.00 -0.40 70 -1.16 243 0.62 65 -1.44 68.49 -0.56 0 Excelente 140.00 1.10 90 0.84 341 0.97 74 2.18 76.20 0.26 0 Excelente 138.00 0.98 80 -0.16 245 0.63 70 0.57 83.91 1.07 0 Bueno 115.00 -0.40 82 0.04 302 0.83 69 0.17 70.36 -0.36 0 Excelente 148.00 1.58 110 2.85 302 0.83 69 0.17 68.12 -0.60 1 Excelente 120.00 -0.10 70 -1.16 386 1.13 66 -1.03 66.22 -0.80 0 Muy Malo 110.00 -0.70 70 -1.16 312 0.87 71 0.97 77.11 0.35 1 Regular 132.00 0.62 90 0.84 302 0.83 69 0.17 73.03 -0.08 0 Malo 112.00 -0.58 80 -0.16 394 1.15 69 0.17 75.75 0.21 0 Muy Malo 114.00 -0.46 70 -1.16 358 1.03 69 0.17 89.81 1.69 0 Malo 6