FINAL ESTADISTICA – PANOTema: Variables La variable es una característica de los individuos de una población que puede tomar distintos valores. Una población es un conjunto de individuos (personas, animales o tiempos de reacción, etc.) que tienen características similares. Un parámetro es una propiedad descriptiva de una población. Es importante definir la población de interés al momento de llevar a cabo una investigación, ya que las conclusiones que obtengamos estarán referidas a toda esa población. Al ser por lo general muy numerosas, por razones practicas y económicas se trabaja con muestras que es una parte de una población. Con la información que obtenemos con ella podremos hacer inferencias sobre la población total, por eso es necesario que la muestra sea representativa. La existencia de la variabilidad ( es decir, que una variable tome distintos valores), es necesaria para la aplicación de la estadística que aporta a la ciencia métodos para explicar los cambios en las variables y relaciones con otros cambios. Pueden presentarse dos tipos de variaciones: Las variaciones previsibles que están asociadas a las fuentes de variación sistemáticas (edad, eduacación, etc.) y son tomadas en cuenta por el investigador a la hora de hacer observaciones. Y las variables imprevisibles, están ligada a las fuentes de variación fortuitas las cuales son desconocidas para el investigador, son cosas que el no tiene en cuenta (conflictos, prejuicios, etc.). Para obtener el valor de una variable se necesita medir, esto consiste en el proceso de asignar elementos de un conjunto a cosas con un sentido determinado. La acción de medir requiere una escala, que es el conjunto cuyos elementos son asignados a las cosas a medir, y ésta tiene una determinada estructura a través de la cual podemos diferenciar 4 tipos de escalas: La escala nominal: sus valores son nombres que designan a las distintas clases de cosas que se miden. Discrimina y coloca los elementos que son iguales en un mismo conjunto pero sin ningún orden jerárquico. Puede representarse con números o letras pero estas se usan como códigos o etiquetas que representan los nombres de las clases y sirven para distinguirlas, como F=1, M=2. El gráfico que se utiliza en esta escala es el diagrama circular y el de barras. La escala ordinal: al igual que la escala nominal sus valores se representan con palabras, o numero y letras usados como códigos, pero en este caso hay establecido un orden jerárquico. El gráfico utilizado para esta escala es el diagrama de barras. La escala intervalar: en esta escala el cero es arbitrario, es decir que no representa una ausencia del atributo. Podemos tomar el ejemplo de la temperatura, el cual depende de que en escala se mida, por ejemplo 0°C no significa que no haya temperatura. La escala de razones esta escala tiene un cero absoluto, es decir que remite a una ausencia del atributo. Ej: peso, altura, etc. Para saber que tipo de escala debo usar, necesito saber que tipo de variable tengo. Tenemos dos grandes clases de variables: Las variables cualitativas se refieren a atributos, condiciones o cualidades que poseen los individuos y se expresan con palabras como el sexo, actividad laboral, etc. Sus valores pueden estar ordenados o no. Se relacionan con los niveles de medición Nominal y Ordinal. Las variables cuantitativas El conjunto de sus valores son números. Entre ellas distinguimos las variables discretas y las variables continuas. La variable continua sirve para marcar una distancia indefinida entre dos elementos (ej:peso). Se representa gráficamente con el diagrama de Tallo-Hoja, el histograma, el histograma de áreas y la poligonal de frecuencias acumulada. La variable discreta: sus valores son reductibles como la edad. Para representar estas variables gráficamente utilizamos el diagrama de bastones y el diagrama de Tallo-Hoja. Para las variables cuantitativas utilizamos la escala intervalar o de razones. Hay casos en los que es de interés comparar una variable con otra, y para esto es muy util la distribución de frecuencia. Lo que hace es la organización de observaciones recopiladas, y asocia a cada valor de la variable su correspondiente frecuencia y resalta características importantes. La distribución de frecuencia se puede presentar en forma de gráfico o tabla de frecuencias que consta de dos columnas, en la primera colocamos los valores de la variable (ejemplo, cant de hijos: 1,2,3) y en la segunda la frecuencias absolutas correspondiente a cada valor, que son la cantidad de veces que se observa cada valores de la variable en la muestra. Pero para poder comparar dos variables el tamaño de la muestra debe ser el mismo, y en caso de no ser así, deberemos transformar las frecuencias absolutas en frecuencias relativas, que es cada frecuencia divida por el tamaño de la muestra o en frecuencias porcentuales, es la frecuencia relativa multiplicada por cien. El modelo teórico para la variable es una distribución de frecuencias relativas que representa probabilidades. Dentro de este tenemos: El modelo de la variable de Bernoulli que es una variable que solo toma dos valores (ej: sexo: F y M) a los cuales se les designa el nombre de “éxito” y “fracaso”, y tiene un único parámetro P que indica la probabilidad del éxito. Con ésta se vincula la variable Binomial la cual además del parámetro P que indica la probabilidad de éxito; el parámetro n que es la cantidad de ensayos; y el r es la cantidad de éxitos observados. Esta variable expresa la cantidad de éxitos en n ensayos, siempre que se esté bajo la condición de estabilidad donde la probabilidad de éxito permanece constante de observación a observación, y bajo la condición de independencia donde las observaciones son independientes, es decir, el resultado de una observación no es afectado por el resultado de cualquier otra observación. En los modelos teóricos se pueden calcular las medidas de tendencia central, las cuales representar la totalidad de las observaciones. Ellas son: La moda que es el valor que se repite con mayor frecuencia y es aplicable al nivel nominal. La mediana que es un valor de la variable que ocupa una posición central determinando dos subconjuntos de valores de la variable, el de los valores mayores que ella y el de los menores. Se aplica desde el nivel ordinal, donde puede no existir. La media es la suma de todas las observaciones dividida por el total de ellas, es el promedio. Se utiliza en variables cuantitativas. En las variables cuantitativas, las medidas de variabilidad o dispersión están asociadas al alejamiento de los datos a la media, y cuanto mas cerca este los datos de la media mas representativa será ésta. Las medidas de variabilidad son: La varianza indica la dispersión de los valores respecto de la media. El desvío estándar es la raíz cuadrada de la varianza. Indica la distancia promedio a la media. Para comparar la variabilidad de dos o más grupos, si la variable es la misma y las medias coinciden o son muy similares, se concluye según la varianza o el desvío. El coeficiente de variación es el cociente entre el desvío estándar y la media. Expresa la variabilidad relativa a la media. Se usa en variables medidas con escala de cocientes o razón. Cuanto más lejos del cero la media es menos representativa y hay mayor variabilidad. Así como el modelo binomial, tenemos el modelo de distribución normal que se ajusta a las observaciones de muchas variables continuas en situaciones extremas. Su representación gráfica se denomina curva o campana de Gauss. Tiene forma acampanada con un solo pico máximo en la medio poblacional y es simétrica. Tiene dos puntos de inflexión, donde cambia la concavidad, en el punto x= media poblacional – desviación poblacional, la curva pasa de ser cóncava hacia arriba a ser cóncava hacia abajo y en el punto x= media poblacional + desviación poblacional la curva pasa de ser cóncava hacia abajo a ser cóncava hacia arriba. Se acerca asintóticamente al eje de abscisas sin llegar a tocarlo. El área total bajo la curva representa el 100% de los casos e indica la probabilidad de que ocurra un suceso. Cuando el desvío poblacional esta fijo y varia la media poblacional toda la curva se desplaza hacia la derecha o hacia la izquierda una distancia que corresponda a la cuantía de variación. Con la media poblacional fija y el desvío poblacional variando lo que sucede es que las abscisas de los puntos de inflexión se acercan o se alejan de la media poblacional. Efecto de la variación de la media Efecto de la variación del desvío poblacional en la distribución poblacional en la distribución normal manteniendo el desvío normal manteniendo la media poblacional constante. poblacional constante. De lo ultimo que voy a hablar es de la relación entre variables que es uno de los objetivos de la Psicología, que estudia con ayuda de la estadística. Para estudiar los problemas referentes variación conjunta de dos variables cuantitativas se utiliza la correlación que estima comportamientos. Para esto usamos el coeficiente de correlación lineal de Pearson, que representa la intensidad lineal entre las dos variables. cuantifica la relación lineal entre dos variables. Este coeficiente se representa con la letra r y nunca es mayor que 1 ni menor que -1. Cuanto mas cerca se esta de -1 o 1, la relación lineal es mas intensa; y cuanto mas cerca del cero, es menos intensa. Para estudiar los problemas referentes a la predicción de los resultados en una de las dos variables, conocidos los resultados de la otra, usamos la regresión. Aquí usamos el coeficiente de determinación que se utiliza para saber el valor de influencia de una variable sobre otra y se expresa en porcentaje del 0 al 100, varía entre 0 y 1. Si r²=1 la relación lineal es perfecta; y si r²=0 la relación lineal es nula. Para determinar la relación entre dos variables cualitativas utilizamos la prueba de Chi- cuadrado que es una prueba de hipótesis. La prueba de hipótesis es un procedimiento estadístico que permite mediante la utilización del muestreo, decidir entre dos hipótesis, una hipótesis Nula (H0) que es la hipótesis contraria de lo que quiere probar el investigador, y la hipótesis Alternativa (H1) que es la que el investigador quiere probar. La decisión entre la H0 y H1, se hace en base a un estadístico de prueba, dependiendo de si cae dentro o fuera de la zona de rechazo. Si el estadístico de prueba toma un valor que pertenece a la zona de rechazo, se rechaza H0; y si el estadístico toma un valor que no pertenece a la zona de rechazo no se rechaza H0. Por lo tanto puede haber dos tipos de errores: Si la hipótesis nula es verdadera y se rechaza, es ERROR DE TIPO I , y si la hipótesis nula es falsa y no se rechaza, se produce el ERROR DE TIPO II. El nivel de significación de la prueba, es la probabilidad de comer ERROR DE TIPO I. En general, es un dato, y de este dato se obtiene el o los puntos críticos, y se conoce la región crítica. En la prueba de Chi-Cuadrado, la hipótesis alternativa sostiene que las variables no son independientes, y la hipótesis nula que las dos variables son independientes. La decisión se toma en base al estadístico Chi-cuadrado de Pearson y a medida que se agranda nos encontramos más próximo a rechazar la hipótesis nula. Para mi fue muy útil armar un cuadro para poder guiarme en el oral y no olvidarme de nada. VARIABLES Variaciones Medir Escala Variable Variable Dis. De Frec. Relac. Entre variables Chi- Cuadrado Correlación Mod. Normal Mod. Binomial Regresión Prueba de Hipótesis V. Bernoulli V. Binomial Med. Tendencia central Resúmenes estadísticos Med. De variabilidad
Report "Resumen de Toda La Materia Estadistica Aguerri"