Estadistica II Poligran

LUIS GABRIEL NIÑO DUARTEANYI YISLENI ORJUELA ARENAS DOCENTE: ANGELA PATRICIA GUERRERO -2013- PROYECTO ESTADISTICA II LUIS GABRIEL NIÑO DUARTE ANYI YISLENI ORJUELA ARENAS INSTITUCION UNIVERSITARIA POLITECNICO GRANCOLOMBIANO ADMINISTRACION DE EMPRESAS (CURRICULO INTEGRADO) VIRTUAL -2013- Distribución Normal. Teorema del Límite Central. las medidas de localización y las medidas de dispersión. Comprender los conceptos teóricos estadísticos haciendo uso de un programa.A.II ENTREGA OBJETIVOS     Calcular y analizar la información proporcionada por las medidas de tendencia central. . Aplicar y comprender correctamente los conceptos de Distribución Binomial. utilizando las funciones de probabilidad para variables aleatorias discretas y para V. Estimación Puntual e Intervalo de Confianza. Utilizar el programa Microsoft Excel para poder realizar cálculos de probabilidad. continuas. Regla de la adición La regla de la adición o regla de la suma establece que la probabilidad de ocurrencia de cualquier evento en particular es igual a la suma de las probabilidades individuales. que dos no pueden ocurrir al mismo tiempo. P(A y B) = P(A B) = P(A)P(B|A) si A y B son dependientes . como la teoría Dempster-Shafer y la teoría de la relatividad numérica. Siendo: P(A) = probabilidad de ocurrencia del evento A.P(E) Los tres métodos para calcular las probabilidades son la regla de la adición. P(A o B) = P(A) U P(B) = P(A) + P(B) si A y B son mutuamente excluyente. esta última con un alto grado de aceptación si se toma en cuenta que disminuye considerablemente las posibilidades hasta un nivel mínimo ya que somete a todas las antiguas reglas a una simple ley de relatividad. Por otra parte. si es que los eventos son mutuamente excluyentes. la probabilidad de que un evento "no ocurra" equivale a 1 menos el valor de p y se denota con la letra q. P(B) = probabilidad de ocurrencia del evento B. La probabilidad de un evento se denota con la letra p y se expresa en términos de una fracción y no en porcentajes. P(Q) = 1 . la regla de la multiplicación y la distribución binomial.MARCO TEÓRICO Teoría de Probabilidad La probabilidad constituye un importante parámetro en la determinación de las diversas casualidades obtenidas tras una serie de eventos esperados dentro de un rango estadístico. es decir. por lo que el valor de p cae entre 0 y 1. Regla de la multiplicación La regla de la multiplicación establece que la probabilidad de ocurrencia de dos o más eventos estadísticamente independientes es igual al producto de sus probabilidades individuales. P(A y B) = P(A B) = P(A)P(B) si A y B son independientes. P(A y B) = probabilidad de ocurrencia simultánea de los eventos A y B. P(A o B) = P(A) + P(B) − P(A y B) si A y B son no excluyentes. Existen diversas formas como método abstracto. Según el tipo de valor que toman las variables pueden ser discretas. La probabilidad de que ocurra un suceso se calcula así: P(A) = Nº de casos favorables / Nº de resultados posibles Esto significa que: la probabilidad del evento A es igual al cociente del número de casos favorables (los casos dónde sucede A) sobre el total de casos posibles. Distribución Binomial . Distribuciones de probabilidad La distribución de probabilidades es un modelo que describe la forma en que varían los resultados de un experimento aleatorio. P(A) = 1. las variables reales son las que toman valores con decimales y las variables continuas son las que toman los valores en un intervalo. La variable aleatoria toma diferente valores dependiendo del resultado del experimento aleatorio. es decir. Variable aleatoria La variable aleatoria está asociada con los resultados de los experimentos aleatorios. reales o continuas. se dice que el experimento es aleatorio. que todos tengan o posean la misma probabilidad. Experimento aleatorio Es definido como un proceso o actividad que al ejecutarse puede dar uno o varios posibles resultados. La probabilidad de ocurrencia de un suceso seguro es 1. Si es al “AZAR” lo que define el resultado. Para aplicar la regla de Laplace es necesario que los experimentos den lugar a sucesos equiprobables. es decir.Regla de Laplace La regla de Laplace establece que: La probabilidad de ocurrencia de un suceso imposible es 0. Las variables discretas son aquellas cuyos valores son números enteros. * Ensayos.Es una distribución de probabilidad discreta.BINOM”. Cada experimento tiene dos resultados posibles: ÉXITO O FRACASO. Esta distribución de caracteriza porque los valores se distribuyen formando una campana de Gauss. que se desean estimar (xi). el comando “DISTR. Todo experimento que tenga esas características se le puede aplicar el modelo binomial. en insertar función. El resultado obtenido en cada prueba es independiente. Además. * Acumulado.BINOM devuelve la función de distribución acumulada. * Prob_éxito.p). es el número de ensayos independientes o repeticiones que se realizan (ni). La variable binomial es una variable aleatoria discreta que solo puede tomar los valores. La importancia de la distribución normal se debe principalmente a que hay muchas variables asociadas a fenómenos naturales que siguen el modelo de la normal. en torno a un valor central que coincide con el valor medio de la distribución: Un 50% de los valores están a la derecha de este valor central y otro 50% a la izquierda. la probabilidad de éxito se mantiene constante entre un experimento y otro. y su ventaja reside en que hay tablas donde se recoge la probabilidad acumulada para cada punto de la curva de esta distribución. es un valor lógico que determina la forma de la función. mide el número de éxitos en una secuencia de n ensayos independientes. Para ello. Cuando la media de la distribución es 0 y la varianza es 1. si es FALSO. cuando los resultados de un ensayo son sólo éxito o fracaso. debemos calcular estas por combinaciones (número combinatorio n sobre X). . con una probabilidad fija de ocurrencia del éxito entre los ensayos. Si el argumento acumulado es VERDADERO. devuelve la probabilidad para una condición en particular. se denomina "normal tipificada". es el número de éxitos en los ensayos. donde la probabilidad de ÉXITO es p y la probabilidad de fracaso es q=1-p. selecciona dentro del tipo de funciones estadísticas. Como hay que considerar todas las maneras posibles de tener X-éxitos y (n-X)-fracasos. Los argumentos de la función: * Núm_éxito. cuando los ensayos son independientes y cuando la probabilidad de éxito es constante durante todo el experimento (p).…n suponiendo que se han realizado n pruebas. Microsoft Excel nos permite calcular la probabilidad de obtener un número concreto de éxitos (P(X=xi)) de una variable aleatoria discreta que sigue una distribución binomial B(n. que es la probabilidad de que exista el máximo número de éxitos. DISTR. en problemas con un número fijo de pruebas o ensayos (n). toda distribución normal se puede transformar en una normal tipificada. es la probabilidad de éxito en cada ensayo (p). Distribución Normal Las distribuciones de probabilidad normal también son conocidas como la distribución de gauss o distribución gaussiana. ESTAND(z)”. en una distribución normal de media cero y desviación típica uno. se encuentra por debajo del valor “a”.1). De ‘esta forma la variable . N( μ. La función DISTR. la distribución de la suma de variables aleatorias tiende a una distribución normal cuando la cantidad de variables es muy grande. la fórmula es el entero desde el infinito negativo a x de la fórmula dada..NORM”. la función DISTR. si n es suficientemente grande. Si el argumento Acum. Tiene un gran número de aplicaciones en estadística.NORM. selecciona dentro del tipo de funciones estadísticas. el comando “DISTR. perteneciente a la teoría de la probabilidad. (P(X ≤ a) ). * Media es la media aritmética de la distribución (parámetro μ). N(0. también nos permite conocer cómo se estandarizan o tipifican las variables. Teorema del Límite Central El teorema del límite central o teorema central del límite indica que. en condiciones muy generales.NORM devuelve la función de distribución acumulada. encuentra aplicación en muchos campos relacionados. * Desv_estándar es la desviación estándar de la distribución (parámetro σ). en insertar función. Entonces. Esta opción devuelve la función de distribución normal estándar acumulativa. Éste teorema. Esta función. es decir.…. X2. selecciona dentro del tipo de funciones estadísticas. la variable aleatoria Tiene una distribución aproximadamente normal con media µ x=µ y σx=σ/n1/2.ESTANDAR nos permite calcular la probabilidad que. Los parámetros a definir son: * X es el valor cuya distribución desea obtener (xi = a). La distribución tiene una media de 0 (cero) y una desviación estándar de uno. La función DISTR. (P(Z ≤ a) =?). el comando “DISTR. Esta función nos proporciona las mismas probabilidades que la tabla estándar de áreas de curvas normales. es VERDADERO. Para ello. en insertar función. Para ello. σ). * Acum. si es FALSO.Xn una muestra aleatoria de una población cuya distribución tiene por media µ y por desviación estándar σ. devuelve la distribución normal para la media y desviación estándar especificadas. devuelve la función de masa de probabilidad. como los valores de una normal tipificada o estandarizada.NORM. incluidas las pruebas de hipótesis. es un valor lógico que determina la forma de la función. A su vez.σ) deja por debajo el valor “a”. permite buscar la probabilidad que en una distribución normal de parámetros N (μ.NORMAL. tales como la inferencia estadística o la teoría de renovación. El enunciado del teorema es el siguiente: Sea X1.Microsoft Excel nos permite calcular la probabilidad de una variable aleatoria continua que sigue una distribución normal tanto con una media y desviación típica de cualquier valor. La mayoría de las distribuciones de probabilidad dependen de cierto número de parámetros. El objetivo de la estimación puntual es usar una muestra para obtener números que. Estimación Puntual La estadística provee técnicas que permiten obtener conclusiones generales a partir de un conjunto limitado – pero representativo – de datos. Sin embargo. xn. Antes de obtener la muestra no sabemos cuál será el valor de cada observación.valor lógico verdadero (1) si es acumulado]¨ El número de éxito x depende de la condición dada en la actividad. La estimación por intervalo: es aquella que calcula un intervalo que contenga entre sus límites.p(probabilidad de éxito). . la segunda una v. X1. la estadística permite cuantificar el error asociado a la estimación. con cierta probabilidad. x2... el primer paso a seguir es determinar los parámetros requeridos para ser insertados en la función de Excel ¨DISTR.Se distribuye aproximadamente normal estándar. Xn a las observaciones y. Así.n(ensayos).. Cuando inferimos no tenemos garantía de que la conclusión que obtenemos sea exactamente correcta. la primera observación puede ser considerada una v. X2. etc.. Salvo que estos parámetros se conozcan.a.N[x(número de éxito).. 1. el verdadero valor del parámetro poblacional. sin embargo es necesario hallar las probabilidades particulares desde x=0 hasta x=10 con el fin de dar respuesta a todas las preguntas planteadas en ésta parte. conforme n se hace grande. Se obtiene a partir de alguna función de la muestra. sean los que mejor representan a los verdaderos valores de los parámetros de interés. Por lo tanto. PROCEDIMIENTO Distribuciones de probabilidad... La resolución del primer punto es presentada en la hoja de cálculo “1° Distribución Binomial’’. antes de obtener la muestra denotaremos X1. Supongamos que se selecciona una muestra de tamaño n de una población.a. Estimación de Parámetros.. X2. Un estimador puntual de un parámetro θ es un valor que puede ser considerado representativo de θ y se indicará θ´.. Como necesitamos simular una distribución binomial. en algún sentido. deben estimarse a partir de los datos. una vez obtenida la muestra los valores observados los denotaremos x1..BINOM. Este intervalo se llama INTERVALO DE CONFIANZA. plasmadas en la tabla que se muestra a continuación: x P[X=x] 0 P[X=0] 1 P[X=1] 2 3 P[X=2] P[X=3] 4 5 P[X=4] P[X=5] 6 P[X=6] 7 P[X=7] 8 P[X=8] 9 10 P[X=9] P[X=10] 0. A continuación desarrollamos las preguntas planteadas en éste punto. por lo tanto su valor es n=10. Utilizando la función de Excel PROMEDIO para la columna que contiene los INGRESOS conseguimos la media µ = 5342.P nos arroja la desviación estándar para el grupo de datos a analizar σ=4832. de modo que p corresponde a la (cantidad de clientes con hobby viajar)/(total de clientes). se expresa como la suma de las probabilidades de éxito para el intervalo de X=2 y X=5. corresponde entonces a la suma de las probabilidades para los números de éxito de 3 a 10. la determinamos a partir de las tablas dinámicas desarrolladas en la entrega anterior.453.1698618 0.NORM.253. entonces p=335/1895. concluimos que se espera que 2 clientes en una muestra de 10 tengan como hobby viajar y de la misma forma 335 clientes se ajustan a éste criterio de la población total de 1895 clientes. un cliente seleccionado al azar tiene como probabilidad de tener un ingreso . llegando al valor de 0.3881E06 2.0029437 1 0.N.9089E05 1. La probabilidad de éxito para los clientes con hobby viajar (3 en la base de datos).1429400 2 0. De manera similar la parte b). Lo anterior con el fin de obtener los parámetros requeridos por la función DISTR. Una vez hallados los parámetros anteriores. el tamaño de toda la población y el tamaño de la muestra. obteniendo un valor de 0.El número de ensayos n es una condición dada. Conociendo la probabilidad de éxito para éste caso en particular. Similarmente la función DESVEST.2966243 3 0. Tanto el segundo como tercer problema son resueltos en la hoja de cálculo “2° y 3° Distribución Normal “.0638342 8 0. procedemos a calcular las respectivas probabilidades de éxito para cada caso en particular. 2.547 como respuesta.0003612 2 2.3069545 3 0.981E-08 La respuesta al inciso a).0164496 0. ya que satisfacen la condición impuesta. 000. Para resolver el último punto necesitamos primero tomar 20 valores aleatorios de clientes.P(Z < -0.000) = P(Z < 0. resultando en Zs= 0. mientras que la probabilidad de tener un ingreso entre 3´000.472.inferior a $5´000.”.0188) .000<X<6'500. Por último tenemos que P(X≥6'000.017) = 0. Para todas las preguntas tenemos el mismo σx= 392.579. para el cual normalizamos los datos nominales con la fórmula y Donde n corresponde al tamaño de la población y es el valor promedio de referencia a utilizar según la pregunta que estemos respondiendo. .017. donde los estimadores máximo verosímiles son la media y la varianza muestrales.028 y la cantidad de datos n = 20. los cuales son mostrados en la hoja de cálculo “4°Estimadores e Intervalo de C.000) .000. función Con la misma lógica anterior para hallar el valor de la probabilidad de que la media de la muestra se encuentre entre 2´000.999) es calculado utilizando la DISTR.2. obteniendo µ = 2793 y σ= 2485.999) = 0. En nuestro caso para simplificar los cálculos seleccionamos el Método de Máxima Verosimilitud. Entonces para obtener la probabilidad de que la muestra aleatoria de 40 tenga una media superior a 2´400. Posteriormente tenemos que seleccionar un criterio para realizar la estimación puntual para la media y la varianza del INGRESO. para la cual sólo necesitamos el valor estándar Z. P(X<5´000. los cuales obtenemos como = 5459 y = 7236251.0000 y 6´500.000) = 1 .000) = 0.95.446.999. La desviación estándar sería entonces la raíz cuadrada del último valor es decir σ=2690. Para la resolución del tercer apartado comenzamos por hallar la media y la desviación estándar de los GASTOS siguiendo las instrucciones descritas anteriormente. respectivamente.000) = 0.485 Para la última pregunta de éste punto.000.000) = P(Z > -0.S respectivamente. 237. P(2'000.017) = 0. con la funciones de Excel PROMEDIO y VAR.N. tenemos Z = -2. necesitamos normalizar éstos dos valores anteriores.000 corresponde a P(3'000.000) = 0. tenemos un valor de Z = -0.P(X<3´000. 3.841 Cabe resaltar que P(Z < -0.022 4.019 y Zi= .ESTAND.017.000< < 2'800.281.NORM.P(X<6´000.000 y 2´800.000) = P(X<6´500. por lo cual P( <2'000.P(Z < -2.000) = P(Z < -2. El siguiente paso involucra la utilización del Teorema del Límite Central.999) = 1 . P( >2'400. Posteriormente queremos inferir de los datos recién hallados un intervalo de confianza del 95% para estimar el INGRESO promedio de todos los clientes.96] = 0.95 La expresión para determinar el intervalo de confianza es entonces Donde Zα/2 = 1. entonces reemplazando los respectivos valores en la anterior expresión obtenemos un intervalo de confianza del 95% de (4280. .96.04 .96 ≤ Z ≤ 1. 6637.96) para estimar el INGRESO promedio de todos los clientes. Éste intervalo de confianza es mostrado gráficamente en la siguiente curva normal tipificada Entonces la partición de Z para obtener un intervalo de confianza de µ del 95% P[-1. y un evento cierto tiene una probabilidad uno de ocurrir.CONCLUSIONES       La distribución de frecuencia es una tabla de resumen en la que los datos se disponen en agrupamientos o categorías convenientemente establecidas de clases ordenadas numéricamente. . La principal ventaja de usar una de estas tablas de resumen es que las principales características de los datos se hacen evidentes inmediatamente para el lector. La probabilidad involucrada es una porción o fracción cuyo valor varía entre cero y uno exclusivamente. En esta práctica hemos utilizado el Microsoft Excel para los cálculos de probabilidades. siendo éste como muchos otros programas más accesibles. tiene una probabilidad de cero. La regla más evidente para las probabilidades es que deben variar en valor de 0 a 1. el evento nulo). Un evento imposible tiene una probabilidad cero de ocurrir. llegando a ver las diferencias entre ambos casos con respecto a la distribución de los datos. tiene una probabilidad de uno. y con funciones completas. Se aprendieron a utilizar métodos de estimación puntual y estimación por intervalo. el evento cierto). como herramienta para inferir datos estadísticos a partir de una pequeña muestra aleatoria de una población. Observamos un evento que no tiene posibilidad de ocurrir (es decir. La probabilidad es la posibilidad u oportunidad de que suceda un evento particular. Se pudo realizar con ejemplos el cálculo de la función de probabilidad y distribución para variables aleatorias discretas que siguen una distribución Binomial y. La probabilidad simple se refiere a la probabilidad de ocurrencia de un evento simple. mientras que un evento que seguramente ocurrirá (es decir. La principal desventaja de tal tabla de resumen es que no podemos saber cómo se distribuyen los valores individuales dentro de un intervalo de clase particular sin tener acceso a los datos originales. para variables aleatorias continuas que siguen una distribución normal. org/wiki/Distribuci%C3%B3n_de_probabilidad http://es. en este caso está en orden de la primera entrega a la segunda. BIBLIOGRAFÍA           http://es.wikipedia.wikipedia.ucr.scribd.shtml .unal.org/wiki/DistribuciónNormal http://es.edu.co/cursos/odontologia/2002890/lecciones/ estimacion/estimacion.us.php/Momento_de_una_variable_aleatoria http://www.htm http://es.org/wiki/EstimaciónPuntual http://www.monografias.ac.pdf http://enciclopedia.Nota: En el documento de Excel puede encontrar todas las pestañas de la primera y segunda entrega.org/wiki/TeoremadelLímiteCentral http://es.wikipedia.cr/pdf/xs-0113/dprob.org/wiki/DistribuciónBinomial http://es.com/doc/51233337/Algunos-conceptos-deprobabilidad-y-estadistica-inferencial-ilustrados-mediantesimulaciones-utilizando-Excel http://www.wikipedia.com/trabajos91/distribuciones-continuas-excel-ywinstats/distribuciones-continuas-excel-y-winstats.estadistica.es/index.wikipedia.virtual. Aplicar y explorar las herramientas estadísticas de Excel. Aprender a utilizar las leyes de probabilidad.I ENTREGA OBJETIVOS     Aprender a analizar datos en las tablas de doble entrada o tablas dinámicas. Analizar estadísticamente los resultados . el tercer cuartil. en intervalos que comprenden el mismo número de valores. Para algunos valores u . es decir. Los cuartiles. Q (u): Q(u) Mediana Cuartiles Deciles Centiles Los cuartiles son los tres valores que dividen al conjunto de datos ordenados en cuatro partes porcentualmente iguales. El primer cuartil. Cuántiles: Son medidas de posición que se determinan mediante un método que determina la ubicación de los valores que dividen un conjunto de observaciones en partes iguales. Q2. cuando dividen la distribución en cien partes. . es el valor en el cual o por debajo del cual quedan las tres cuartas partes (75%) de los datos. Los más usados son los cuartiles. cuando dividen la distribución en cuatro partes. los deciles. se dan nombres particulares a los cuantiles. son en cierta forma una extensión de la mediana. Se encargan de resumir y ordenar la información contenida en la BD. Hay tres cuartiles denotados usualmente Q1. como los deciles y los percentiles.MARCO TEÓRICO 1. 2. Q3. Cuando la distribución contiene un número alto de intervalos o de marcas y se requiere obtener un promedio de una parte de ella. Los cantiles son los valores de la distribución que la dividen en partes iguales. también llamadas pivot tables. se puede dividir la distribución en cuatro. son una herramienta para análisis de bases de datos (BD). El segundo cuartil es precisamente la mediana. cuando dividen la distribución en diez partes y los centiles o percentiles. es el valor en el cual o por debajo del cual queda un cuarto (25%) de todos los valores de la sucesión (ordenada). en diez o en cien partes. Tablas Dinámicas Las tablas dinámicas. 3. P(A o B) = P(A) U P(B) = P(A) + P(B) si A y B son mutuamente excluyente. P(A y B) = P(A B) = P(A)P(B|A) si A y B son dependientes Regla de Laplace: . Regla de la multiplicación: La regla de la multiplicación establece que la probabilidad de ocurrencia de dos o más eventos estadísticamente independientes es igual al producto de sus probabilidades individuales. con una BD con gran cantidad de campos o columnas. por lo que el valor de p cae entre 0 y 1. que dos no pueden ocurrir al mismo tiempo. Por otra parte. La probabilidad de un evento se denota con la letra p y se expresa en términos de una fracción y no en porcentajes. P(Q) = 1 .Esta clase de tablas permiten analizar sólo una porción de la BD. Siendo: P(A) = probabilidad de ocurrencia del evento A. Existen diversas formas como método abstracto. es decir. la probabilidad de que un evento "no ocurra" equivale a 1 menos el valor de p y se denota con la letra q. la regla de la multiplicación y la distribución binomial. Las pivot tables están basadas en dos conceptos: sumarización y rotación. P(B) = probabilidad de ocurrencia del evento B. si es que los eventos son mutuamente excluyentes.P(E) Los tres métodos para calcular las probabilidades son la regla de la adición. como la teoría Dempster-Shafer y la teoría de la relatividad numérica. P(A o B) = P(A) + P(B) − P(A y B) si A y B son no excluyentes. P(A y B) = probabilidad de ocurrencia simultánea de los eventos A y B. es decir. ayudan a visualizar únicamente la información relevante. esta última con un alto grado de aceptación si se toma en cuenta que disminuye considerablemente las posibilidades hasta un nivel mínimo ya que somete a todas las antiguas reglas a una simple ley de relatividad. Teoría de Probabilidad La probabilidad constituye un importante parámetro en la determinación de las diversas casualidades obtenidas tras una serie de eventos esperados dentro de un rango estadístico. P(A y B) = P(A B) = P(A)P(B) si A y B son independientes. con lo que el análisis se torna más sencillo. Regla de la adición: La regla de la adición o regla de la suma establece que la probabilidad de ocurrencia de cualquier evento en particular es igual a la suma de las probabilidades individuales. "Bajo". M y D. Ampliación de la Base de Datos Ésta se llevó a cabo mediante la redefinición de categorías mediante la conversión de variables de tipo cuantitativo a cualitativo. es decir."Bajo"."Alto". Créditos y Gastos.SI(D2<1200."Medio")) Crédito: =SI(M2>10500. crédito y gasto cualitativamente. P(A) = 1. Donde las columnas C. Ingresos: =SI(C2>6700.k). La función utilizado en Excel fue la siguiente: =PERCENTIL(matriz. donde “matriz” corresponde al rango de valores y “k” al respectivo cuartil a utilizar. que todos tengan o posean la misma probabilidad.La regla de Laplace establece que: La probabilidad de ocurrencia de un suceso imposible es 0."Alto". La probabilidad de que ocurra un suceso se calcula así: P(A) = Nº de casos favorables / Nº de resultados posibles Esto significa que: la probabilidad del evento A es igual al cociente del número de casos favorables (los casos dónde sucede A) sobre el total de casos posibles. Utilizando condiciones lógicas en Excel se realizó la clasificación de éstas variables según el criterio descrito en el paso anterior de la manera presentada abajo."Alto"."Medio")) Gastos: =SI(D2>3500. de ésta manera se llegaron a definir los siguientes criterios: Ingresos Crédito Gastos Alto I ˃ 6700 C ˃ 10500 G ˃ 3500 Medio 6700 ≥ I ≥ 2285 10500 ≥ C ≥ 2000 3500 ≥ G ≥ 1200 Bajo I < 2285 C < 2000 G < 1200 A continuación se crearon las nuevas columnas Ingresos. corresponden a Ingresos.SI(C2<2285. La probabilidad de ocurrencia de un suceso seguro es 1. se procedió a determinar los intervalos alto. explicado en detalle a continuación. Estos cómputos se pueden encontrar en la hoja de cálculo “Percentiles”.SI(M2<2000. medio y bajo."Bajo"."Medio")) . para clasificar de ésta manera a las variables ingresos. Para aplicar la regla de Laplace es necesario que los experimentos den lugar a sucesos equiprobables. es decir. Crédito y Gastos respectivamente de la hoja de cálculo “Datos”. Utilizando el criterio de los percentiles de 25 y 75 (cuartiles). PROCEDIMIENTO 1. "2"). 2.La variable “Sexo” tuvo que ser redefinida como “Género”. todo lo anterior teniendo en cuenta que debido a que las variables son de tipo cualitativo la configuración de campo de valor de la tabla dinámica debe estar en “Cuenta”. con el fin de facilitar el siguiente paso de la actividad. Más específicamente. se selecciona el rango de datos. De ésta manera se obtuvieron las siguientes tablas dinámicas. correspondiente a mujeres a “2”. la creación de las tablas dinámicas. se procedió a utilizar los respectivos rangos de datos organizados en 5 grupos de la hoja de cálculo “Reorganización Info”. Tablas Bidimensionales (Tablas Dinámicas) Para la creación de las 5 tablas dinámicas requeridas."1". luego se le da click a la opción insertar tabla dinámica y por último se determina cual variable corresponde a las columnas y cual a las filas. Tabla Dinámica Bidimensional Ingreso y Crédito Cuenta Agencia de Crédito Ingresos Alto Bajo Medio Total general Alto 273 8 177 458 Bajo 60 217 146 423 Medio 136 249 629 1014 Total general 469 474 952 1895 Medio 66 53 849 968 Total general 469 474 952 1895 Tabla Dinámica Bidimensional Ingreso y Gastos Cuenta Agencia Ingresos Alto Bajo Medio Total general de Gastos Alto 403 57 460 Bajo 421 46 467 Tabla Dinámica Hobby y Género Cuenta Agencia Hobby de Género 1 2 Total . Una vez ampliada la base de datos. para de ésta manera hacer coincidir los datos con la descripción del problema. se procedió a añadir la hoja de cálculo “Reorganización Info”. para crear una tabla dinámica bidimensional en Excel. condicionales y conjuntas para las variables seleccionadas. a partir de las cuales se pueden determinar las probabilidades marginales. primero convirtiendo todos los valores dados en la primera de formato de texto a número y posteriormente creando la columna Género donde se modificó el número “0”. donde I corresponde a la columna “Sexo” de la hoja de cálculo “Datos”. usando la función de Excel =SI(I2=1. . 0. Los valores utilizados para responder a cada pregunta pueden ser verificados observando la fórmula utilizada en Excel para cada casilla. se respondieron las 8 preguntas planteadas y se formularon 3 más.7235 . pero son mostradas de nuevo a continuación. .077 .La probabilidad de que tenga ingreso alto o un gasto medio. 0.La probabilidad de que tenga ingreso medio y crédito bajo.La probabilidad de que no tenga un ingreso alto.1 2 3 4 5 Total general 194 212 143 177 160 886 215 232 192 194 176 1009 general 409 444 335 371 336 1895 Tabla Dinámica Ingresos y Número de Personas Cuenta de Agencia Ingresos Alto Bajo Medio Total general Personas 0 137 219 311 667 1 66 96 200 362 2 153 109 288 550 3 91 42 129 262 4 15 6 21 42 5 6 2 2 10 6 1 7 1 1 1 Total general 469 474 952 1895 Tabla Dinámica Género y Nivel de Educación Cuenta Agencia Género 1 2 Total general de Educación 1 274 356 630 2 431 462 893 3 102 105 207 4 79 86 165 Total general 886 1009 1895 3. Las respuestas se encuentran en la hoja de cálculo “Cálculo de Probabilidades”. Cálculo de Probabilidades Utilizando las tablas dinámicas creadas en el paso anterior y la teoría de la probabilidad. ¿Cuál es la probabilidad de que tenga un nivel de estudios de doctorado? 0.4743 -¿Si tiene ingreso bajo.0807 . 0.0886 -¿Cuál es la probabilidad de que sea una mujer que tenga un nivel de estudios de maestría? 0. cuál es la probabilidad de que sean un hombre? 0.¿Si tiene como hobby el cine.0.6412 .¿Cuál es la probabilidad de que tenga un nivel de ingresos alto y este a cargo de 2 personas? 0.¿Cuál es la probabilidad de que sea hombre y tenga como hobby leer? 0. No son eventos independientes ya que hay 60 clientes que coinciden con ingreso alto y crédito bajo.0871 .La probabilidad de que no tenga ingreso bajo ni tenga crédito bajo.0554 -¿Son independientes los eventos la persona tiene Ingreso alto y el crédito bajo?.7525 . cuál es la probabilidad de que tenga tres personas a cargo? 0.0934 . . Justifique su respuesta. mientras que un evento que seguramente ocurrirá (es decir. permiten establecer valores representativos para convertir variables cuantitativas a cualitativas. Observamos un evento que no tiene posibilidad de ocurrir (es decir. el evento nulo). La probabilidad involucrada es una porción o fracción cuyo valor varía entre cero y uno exclusivamente. La principal desventaja de tal tabla de resumen es que no podemos saber cómo se distribuyen los valores individuales dentro de un intervalo de clase particular sin tener acceso a los datos originales. condicionales y conjuntas para de éste modo facilitar el cálculo de la probabilidad de ocurrencia de eventos determinados. Las tablas dinámicas permiten expresar de manera gráfica probabilidades marginales. Un evento imposible tiene una probabilidad cero de ocurrir. La principal ventaja de usar una de estas tablas de resumen es que las principales características de los datos se hacen evidentes inmediatamente para el lector. La regla más evidente para las probabilidades es que deben variar en valor de 0 a 1. el evento cierto).CONCLUSIONES      La distribución de frecuencia es una tabla de resumen en la que los datos se disponen en agrupamientos o categorías convenientemente establecidas de clases ordenadas numéricamente. y un evento cierto tiene una probabilidad uno de ocurrir. tiene una probabilidad de uno. tiene una probabilidad de cero. La probabilidad es la posibilidad u oportunidad de que suceda un evento particular. La utilización de pecentiles (cuartiles en nuestro caso). . La probabilidad simple se refiere a la probabilidad de ocurrencia de un evento simple. wikipedia.org/wiki/TeoríadeProbabilidad .wikipedia.BIBLIOGRAFÍA    http://es.org/wiki/TablasDinámicas http://es.wikipedia.org/wiki/Distribuci%C3%B3n_de_probabilidad http://es.

Comments

Description