PARA EMPEZAR A TRABAJAREL LENGUAJE MATEMÁTICO: NOTACIÓN ESTADÍSTICA Variable En matemáticas, una variable representa a un conjunto de valores. Para designar a las distintas variables, existe la convención de emplear letras (normalmente las últimas del alfabeto): X, Y, Z…, en el caso de que se trate de un conjunto infinito y Xi, Yi, Zi…, si se trata de un conjunto finito. Una variable, Xi, estará compuesta por un conjunto de distintas observaciones x1, x2, x3 … xn}, donde xi denota a cualquiera de los elementos de dicha variable. Operador suma Algebraicamente la suma de distintos valores se designa con la letra griega ∑. Si tenemos una variable Xi y queremos expresar la suma de todos los valores, escribiremos: n x i 1 i Esta expresión significa la suma (∑) de todas las observaciones de la variable X (xi) desde 1 hasta n. Operador producto Algebraicamente la suma de distintos valores se designa con la letra griega ∏. Si tenemos una variable Xi y queremos expresar el producto de todos sus valores, escribiremos: n x i 1 i PROPORCIONES, PORCENTAJES, RAZONES Y TASAS 1. Proporciones En una suma de varios sumandos, se denomina proporción al cociente que resulta de dividir un sumando cualquiera entre el total. Todas las proporciones suman 1 y varían entre 0 y 1. Familias distribuidas por personas activas Personas Número de activas familias 1 16 2 20 3 9 4 5 Total 50 Métodos cuantitativos para historiadores. Tutorial_1 2 A B C Su resultado: C Personas Número de 1 Proporción Proporción activas familias 2 1 16 =B2/B$6 0,32 3 2 20 Arrastrar 0,40 4 3 9 0,18 5 4 5 0,10 6 Total 50 1,00 2. Porcentajes Si las proporciones se multiplican por 100, se obtienen los denominados porcentajes. Todos los porcentajes suman 100 y varían entre 0 y 100. A B C Su resultado: C Personas Número de 1 Porcentajes Porcentajes activas familias 2 1 16 =(B2/B$6)*100 32,00 3 2 20 Arrastrar 40,00 4 3 9 18,00 5 4 5 10,00 6 Total 50 100,00 Siempre en un cuadro ofrezcamos proporciones o porcentajes, conviene dar aparte el total, la cifra bruta, para: a) poder reconstruir la estadística primaria; b) valorar su representatividad. Ejemplo: El 100 por cien de las mujeres que estudiaron en el MIT entre 1950 y 1954 se casaron con profesores de dicho centro. Cierto, pero irrelevante, ya que sólo estudió una. OBSERVACIÓN Porcentaje significa dividido entre cien; es decir es el equivalente de una fracción (x/100). Es importante saber leer un porcentaje en notación decimal: 3 % = 3/100 = 0,03. Para transformar correctamente un porcentaje en notación decimal, tan solo hay que desplazar la coma dos posiciones a la izquierda: 2% = 0,02 115 % = 1,15 20 % = 0,20 0,05 % = 0,0005 4,3 % = 0,043 A la inversa, para pasar de una notación decimal a porcentaje hay que multiplicar por 100, desplazando la coma dos posiciones a la derecha 0,02 = 2% 1,15 = 115 % Métodos cuantitativos para historiadores. Tutorial_1 3 Razón Es el cociente (también se le llama así) de dos cantidades cualesquiera. Mientras las proporciones varían 0 ≤ 1 y los porcentajes 0 ≤ 100, las razones pueden tomar cualquier valor. Población española Censo Habitantes 1950 27,976.755 1960 30,430.698 A B C 1 Censo Habitantes Razón 2 1950 27.976.755 3 1960 30.430.698 =B3/B2 La razón es 1,0877. En conclusión, la población de 1960 es 1,09 veces mayor que la de 1950. También podemos decir que se ha multiplicado por un factor 1,09 (coeficiente multiplicador). Tasas A porcentajes y razones a veces se les denomina tasas, pero conviene no hacerlo. El término tasa se reserva para medir una variable en función de otra con la cual está relacionada. Una tasa es un cociente multiplicado por la unidad seguida de tantos ceros como sea necesario para que el número resultante sea fácilmente comprensible u manejable. Ejemplos: a) las tasas de natalidad y de mortalidad son el cociente entre nacimientos (defunciones) y la población total) expresados en tantos por mil. b) la tasa de paro es el cociente entre población trabajadora y población activa expresada en tantos por cien. Un tipo de tasas específico son las llamadas tasas de variación. Las tasas de variación toman siempre como referente el nivel alcanzado el año anterior o el intervalo considerado con anterioridad. Es decir, las tasas de variación traducen el incremento o decremento respecto al periodo anterior (año, mes…) La tasa de variación absoluta (o instantánea) de una variable X es: ∆𝑥𝑡 = xt – xt-1 La tasa de variación relativa o proporcional: ∆𝑥𝑡 𝑥𝑡 −𝑥𝑡−1 𝑥𝑡 𝑥𝑡−1 𝑥𝑡 𝑥̇ = = = − = −1 𝑥𝑡−1 𝑥𝑡−1 𝑥𝑡−1 𝑥𝑡−1 𝑥𝑡−1 La tasa de variación relativa o proporcional es el incremento porcentual en notación decimal. En el ejemplo anterior la variación absoluta = 2.453.943 y la tasa de variación relativa = 0,877. Si la multiplicamos por 100 nos da el incremento porcentual. Con el ejemplo anterior, la población de 1960 es un 8,77 por ciento superior a la de 1950. A B C D Tasa de variación Tasa de variación 1 Censo Habitantes absoluta relativa 2 1950 11.000 3 1960 15.464 =B3-B2 =(B3-B2)/B2 o (B3/B2)-1 Métodos cuantitativos para historiadores. Tutorial_1 4 OBSERVACIÓN Si a la razón le restamos 1, obtenemos el incremento porcentual en notación decimal (la tasa de variación relativa). Si restamos 1 y multiplicamos por cien, obtenemos el incremento porcentual. Es importante no confundir razones y porcentajes y saber pasar correctamente de unas a otros. Si la razón = 1,4 lo que queremos decir es que se ha incrementado un 40 % y no un 4 %. Análogamente una razón de 1,025 = 2,5 % (y no 25 %)… Cualquier razón < 1 = descenso. Ejemplo: Si una magnitud pasa de 150 a 120, la razón = 0,80 = -0,2 = -20 %. EL LENGUAJE MATEMÁTICO: NOTACIÓN CIENTÍFICA Al escribir números, especialmente los que tienen muchos ceros antes o después del punto decimal, interesa emplear la notación científica mediante potencias de 10: 100 = 1 105 = 100.000 101 = 10 106 = 1.000.000 102 = 1.000 107 = 10.000.000 103 = 10.000 108 = 100.000.000 104 = 10.000 109 = 1.000.000.000 8 Al multiplicar un número por 10 el punto decimal se mueve ocho posiciones a la derecha, y al -6 multiplicar por 10 se mueve seis posiciones a la izquierda. Análogamente: 10-1 = 0,1 10-6 = 0,000001 10-2 = 0,01 10-7 = 0,0000001 10-3 = 0,001 10-8 = 0,00000001 10-4 = 0,0001 10-9 = 0,000000001 10-5 = 0,00001 7 -4 Ejemplos: 8,657·10 = 86.570.000; 3,2·10 = 0,00032 La calculadora y el ordenador muchas veces sustituyen el 10 por E o un espacio en blanco seguido del exponente. 6 -4 Ejemplos: 2,500.000 = 2,5·1,000.000 = 2,5·10 = 2,5E6 o 2,5_06; 0,00075 = 7,5·10 = 7,5E-04 REDONDEO DE DECIMALES AL PRESENTAR LOS DATOS A la hora de presentar los datos, cuando redondeemos la respuesta evitaremos el uso abusivo de decimales para no dar una imagen de –falsa– precisión estadística. Aunque la costumbre es utilizar dos decimales, muchas veces bastará con uno solo o ninguno. Sólo utilizaremos más de dos decimales cuando las centésimas no permitan apreciar las diferencias. Métodos cuantitativos para historiadores. Tutorial_1 5 LOGARITMOS Todo número positivo N puede expresarse como potencia de 10; es decir, podemos encontrar p p tal que N = 10 . Se dice que p es el logaritmo de N en base 10 (también logaritmo común, decimal o de Briggs). Ejemplo, log 2 = 0,30103; log 56 = 1,748188… La parte decimal se llama mantisa y el resto, que antecede al número decimal, se llama la característica. Pero no sólo existen logaritmos en base 10. Por definición, el logaritmo de un número N es la potencia a la que hay que elevar un valor constante, b, llamado base para obtener este número: x y = b → y es el logaritmo en base b de x. Usualmente se emplean dos bases: a) la base 10 o logaritmo decimal (log10, y más frecuentemente log) b) la base e ≈ 2,7182 o logaritmo neperiano o natural (loge, pero más frecuentemente, ln) Para pasar de los logaritmos neperianos a los decimales se utiliza la relación logx = 0,434.29 lnx. Inversamente, para pasar de los logaritmos decimales a los neperianos se utiliza la relación l nx = 2,302.59 logx Los logaritmos nos facilitan los cálculos cuando estamos trabajando con valores muy amplios y, sobre todo, cuando tenemos que resolver ciertas ecuaciones (p.e. funciones exponenciales), porque, debido a sus propiedades, transforman: a) un producto en una suma: log xy = logx + logy. b) un cociente en diferencia: log x/y = logx - logy. y c) una potencia en producto: log x = y*logx. 1 y xx y d) una raíz en un cociente: = 1/y*log x Métodos cuantitativos para historiadores. Tutorial_1 6 GRÁFICOS Gráficos cartesianos. La construcción de la curva y En un gráfico los puntos están definidos por un par de coordenadas cartesianas, En la abscisa (x, eje de categorías, horizontal) se representa el tiempo (años, meses, etc.) y en la ordenada (y, eje de valores, vertical), las cantidades (producción, precios, salarios…). Ordenada Eje de valores Abscisa x Eje de categorías Curvas con escala aritmética: la escala de ambos ejes es aritmética. Cuando dos pares de valores experimentan el mismo crecimiento absoluto, gráficamente aparecen representados como paralelas. Las curvas con escala aritmética son más sensibles a las variaciones grandes que a las pequeñas, por lo que tienden a magnificar el crecimiento en la parte superior de la escala y a reducir su importancia en la parte inferior. Si las diferencias en valores absolutos son muy importantes, la parte inferior se lee mal. Escala aritmética 700 600 600 500 ∆ 100 % 400 300 300 200 Paralelas → igual crecimiento absoluto 150 ∆ 50 % 100 100 100 ∆ 100 % 50 0 1900 1901 1902 1903 1904 1905 1906 1907 1908 1909 1910 Curvas semilogarítmicas: la escala de la abscisa es aritmética, mientras la de la ordenada es logarítmica. En un gráfico semilogarímico, dos rectas son paralelas solo cuando sus valores experimentan el mismo crecimiento relativo. Métodos cuantitativos para historiadores. Tutorial_1 7 Su gran ventaja es que nos permite leer directamente los porcentajes de incremento. Esto, sin embargo, puede falsear a veces la interpretación. Desde el punto de vista económico no tiene el mismo significado, ni se puede interpretar de la misma forma, un aumento de una a dos toneladas que uno de dos millones a cuatro millones de toneladas, aunque en ambos casos se haya duplicado el valor inicial. Escala semilogarítmica 1.000 600 Paralelas → igual crecimiento relativo ∆ 100 % 300 150 ∆ 50 % 100 100 100 ∆ 100 % 50 10 1900 1901 1902 1903 1904 1905 1906 1907 1908 1909 1910 PARA ELABORAR UN GRÁFICO SEMILOGARÍTMICO 1. Activamos las fichas contextuales de HERRAMIENTAS PARA GRÁFICOS haciendo clic en el área del gráfico. Elegimos Ficha Presentación → Ejes → Eje vertical primario → Mostrar eje con escala logarítmica; o bien 2. Seleccionamos directamente el eje de valores, desplegamos el menú contextual y activamos la casilla escala logarítmica. PARA MODIFICAR LA ESCALA CON LA QUE APARECEN LOS AÑOS Seleccionar eje horizontal → Botón derecho ratón → Dar formato a eje → Opciones del eje: 1. Intervalo entre marcas de graduación: cada cuánto queremos que aparezcan las marcas (rayitas); 2. Intervalo entre etiquetas: cada cuánto queremos que aparezcan los años. Métodos cuantitativos para historiadores. Tutorial_1 8 Evolución de los precios del trigo en Castilla la Vieja y León, 1500-1650 (mrs. por fanega) Escala aritmética 700 600 500 400 300 200 100 0 1500 1510 1520 1530 1540 1550 1560 1570 1580 1590 1600 1610 1620 1630 1640 1650 Escala semilogarítmica 1.000 100 10 1500 1510 1520 1530 1540 1550 1560 1570 1580 1590 1600 1610 1620 1630 1640 1650 E.J. Hamilton, El tesoro americano y la revolución de los precios en España, 1501-1650, Barcelona, Ariel, 1975, apéndices III-C, pp. 341-45, IV-C, 367-71, y V-C, pp. 394-401. Métodos cuantitativos para historiadores. Tutorial_1 9 Gráficos triangulares Los gráficos triangulares son especialmente adecuados para representar triparticiones, tanto diacrónicas como sincrónicas. Llamamos tripartición a la descomposición de una magnitud en tres componentes expresados en porcentajes (su total suma 100). Ejemplos: la distribución sectorial de la población activa o de la actividad económica (primario, secundario y terciario), la distribución de la población en tres grupos de edad (jóvenes (< 20), adultos (20 > 60), ancianos (> 60)... Estados Unidos: distribución sectorial de población activa, 1850-1870 (en porcentajes) Agricultura Industria Terciario Total 1850 55,0 20,7 24,3 100 1880 50,6 25,1 24,3 100 1920 27,4 34,4 38,2 100 1940 18,0 32,0 50,0 100 1970 4,1 37,1 58,8 100 F. SALY-GIOCANTI, Utiliser les statistiques en histoire, París, Armand Colin, 1992, p. 18. Para representar un gráfico triangular en papel (milimetrado), debemos seguir los siguientes pasos: 1) Preparación de la serie. Si hay más de tres variables, reagruparlas en tres de la forma más racional posible. Si los datos están en valores absolutos, hay que transformarlos en porcentajes. 2) Construir un triángulo equilátero, cuya base sea fácil de graduar (p.e. 10 cm.). o utilizar una 1 plantilla ya elaborada para representar gráficos triangulares . Todos los lados se gradúan de 0 2 a 100, en teoría en el sentido contrario al de las agujas del reloj , si bien algunos programas y las plantillas disponibles en internet diseñadas para elaborar gráficos ternarios los gradúan en el sentido de las agujas del reloj. 3) Asignar a cada uno de los lados del triángulo uno de los tres componentes de la tripartición. El orden es indiferente, pero en el ejemplo escogido, la costumbre es que agricultura se 1 Por ejemplo http://www.waterproof-paper.com/graph-paper/ternary-diagram-triangular-graph-paper.shtml 2 F. SALY-GIOCANTI, Utiliser les statistiques en histoire, pp. 19-20. Métodos cuantitativos para historiadores. Tutorial_1 10 represente en la base del triángulo, la industria en el lado anterior y el sector secundario, en el siguiente. El principio de los diagramas triangulares es el siguiente: 0 % de activos industriales Todos los puntos de esta Terciario Industria línea representan un 50 % de población empleada en el sector terciario 100 % de activos agrícolas Agricultura Todos los puntos de esta línea representan un 20 % de agricultores 1) Para cada año de la serie, marcar el porcentaje correspondiente al primer componente en el eje que hemos escogido para representarlo. Por ejemplo, si hemos elegido la base para el sector agrícola, marcaremos el punto correspondiente al 55 %. Terciario Industria • Agricultura 4) Efectuar la misma operación con el segundo componente (21 %). Para representar un punto son suficientes las coordenadas de dos de las tres variables, por lo que no es necesario representar el tercer componente. 5) Para cada una de las marcas trazar la paralela al lado anterior. La intersección de la rectas determina el punto. Métodos cuantitativos para historiadores. Tutorial_1 11 6) Proceder de la misma forma para el resto de los años. Luego unir los puntos representativos de los años considerados. Terciario Industria • 1970 •1940 •1920 •• 1850 1880 Agricultura El asistente para gráficos de Excel no dispone de ninguna opción para realizar representaciones 3 triangulares, pero existen programas de trazado de gráficos y también libros de Excel programados para ello. El resultado, utilizando http://www- staff.lboro.ac.uk/~gydjg2/downloads/tri-plot_v1-4.xls, es el siguiente: 0 100 Terciario Industria 1970 1940 1920 1850 1880 100 0 100 0 Agricultura 3 Entre el software libre, el programa Triplot: http://mypage.iu.edu/~tthomps/programs/html/tnttriplot.htm. Métodos cuantitativos para historiadores. Tutorial_1 12 Gráficos radiales Duración de los aprendizajes por oficios (506 escrituras) 1880 J.C. Zofío Llorente, Gremios y artesanos en Madrid, 1550-1650. La sociedad del trabajo en una ciudad cortesana preindustrial, Madrid, CSIC/Instituto de Estudios Madrileños, 2005, p. 365. Sea una variable ficticia que asume los siguientes valores: A B 1 1900 100 2 1910 95 3 1920 90 4 1930 85 5 1940 80 6 1950 75 7 1960 70 8 1970 65 9 1980 60 10 1990 55 11 2000 50 Para construir un gráfico radial en Excel a partir de una serie temporal: 1) Seleccionar el rango (A1:B11). 2) Cinta de opciones → Ficha insertar → Tipo radial → Intro. 3) El gráfico contiene dos series, ya que el programa ha considerado los años como una serie. Para eliminar esta: a. Seleccionamos la serie 1 y la suprimimos. b. En Herramientas de gráficos → Diseño → Datos → Seleccionar datos → editamos Etiquetas del eje horizontal (Categoría) y rellenamos el Rango de rótulos del eje seleccionando A1:A11. Métodos cuantitativos para historiadores. Tutorial_1 13 TRABAJANDO CON SISTEMAS MONETARIOS NO DECIMALES Para trabajar con sistemas monetarios no decimales podemos utilizar las funciones matemáticas ENTERO (número) y RESIDUO (número;núm_divisor) Libras-sueldos-dineros (1 libra = 20 sueldos; 1 sueldo = 12 dineros) Servicio de 56 cuarteles y 8 tandas (dos años) de alcabalas otorgado por las cortes de Tudela en 1538 (en libras-sueldos-dineros) A B C D E 1 Cuartel universal [–] Rebates [=] Cuartel Neto [x 56 =] Total 2 M. Pamplona 988-05-00 291-15-01 *696-06-00 38.992-16-00 3 M. Estella 826-16-11 490-18-03 335-18-08 18.810-05-04 4 M. Tudela 419-08-08 217-02-10 202-05-10 11.326-06-08 5 M. Sangüesa 1.191-00-00 173-01-04 1.017-18-08 57.002-05-04 6 M. Olite 634-00-00 316-12-04 317-07-08 17.771-09-04 7 Total 4.059-10-07 1.489-09-10 2.569-16-10 143.911-02-08 8 9 10 Alcabala universal [–] Rebates [=] Alcabala Neta [x2 =] Total 11 M. Pamplona 7.535-00-00 832-12-00 6.702-08-00 13.404-16-00 12 M. Estella 2.289-00-00 243-00-00 2.046-00-00 4.092-00-00 13 M. Tudela 5.247-00-00 126-00-00 5.121-00-00 10.242-00-00 14 M. Sangüesa 5.447-00-00 599-06-00 4.847-14-00 9.695-08-00 15 M. Olite 3.307-00-00 922-00-00 2.385-00-00 4.770-00-00 16 Total 23.825-00-00 2.722-18-00 21.102-02-00 42.204-04-00 *Hay un error de -3 s. 11 d. que se transmite al sumatorio y al total Fuente: M. García-Zúñiga, Hacienda, población y precios (siglos XVI-XVIII), Pamplona, Gobierno de Navarra, 1996, p. 30. A F G H 1 2 M. Pamplona 988 5 3 M. Estella 826 16 11 4 M. Tudela 419 8 8 5 M. Sangüesa 1.191 6 M. Olite 634 7 Total =SUMA(F2:F6) =SUMA(G2:G6) =SUMA(G2:G6) 8 =F7+(ENTERO(( =RESIDUO(G7+ENTERO(H7/1 G7+ENTERO(H7/12))/20) 2);20) =RESIDUO(H7;12) Métodos cuantitativos para historiadores. Tutorial_1 14 rs.-mrs. vn (1 real = 34 mrs.) Balanza comercial de Navarra, 1786 (en rs. vn.-mrs. y porcentajes) A B 1 Exportaciones 2 Lana fina sin lavar 3,423.019-19 3 Lana burda sin lavar 223.826-25 4 Vino 2,267.032-17 5 Sal 162.630-00 6 Legumbres 155.722-17 7 Hierro 151.668-00 8 Trigo 137.429-00 9 Resto 762.912-33 10 Total 7.284.241-09 11 12 Importaciones 13 Textiles 3,386.307-17 14 Cacao 1,239.630-10 15 Azúcar 807.975-00 16 Canela 446.343-28 17 Pimienta 1,567.760-25 18 Cera 905.600-00 19 Quincalla 265.331-00 20 Cueros 590.409-31 21 Resto 4,871.364-08 22 Total a14,080.722-17 a: El documento da un total de 14,028.732-17 Fuente: M. García-Zúñiga, “Comercio y contrabando en Navarra durante el feudalismo desarrollado”, Hacienda Pública Española, monográfico 1/1994, p. 81. A C D 1 Exportaciones 2 Lana fina sin lavar 3.423.019 19 3 Lana burda sin lavar 223.826 25 4 Vino 2,267.032 17 5 Sal 162.630 6 Legumbres 155.722 17 7 Hierro 151.668 8 Trigo 137.429 9 Resto 762.912 33 10 Total =SUMA(C2:C9) =SUMA( C2:C9) 11 =C10+ENTERO(D10/34) =RESIDUO(D10;34)