Física Molecular (termodinámica) A.Kikoin Kikoin

INDICE DEL LIBRO GUÍA DE FISICA PARA ING.EN CIENCIAS ECONÓMICAS Y FINANCIERAS 1.TEORÍA CINÉTICA DE LOS GASES...................................................................................................2 1.1.GAS IDEAL........................................................................................................................................3 1.2.PRESIÓN DEL GAS..........................................................................................................................3 1.3.TEMPERATURA...............................................................................................................................8 1.4.ECUACIÓN DE ESTADO DEL GAS IDEAL................................................................................15 1.5.MOVIMIENTO BROWNIANO.......................................................................................................17 1.6.FORMULA BAROMÉTRICA ........................................................................................................23 1.7.LEY DE BOLTZMANN...................................................................................................................26 1.8.CONCEPTO DE PROBABILIDAD..............................................................................................27 1.9.CONCEPTO DE DISTRIBUCIÓN. FUNCIÓN DE DISTRIBUCIÓN......................................31 1.10.DISTRIBUCION DE LAS MOLECULAS SEGÚN LAS COMPONENTES DE LA VELOCIDAD.........................................................................................................................................33 1.11.DISTRIBUCIÓN DE LAS MOLÉCULAS POR VELOCIDADES..............................................37 1.12.VELOCIDADES MEDIAS DE LAS MOLECULAS....................................................................44 1.13.VELOCIDAD MÁS PROBABLE DE LAS MOLECULAS.........................................................46 1.14. FOMULAS DE MAXWELL PARA LAS VELOCIDADES RELATIVAS..................................47 2.TEORÍA CINÉTICA DEL CALOR......................................................................................................51 LEY DE CONSERVACIÓN DE LA ENERGÍA.....................................................................................51 2.1.ENERGÍA INTERNA DEL GAS IDEAL........................................................................................51 2.2.CANTIDAD DE CALOR.................................................................................................................52 2.3.EQUIVALENTE MECÁNICO DEL CALOR..................................................................................53 2.4.PRIMER PRINCIPIO DE LA TERMODINÁMICA.......................................................................54 2.5.CAPACIDAD CALORÍFICA DE LOS GASES IDEALES.............................................................58 2.6.CAPACIDAD CALORÍFICA DE LOS GASES Y NÚMERO DE GRAOS DE LIBERTAD DE LAS MOLÉCULAS................................................................................................................................60 2.7.CAMBIO DEL ESTADO AL VARIAR EL VOLUMEN DEL GAS...............................................61 2.8.TRABAJO DURANTE EL CAMBIO ISOTÉRMICO DEL VOLUMEN DEL GAS IDEAL........62 2.9.CAMBIO ADIABÉTICO DEL VOLUMEN DEL GAS IDEAL.....................................................63 2.10. TRABAJO DURANTE EL CAMBIO ADIABÁTICO DEL VOLUMEN DEL GAS..................66 3.ELEMENTOS DE LA TERMODINÁMICA.......................................................................................69 3.1.ESTADOS DE EQUILIBRIO...........................................................................................................69 3.2.PROCESOS REVERSIBLES E IRREVERSIBLES........................................................................71 3.3.PROCESOS CUASIESTÁTICOS....................................................................................................74 3.4.IRREVERSIBILIDAD Y PROBABILIDAD...................................................................................75 3.5.TRANSFORMACIONES MUTUAS DE LA ENERGÍA MECÁNICA Y TÉRMICA...................78 3.6.PRIMER PRINCIPIO DE LA TERMODINÁMICA.......................................................................78 3.7.TRANSFORMACIÓN DEL CALOR EN TRABAJO MECÁNICO...............................................80 3.8.CICLO DE CARNOT.......................................................................................................................82 3.9.MÁQUINA REFRIGERADORA.....................................................................................................88 3.10. DEMOSTRACIÓN DE LOS TEOREMAS DE CARNOT...........................................................88 3.11.ENERGÍA LIBRE...........................................................................................................................91 3.12.ENTROPÍA.....................................................................................................................................94 3.13. ENTROPIA DURANTE LOS PROCESOS REVERSIBLES EN UN SISTEMA CERRADO..102 3.14. SEGUNDO PRINCIPIO DE LA TERMODINÁMICA Y TRANSFORMACIÓN DEL CALOR EN TRABAJO......................................................................................................................................103 3.15. SENTIDO FISICO DE LA ENTROPIA. ENTROPIA Y PROBABILIDAD..............................107 3.16. ENTROPIA Y DESORDEN........................................................................................................111 3.17. DIABLO DE MAXWELL..........................................................................................................113 1 4.FUNDAMENTOS BÁSICOS...............................................................................................................114 4.1.DE LA NECESIDAD DE FUNDAMENTOS BÁSICOS..........................................................................................114 4.2.LEYES BÁSICAS DE LA MECÁNICA BÁSICA DE NEWTON Y VARIAS MANERAS DE EXPRESARLAS ..........................114 4.3.SELECCIÓN DE LA FORMULACIÓN............................................................................................................114 4.4.ORIGEN DE LAS LEYES BÁSICAS..............................................................................................................115 4.5.DE LOS CONCEPTOS Y MAGNITUDES BÁSICAS EMPLEADAS............................................................................115 4.6.CONDICIONES DE VALIDEZ DE LAS LEYES DE NEWTON ...............................................................................115 4.7.DOS TIPOS GENERALES DE PROBLEMAS DE DINÁMICA.................................................................................121 4.8.MÉTODOS GENERALES PARA SOLUCIONAR PROBLEMAS DE DINÁMICA.............................................................121 4.9.EJEMPLO ILUSTRATIVO DE LOS NUMERALES 1.7 Y 1.8...............................................................................122 4.10.RESUMEN Y OBSERVACIONES................................................................................................................124 4.11.PROBLEMAS Y PREGUNTAS DE REPASO...................................................................................................125 5.FUNDAMENTOS BÁSICOS II...........................................................................................................127 5.1.OBSERVACIONES INTRODUCTORIAS..........................................................................................................127 5.2.SISTEMAS DE COORDENADAS Y ECUACIONES DE TRANSFORMACIÓN...............................................................127 5.3.COORDENADAS GENERALIZADAS. GRADOS DE LIBERTAD.............................................................................134 5.4.GRADOS DE RESTRICCIÓN, ECUACIONES DE RESTRICCIÓN. COORDENADAS SUPERFLUAS....................................138 5.5.RESTRICCIONES MÓVILES.......................................................................................................................139 5.6.ECUACIONES DE TRANSFORMACIÓN “REDUCIDAS”....................................................................................139 5.7.VELOCIDAD EXPRESADA EN COORDENADAS GENERALIZADAS.......................................................................140 5.8.TRABAJO Y ENERGÍA CINÉTICA...............................................................................................................143 5.9.EJEMPLOS ILUSTRATIVOS DE LA ENERGÍA CINÉTICA....................................................................................145 5.10.TEOREMA DE “CENTRO DE MASA” PARA LA ENERGÍA CINÉTICA..................................................................148 5.11. UNA EXPRESIÓN GENERAL PARA LA ENERGÍA CINÉTICA DE P PARTÍCULAS....................................................149 5.12.DEFINICIÓN DE ACELERACIÓN Y EJEMPLOS.............................................................................................151 5.13.“DESPLAZAMIENTOS REALES Y VIRTUALES; TRABAJO VIRTUAL...................................................................153 5.14.RESUMEN Y OBSERVACIONES...............................................................................................154 6.ECUACIONES DEL MOVIMIENTO DE LAGRANGE PARA UNA PARTICULA....................156 6.1.CONSIDERACIONES PRELIMINARES...........................................................................................................156 6.2.DEDUCCIÓN DE LAS ECUACIONES DE LAGRANGE PARA UNA PARTÍCULA, SIN COORDENADAS NI RESTRICCIONES MÓVILES. 156 6.3.COMPENDIO DE DETALLES IMPORTANTES RELACIONADOS CON LAS ECUACIONES DE LAGRANGE..........................161 6.4.INTEGRACIÓN DE LAS ECUACIONES DIFERENCIALES DEL MOVIMIENTO............................................................163 6.5.EJEMPLOS ILUSTRATIVOS.......................................................................................................................163 6.6.ECUACIONES DE LAGRANGE PARA UNA PARTÍCULA, SUPONIENDO U MARCO DE REFERENCIA MÓVIL, RESTRICCIONES MÓVILES, O AMBAS CONDICIONES SIMULTÁNEAMENTE.......................................................................................166 6.7.DE LA ENERGÍA CINÉTICA, LAS FUERZAS GENERALIZADAS Y OTROS TÓPICOS, CUANDO EL MARCO DE REGENCIA, LAS RESTRICCIONES, O AMBOS SE MUEVEN............................................................................................................168 6.8.DETERMINACIÓN DE LA ACELERACIÓN POR MEDIO DE LAS ECUACIONES DE LAGRANGE....................................171 6.9.UNA CONSIDERACIÓN ADICIONAL SOBRE LAS ECUACIONES DE LAGRANGE......................................................173 6.10.EXPERIMENTO SUGERIDOS:..................................................................................................................174 6.11.RESUMEN Y OBSERVACIONES................................................................................................................174 7.ECUACIONES DE LAGRANGE PARA UN SISTEMA DE PARTÍCULAS.................................175 7.1.OBSERVACIONES INTRODUCTORIAS..........................................................................................................175 7.2.DEDUCCIÓN DE LAS ECUACIONES DE LAGRANGE PARA UN SISTEMA DE PARTÍCULAS.........................................175 7.3.EXPRESIÓN DE T EN FORMA ADECUADA...................................................................................................178 7.4.SIGNIFICADO FÍSICO DE LAS TUERZAS GENERALIZADAS...............................................................................178 7.5.TÉCNICAS PARA HALLAR EXPRESIONES PARA LAS TUERZAS GENERALIZADAS...................................................179 7.6.EJEMPLOS ILUSTRATIVOS DE LA APLICACIÓN DE LAS ECUACIONES DE LAGRANGE A SISTEMAS QUE INCLUYEN VARIAS PARTÍCULAS...............................................................................................................................................180 7.7.FUERZAS Y MOVIMIENTOS DE LAS PARTÍCULAS CARGADAS EN UN CAMPO ELECTROMAGNÉTICO..........................191 7.8.CONSIDERACIONES SOBRE EL SIGNIFICADO FÍSICO DE LAS ECUACIONES DE LAGRANGE.....................................192 7.9.EXPERIMENTO SUGERIDO.......................................................................................................................195 1. TEORÍA CINÉTICA DE LOS GASES 2 1.1. GAS IDEAL En la mayoría de fenómenos a los que está dedicado este libro, no es necesario, no sólo tener en cuenta el carácter cuántico de los procesos interatómicos, incluso considerar el hecho mismo de la existencia de cualquier estructura de los átomos. En nuestra tarea extra el estudio de los sistemas compuestos de un gran número de moléculas, consideradas como cuerpos de pequeñas dimensiones y masa. Está claro que el estudio teórico de tales sistemas moleculares está ligado con grandes dificultades, ya que para esto es necesario tener en cuenta todas las fuerzas que actúan sobre cada molécula por parte de todas las demás. Si suponemos que el movimiento de las moléculas es puramente mecánico y se somete a las leyes de Mecánica, entonces, para la descripción completa de cualquier sistema molecular, parece necesario resolver la tarea mecánica del movimiento de todas las moléculas bajo la acción de las fuerzas dadas. Esto significa que deben ser escritas y resueltas las ecuaciones de movimiento, cuyo número es igual al número de moléculas del sistema dado (hablando más exactamente, el número de ecuaciones debe ser tres veces mayor, ya que la posición de la molécula se determina con tres coordenadas, es decir, cada molécula tiene tres grados de libertad). Si tenemos en cuenta, por ejemplo, que un centímetro cúbico de gas en condiciones corrientes encierra 2.7 x 10 elevado a la 19 moléculas, queda claro que es imposible no solo resolver, sino incluso escribir un número de ecuaciones tan monstruoso. La grandiosidad del número de moléculas hace innecesario considerar el movimiento de cada una de ellas por separado. Para un número tan grande de partículas resulta ser posible el limitarse al conocimiento sólo de los valores medios de las magnitudes que caracterizan su movimiento: su velocidad media, la energía media, etc. Este método es el que vamos a utilizar al estudiar los sistemas moleculares. De los tres estados de agregación en que se puede encontrar cualquier substancia, el más sencillo es el gaseoso, ya que en este caso las fuerzas que actúan entre las moléculas son muy pequeñas y en determinadas condiciones se pueden despreciar. Por eso empezamos la exposición de la Física Molecular con el exámen de las propiedades de los gases. Para ello supondremos al principio que las fuerzas intermoleculares en los gases no sólo son pequeñas, sino que no existen en general. Para simplificar, despreciamos también las dimensiones de las moléculas, es decir, las consideramos como puntos materiales. Con tales suposiciones las moléculas del gas se deben considerar completamente libres. Esto significa que ellas se mueven en línea recta y uniformemente, como se mueven siempre los cuerpos que no están sometidos a la acción de cualquier fuerza. Cada molécula se comporta, por consecuencia, como si no hubiese ninguna otra molécula en la vasija. En adelante, al examinar los gases reales, naturalmente, dejaremos las suposiciones hechas, justificadas precisamente porque en determinadas condiciones tal idealización no nos lleva muy lejos de la realidad. El gas que tiene tales propiedades así como un conjunto de puntos materiales que no actúan entre si, se llama gas ideal. Nuestra primera tarea será la exposición de la teoría cinética de los gases ideales. 1.2. PRESIÓN DEL GAS El cuadro de los movimientos de las moléculas en el gas no será completo, si no examinásemos además la cuestión sobre los choques de las moléculas con la superficie de cualquier cuerpo que se encuentra en el gas, y en particular con las paredes de la vasija que contiene el gas y de unas con otras. 3 En efecto, al realizar las moléculas el movimiento desordenado, de cuando en cuando se acercan a las paredes de la vasija o a la superficie de otros cuerpos a una distancia bastante pequeña. Del mismo modo, las moléculas también se pueden aproximar bastante cerca una a otra. En este caso, entre las moléculas del gas, o entre las moléculas del gas y las de la substancia de la pared, se originas unas fuerzas de interacción que disminuyen rápidamente con la distancia. Bajo la acción de estas fuerzas las moléculas del gas cambian la dirección de su movimiento. Este proceso (cambio de dirección), como sabemos, lleva el nombre de choque. El choque de las moléculas entre sí juega un papel muy importante en el comportamiento del gas. Esta cuestión la examinaremos detalladamente mas adelante. Por ahora es importante considerar el choque de las moléculas con las paredes de la vasija., o con otra superficie cualquiera que está en contacto con el gas. La interacción de las moléculas del gas y de las paredes determina, precisamente, de fuerza que experimentan las paredes por parte del gas y, naturalmente, la igual fuerza de sentido contrario que experimenta el gas por parte de las paredes. Es claro, que la fuerza que sufren las paredes por parte del gas será tanto mayor, cuanto mayos sea el área de su superficie. Con objeto de no utilizar la magnitud que depende de tal factor casual como son las dimensiones de la pared, se ha aceptado caracterizar la acción del gas sobre las paredes no por la fuerza, sino por la presión p, es decir, por la fuerza F relacionada a la unidad de superficie S de la pared, perpendicular a esa fuerza. S F p · La propiedad del gas de ejercer presión sobre las paredes de la vasija que lo contiene, es una de las propiedades fundamentales del gas. Precisamente, por su presión se puede frecuentemente descubrir su presencia. Por eso, la magnitud de la presión es una de las características más importantes del gas. La presión del gas sobre las paredes de la vasija, como ya propuso Daniel Bernoulli en el siglo XVIII, es una consecuencia de los choques innumerables de las moléculas gaseosas contra las paredes. Estos golpes de las moléculas contra las paredes conducen a un determinado desplazamiento de las partículas del material de la pared, o sea, a su deformación. La pared deformada actúa sobre el gas con una fuerza elástica, dirigida en cada punto, perpendicularmente a la pared. Esta fuerza es igual en su valor absoluto a la fuerza con la que el gas actúa sobre la pared y de sentido contrario. A pesar de que las fuerzas de interacción de cada molécula por separado con las moléculas de la pared durante el choque son desconocidas, sin embargo, las leyes de mecánica permiten hallar la fuerza media, originada por la acción conjunta de todas las moléculas del gas, es decir, hallar la presión del gas. Supongamos que el gas está encerrado en una vasija que tiene forma de paralelepípedo (fig. 2), y que el gas se encuentra en estado de equilibrio. En el caso dado, esto significa que el gas, como un todo, está en reposo en relación a las paredes de la vasija: el número de moléculas que se mueven en una dirección arbitraria determinada es igual en su media al número de moléculas, cuyas velocidades estás dirigidas en sentido contrario. Calculemos la presión del gas sobre una de las paredes de la vasija, por ejemplo, sobre la pared derecha abcd. Dirijamos el eje de coordenadas X a lo largo de la arista del paralelepípedo perpendicularmente a la pared abcd como está indicado en la fig.2. Cualesquiera que sean las direcciones de las velocidades υ de las moléculas, solo nos interesa la proyección x v de las velocidades de las moléculas sobre el eje X: en 4 dirección hacia la pared abcd las moléculas se mueven, precisamente, con la velocidad x v . Separemos mentalmente una capa de gas con espesor x ∆ , adyacente a la pared elegida. Por parte de la pared deformada sobre ella actúa la fuerza elástica F. Con una fuerza de tal valor absoluto también actúa el gas sobre la pared. Según la segunda ley de Newton el impulso de la fuerza t F∆ (donde t ∆ es un intervalo arbitrario de tiempo) es igual al cambio del impulso del gas en nuestra capa. Pero el gas se encuentra en estado de equilibrio, de modo que la capa no recibe ningún incremento del impulso en dirección del impulso de la fuerza (contra la dirección positiva del eje X). Esto ocurre porque, debido a los movimientos moleculares, la capa elegida recibe un impulso en la dirección contraria y naturalmente, de igual valor absoluto. Este no es difícil calcularlo. Durante los movimientos desordenados de las moléculas gaseosas en un tiempo t ∆ entra en nuestra capa de izquierda a derecha un número determinado de moléculas y otras tantas moléculas salen de ella en dirección contraria, de derecha a izquierda. Las moléculas entrantes aportan consigo un impulso determinado. Las salientes aportan un impulso igual de signo contrario, de modo que el impulso total que recibe la capa, es igual algebraicamente a la suma de los impulsos de las moléculas entrantes y salientes de la capa. Hallemos el número de moléculas entrantes en nuestra capa en el tiempo t ∆ . Durante este tiempo pueden llegar a la frontera a’b’c’d’, de la izquierda, las moléculas que se encuentran de ella a una distancia no superior a t v x ∆ . Todas ellas se encuentran en el volumen del paralelepípedo con una base de superficie S (esta es el área de la pared considerada) y longitud t v x ∆ , es decir en el volumen t Sv x ∆ . Si la unidad de volumen contiene n moléculas, entonces en el volumen indicado se hallarán t nSv x ∆ moléculas. Pero sola la mitad de ellas se mueve de izquierda a derecha y cae en la capa. La otra mitad se aleja de ella y no cae en la capa. Por consiguiente, durante el tiempo t ∆ entran en la capa, de izquierda a derecha t nSv x ∆ 2 1 moléculas. Cada una de ellas posee un impulso x mv ( m es la masa de la molécula) y el impulso total que ellas aportan a la capa es igual a t S nmv x ∆ 2 2 1 Durante este tiempo abandona la capa, moviéndose de derecha a izquierda, un número igual de moléculas con un mismo impulso total, pero de signo contrario. De tal modo, debido a la entrada en la capa de moléculas son impulso positivo y a la salida 5 desde ella de moléculas con impulso negativo, el cambio total del impulso en la capa será igual a t S nmv t S nmv t S nmv x x x ∆ · , ` . | ∆ − − ∆ 2 2 2 2 1 2 1 Este cambio del impulso de la capa compensa el cambio que debería ocurrir bajo la acción del impulso de fuerza t F∆ . Por eso, podemos escribir: t S nmv t F x ∆ · ∆ 2 Dividiendo ambas partes de esta igualdad por t S∆ obtenemos: 2 x nmv p S F · · (2.1) Hasta ahora, sin decirlo suponíamos que todas las moléculas del gas tenían velocidades, cuyas proyecciones x v eran iguales. En realidad esto no es así. Las velocidades de las moléculas v y sus proyecciones x v sobre el eje X, naturalmente, son distintas en las diferentes moléculas. La cuestión sobre la diferencia de velocidades de las moléculas gaseosas en condiciones de equilibrio serán examinadas detalladamente en el § 12. De momento tendremos en cuenta la diferencia de las velocidades de las moléculas y de sus proyecciones en el eje de coordenadas, sustituyendo la magnitud 2 x v que entra en la fórmula (2.1) por su valor medio 2 x v de modo que a la fórmula de la presión del gas (2.1) le daremos la forma siguiente: 2 x mv n p · (2.2) Para la velocidad v de cada molécula se puede escribir: , 2 2 2 2 z y x v v v v + + · (2.3) Por eso 2 2 2 2 2 2 2 z y x z y x v v v v v v v + + · + + · (la última igualdad significa que se puede cambiar el orden de realización de las operaciones de sumar y hallar la media). Debido al desorden completo de los movimientos moleculares se puede suponer que el valor medio de los cuadrados de las proyecciones de velocidades sobre los tres ejes coordenados son iguales entre sí, es decir, 2 2 2 z y x v v v · · Esto significa, teniendo en cuenta (2.3) que 3 2 2 v v x · Poniendo esta expresión en la fórmula (2.2) obtenemos que: 6 2 3 1 v nm p · o, multiplicando y dividiendo la parte derecha de esta igualdad por dos, 2 3 2 2 v m n p · (2.4) Los raciocinios elementales expuestos son justos para cualquier pared de la vasija y para cualquier superficie que se puede colocar mentalmente en el gas. En todos los casos obtenemos para la presión del gas el resultado expresado en la fórmula (2.4). La magnitud 2 2 mv en la fórmula (2.4) es una molécula de gas. Por consiguiente, la presión del gas es igual a dos tercios de la energía cinética media de las moléculas de la unidad de volumen de gas. Esta es una de las conclusiones más importantes de la teoría cinética del gas ideal. La fórmula (2.4) establece la relación entre las magnitudes moleculares, es decir, las que se refieren a una molécula por separado y la magnitud de la presión que caracteriza el gas como un todo, la magnitud macroscópica que se mide directamente en la experiencia. La ecuación (2.4) algunas veces se llama ecuación fundamental de la teoría cinética de los gases ideales. Es importante subrayar que la presión del gas se determina por la energía cinética media de sus moléculas. Esto significa que la presión del gas es una magnitud orgánicamente ligada a la condición de que el gas está compuesto de un gran número de moléculas. Por eso, no tiene sentido hablar, por ejemplo, de la presión creada por una o muy pocas moléculas. Sobre los conceptos que solo tiene sentido para los sistemas compuestos de muchas partículas se dice que tienen un carácter estadístico. Observemos aquí que la magnitud del valor medio del cuadrado de la velocidad 2 v que figura en la fórmula (2.4) que hay que distinguirlo del cuadrado del valor medio de la velocidad 2 v . Si la raíz cuadrada de 2 v es igual a la velocidad media de v , la 2 v no es igual a v . La magnitud v v · 2 (y no v ) se llama velocidad media cuadrática de las moléculas. Si el movimiento de las moléculas es completamente caótico, entonces su velocidad media cuadrática es aproximadamente un 9% mayor que la velocidad media. Unidades de presión. En el sistema SI (se toma como unidad de presión la presión que perpendicularmente ejerce la fuerza de 1 newton sobre la superficie de 1 m 2 . Tal unidad se llama pascal (abreviadamente Pa): 1 Pa = 1 N/m 2 Debido a la pequeñez de esta unidad se recomienda utilizar la unidad en 10 5 veces mayor, a la cual se le ha asignado el nombre de bar: 1 bar = 10 5 Pa En el sistema GGS la presión se mide en din/cm 2 : 1 din/cm 2 =0,1 Pa 7 En la técnica se utiliza, ampliamente, la unidad de presión, denominada atmósfera técnica (abreviadamente at) que es igual a 1 kgf/cm 2 . Esta unidad solo se diferencia en un 2% del bar: 1 at = 1 kgf/cm 2 = 98066,5 Pa ≈ 0,98 bar Algunas veces se utiliza la unidad, atmósfera física (abreviadamente atm) que es igual a la presión de una columna de mercurio con 76cm de altura. Teniendo en cuenta que la densidad del mercurio es igual a 13,5951 g/cm 3 (13595,1 kg/m 3 ) y la aceleración de la caída libre es igual a 9,80665 m/s 2 , obtenemos que: 1 atm = 1,01325⋅10 6 din/cm 2 = 101325 Pa (≈1,01 bar) En el dominio de las bajas presiones se utiliza la unidad de presión, el tor (un milímetro de la columna de mercurio): 1 tor = 1/760 atm = 133,322 Pa ≈ 1,33⋅10 3 din/cm 2 Durante la resolución de problemas es necesario recordar que de las unidades de presión expuestas solo el Pa corresponde al sistema (sistema SI) y la din/cm 2 (al sistema GGS) 1.3. TEMPERATURA De la ecuación (2.4) 2 3 2 2 v m n p · Se deduce que la presión del gas ideal es proporcional a su densidad (la densidad del gas se determina por el número n de moléculas en la unidad de volumen) y a la energía cinética media del movimiento de translación de las moléculas. Cuando n es invariable y, por lo tanto, para un volumen V invariable de gas ( V N n · , donde N es el número de moléculas en la vasija), la presión del gas solo depende de la energía cinética media de las moléculas. Sin embargo, es conocido por la experiencia que para un volumen constante la presión del gas solo se puede cambiar por un método: calentándolo o enfriándolo; al calentar el gas crece su presión, al enfriarlo, disminuye. El gas calentado o enfriado, como cualquier cuerpo, se caracteriza por su temperatura, que es una magnitud especial utilizada desde hace mucho tiempo en la ciencia, técnica y vida doméstica. Por consiguiente, deberá existir un enlace entre la temperatura y la energía cinética media de las moléculas. Antes de aclarar este enlace examinemos qué magnitud física representa la temperatura. Para nuestra vida cotidiana la temperatura es una magnitud que distingue lo <caliente> de lo <frío>. Y la primera representación sobre la temperatura se originó de la sensación de calor y frío. Podemos utilizar estas sensaciones conocidas por nosotros para aclarar la particularidad principal de la temperatura como magnitud física. Tomemos tres vasijas. Rellenemos una de ellas con agua caliente y la otra con agua fría y la tercera con una mezcla de agua fría y caliente. Introduzcamos una 8 mano, por ejemplo, la derecha en la vasija con agua caliente y la izquierda en la vasija con agua fría. Manteniendo las manos en estas vasijas durante un tiempo determinado, llevémoslas luego a la tercera vasija. ¿Qué nos indican nuestros sentidos sobre el agua de esta vasija? A la mano derecha le parece que su agua está fría, a la izquierda, que está caliente. Pero esta discordancia desaparece si mantenemos largo rato ambas manos en la tercera vasija. Después de un tiempo determinado ambas manos empiezan a sentir una sensación, exactamente igual, correspondiente a la temperatura del agua de la tercera vasija. Todo consiste en que las manos, que al principio estuvieron en las vasijas con agua caliente y fría, tenían distintas temperaturas, diferentes una de otra y de la temperatura en la tercera vasija. Se necesita un tiempo determinado para que la temperatura de cada mano se haga igual a la temperatura del agua donde están sumergidas. Entonces la temperatura de las manos se iguala. Las sensaciones serán iguales. Es necesario, como suele decirse, que en sistema de cuerpos <mano izquierda – mano derecha – agua> se establezca el equilibrio térmico. Este experimento sencillo demuestra que la temperatura es una magnitud que caracteriza el estado del equilibrio térmico: los cuerpos que se encuentran en estado de equilibrio térmico tienen la misma temperatura, y viceversa, los cuerpos con una misma temperatura se encuentran, uno con respecto al otro, en equilibrio térmico. Si dos cuerpos se encuentran en equilibrio térmico con un tercer cuerpo cualquiera, entonces ambos cuerpos se encuentran entre si en equilibrio térmico. Esta importante afirmación es una de las leyes fundamentales de la Naturaleza. Sobre ella está basada la propia posibilidad de medición de la temperatura. En el experimento descrito, por ejemplo, se trataba del equilibrio térmico de ambas manos después de que cada una de ellas resultó estar en equilibrio térmico con el agua. Si un cuerpo o sistema de cuerpos no se encuentran en estado de equilibrio térmico y si el sistema está aislado (no tiene interacción con otros cuerpos), entonces después de un tiempo determinado se establece por sí mismo el estado de equilibrio térmico. El estado de equilibrio térmico, es el estado al cual pasa cualquier sistema aislado. Después de haber alcanzado tal estado, él no se cambia más y no ocurre en el sistema ningún cambio macroscópico. Uno de los indicios del estado de equilibrio térmico es la igualdad de temperaturas en todas las partes del cuerpo o de todo el sistema de cuerpos. Es conocido que durante el proceso de establecimiento del equilibrio térmico, es decir, durante el igualamiento de temperaturas de los dos cuerpos, ocurre una transmisión de calor de un cuerpo a otro. Por consiguiente, desde el punto de vista experimental, la temperatura del cuerpo es una magnitud que determina si él transmitirá calor a otro cuerpo con temperatura distinta o lo recibirá de él. La temperatura ocupó un lugar especial entre la serie de magnitudes físicas. Esto no es extraño si se tiene en cuenta que en la época, cuando apareció esta magnitud en la ciencia, no era conocido precisamente, qué procesos internos originan en la sustancia la sensación de frío o calor. La particularidad de la temperatura como magnitud física consiste ante todo en que ella a diferencia de muchas otras magnitudes no es aditiva. Esto significa, que si dividimos mentalmente un cuerpo en partes, entonces la temperatura de todo el cuerpo no será igual a la suma de temperatura de sus partes. En esto se diferencia la temperatura de las magnitudes, como, por ejemplo, la longitud, volumen, masa, cuyos valores en el cuerpo total constituyen la suma de los valores de las magnitudes correspondientes de todas sus partes. A consecuencia de esto, no se puede medir la temperatura del cuerpo directamente como se mide la longitud o masa, es decir, por el método de comparación con el patrón. Si podemos decir de una barra que su longitud es tantas veces mayor que la 9 longitud de otra barra, la pregunta sobre cuántas veces una temperatura se contiene en otra no tiene sentido. Para medir la temperatura ya hace mucho tiempo se utiliza el hecho de que un cuerpo al cambiar su temperatura cambia sus propiedades. Por lo tanto, cambian las magnitudes que caracterizan estas propiedades. Por eso, para crear un aparato que mida la temperatura, es decir, el termómetro, se elige cualquier sustancia (sustancia termométrica) y una determinada magnitud que caracteriza las propiedades del cuerpo (magnitud termométrica). La elección de una y otra es completamente arbitraria. Por ejemplo, en los termómetros de vida doméstica, el mercurio es la sustancia termométrica y la longitud de la columna de mercurio es la magnitud termométrica. Para que se puedan adjudicar determinados valores numéricos a la magnitud de la temperatura, hay que dar de antemano tal o cual dependencia entre la magnitud termométrica y la temperatura. La elección de esta dependencia también es arbitraria: mientras no exista el termómetro no se puede establecer experimentalmente esta dependencia. En el caso del termómetro de mercurio, por ejemplo, se elige la dependencia lineal entre la longitud de la columna de mercurio (volumen de mercurio) y la temperatura. Aun nos queda establecer la unidad de temperatura, el grado (a pesar de que por principio se lo podía expresar en las mismas unidades en que se mide la magnitud termométrica, por ejemplo, ¡en centímetros, según el termómetro de mercurio!). La magnitud del grado también se elige arbitrariamente (lo mismo que la sustancia termométrica, la magnitud termométrica y la forma de la función que liga la magnitud termométrica con la temperatura). La medida del grado se establece del modo siguiente. So eligen, otra vez más, arbitrariamente, dos temperaturas (que se denominan puntos de referencia) — corrientemente son la temperatura de fusión del hielo y la de ebullición del agua a la presión atmosférica — y se divide este intervalo de temperaturas en un número determinado (también arbitrario) de partes iguales, de grados, y a una de estas dos temperaturas se le adjudica determinado valor numérico. Con ello se determina el valor de la segunda temperatura y de cualquiera otra intermedia. De tal modo se obtiene la escala de temperaturas. Está claro, que con ayuda del método descrito se puede obtener un conjunto infinito de termómetros diferentes y escalas de temperaturas. La termometría actual está basada en la escala del gas ideal y abastecida con ayuda del termómetro de gas. Por principio, el termómetro de gas es una vasija cerrada, rellena de un gas ideal y abastecida con un manómetro para medir la presión del gas. Esto significa que en tal termómetro sirve de sustancia termométrica un gas ideal, y de magnitud termométrica, la presión del gas para volumen constante. La dependencia entre la presión y la temperatura se toma (¡precisamente se toma!) como si fuese lineal. Tal suposición conduce a que la relación entre las presiones para las temperaturas de ebullición del agua ( e p ) y de fusión del hielo ( o p ) es igual a la relación d e estas mismas temperaturas: o e o e T T p p · La relación o e p p se determina fácilmente del experimento. Un gran número de mediciones indicaron que 3661 , 1 · o e p p Por consiguiente, tal es el valor de la relación de temperaturas: 10 3661 , 1 · o e T T La medida del grado se elige dividiendo la diferencia o e T T − en cien partes: 100 · − o e T T De las dos últimas igualdades se deduce que la temperatura de fusión del hielo o T , según la escala que elegimos anteriormente, es igual a 273,15 grados y la temperatura de ebullición del agua e T es igual a 373,15 grados. Para medir la temperatura de cualquier cuerpo con ayuda del termómetro de gas es necesario poner el cuerpo en contacto con el termómetro de gas y, esperando hasta el equilibrio, medir la presión p del gas en el termómetro. Entonces la temperatura del cuerpo T se determina por la fórmula p p T o 15 , 273 · donde o p es la presión del gas en el termómetro, colocado en el hielo en fusión. En la práctica se utiliza raramente el termómetro de gas. Sobre él recae un papel más responsable: según él se gradúan todos los termómetros utilizados. La temperatura igual a cero en nuestra escala, evidentemente, es la temperatura para la cual sería igual a cero la presión del gas ideal. (Esto no significa que el gas ideal en realidad se puede enfriar tanto que su presión se hace igual a cero). Si la magnitud termométrica se hace nula para el cero de la escala termométrica, entonces tal escala se denomina escala absoluta, y la temperatura contada sobre tal escala se denomina temperatura absoluta. La escala del termómetro de gas aquí descrita se considera absoluta. Frecuentemente, también la llaman escala Kelvin, y a la unidad de temperatura en esta escala, el grado Kelvin (designación: K). En la técnica y vida doméstica, frecuentemente se utiliza la escala de temperaturas que se diferencia de la descrita en que a la temperatura de fusión del hielo se le adjudica el valor cero (para uno misma medida del grado). Esta escala se denomina escala de Celcius. La temperatura t contada por esta escala está ligada a la temperatura absoluta T por la relación evidente: 15 , 273 − · T t En lo sucesivo utilizaremos la escala Kelvin. De lo dicho se deduce que la temperatura caracteriza el equilibrio térmico de los cuerpos: pasando al estado de equilibrio se igualan las temperaturas de los cuerpos, y en el estado de equilibrio la temperatura de todas las partes del cuerpo o sistema de cuerpos es una misma: con esto está ligado el proceso de medición de la temperatura. En efecto, para medir el valor de la magnitud termométrica a las temperaturas de fusión del hielo y de ebullición del agua es necesario llevar el termómetro al estado de equilibrio con el hielo en fusión y con el agua hirviendo, y para medir la temperatura de cualquier cuerpo es necesario asegurar la posibilidad de establecer el equilibrio térmico entre el termómetro y el cuerpo. Y solamente entonces, cuando se ha conseguido tal equilibrio, se puede considerar que la temperatura del cuerpo es igual a la temperatura contada por el termómetro. 11 Por lo tanto, la temperatura es lo que se iguala en el proceso del establecimiento del equilibrio en el sistema. Pero el propio concepto de igualación significa que se entrega algo de una parte del sistema a la otra. La ecuación (2.4) que hemos obtenido para la presión del gas ideal nos permite comprender qué significa el entregar «algo». Imaginémonos un cilindro aislado con un gas ideal en el que se estableció el equilibrio térmico, de modo que la temperatura es igual en todas las partes del volumen gaseoso. Supongamos que, sin alterar el equilibrio, colocamos en el cilindro un émbolo móvil que divide el volumen del gas en dos partes (fig. 3, a). En las condiciones de equilibrio el émbolo se encontraría en reposo. Esto significa que durante el equilibrio son iguales no sólo las temperaturas, sino también las presiones a ambos lados del émbolo. De acuerdo con la ecuación (2.4) también son iguales las magnitudes ( ) 2 / 2 v m n : derecha izquierda v m n v m n , ` . | · , ` . | 2 2 2 2 Infrinjamos ahora, temporalmente, el aislamiento de nuestro cilindro con gas y calentemos una de sus partes, por ejemplo, la que está al lado izquierdo del émbolo después de lo cual restablecemos de nuevo el aislamiento. Ahora el gas en el cilindro no se encuentra en equilibrio, la temperatura T1 en el compartimiento izquierdo es mayor que en el derecho (fig. 3, b). Pero el gas está aislado y por sí mismo comienza el paso al estado de equilibrio. Con ello observamos que el émbolo empieza a moverse de izquierda a derecha. Y esto significa que realiza un trabajo y, por consiguiente, desde el gas del compartimiento izquierdo se entrega una energía al gas del compartimiento derecho. Es decir, lo que, se entrega en el proceso de establecimiento del equilibrio térmico es energía. Después de un tiempo determinado se suspende el movimiento del émbolo. Pero el émbolo se para después de una serie de oscilaciones. Y él se para en el mismo sitio, donde se encontraba antes de que se sometiese al calentamiento del compartimiento izquierdo. Se establece de nuevo el estado de equilibrio en el cilindro con gas. Pero ahora, naturalmente, la temperatura y presión del gas son mayores que antes del calentamiento. Ya que el émbolo se para en el sitio anterior, entonces la concentración de n moléculas (es decir, el número de moléculas en la unidad de volumen) quedó como anteriormente. Esto significa, que como resultado del calentamiento del gas sólo cambió la energía cinética media de sus moléculas. Por lo tanto, la igualación de la temperatura significa la igualación de los valores de la energía cinética media de las moléculas por ambos lados del émbolo. Al pasar al equilibrio se transmite una energía desde una parte del gas a la otra, pero no se iguala la energía de todo el gas como un todo, sino sólo la energía cinética media referida a una molécula. Precisamente, la energía cinética media de la molécula se comporta como temperatura. Estas magnitudes también se parecen en que la energía cinética media igual que la temperatura es una magnitud no aditiva, es igual para todo el gas y para cualquiera de sus partes (que contenga un número bastante grande de moléculas). La energía de todo el gas es una magnitud, naturalmente, aditiva, ella se compone de las energías de sus partes. No se debe pensar que nuestros raciocinios sólo se refieren al caso, cuando el gas del cilindro está dividido en dos partes por el émbolo. Y sin émbolo, al chocar las moléculas entre sí se intercambiarían energía y se transmitiría de la parte más caliente 12 a la parte menos caliente, en resultado de lo cual se igualaría la energía cinética media de las moléculas. El émbolo sólo hace visible la entrega de energía, ya que su movimiento está ligado a la realización de un trabajo. Los razonamientos sencillos expuestos a pesar de que no son muy rigurosos demuestran que la magnitud conocida ya hace tiempo, bajo la denominación de temperatura, es realmente la energía cinética media del movimiento de traslación de las moléculas. El que hayamos recibido este resultado para el caso del gas ideal, no cambia la cuestión. No existe fundamento para considerar que esto no se relaciona también a los cuerpos líquidos y sólidos. Es cómodo considerar, cuando se aplica el gas ideal, que la temperatura es igual a dos tercios de la energía cinética media de las moléculas, ya que esto simplifica la expresión de la fórmula (2.4) para la presión del gas. Designando por Θ la temperatura determinada de tal forma podemos escribir: Θ · 2 3 2 2 v m Entonces la ecuación (2.4) toma una expresión sencilla: Θ · n p Según esta definición, la temperatura debe, naturalmente, medirse en unidades de energía (en julios para el sistema SI, y en ergios para el sistema CGS). Sin embargo, no es cómodo utilizar tal unidad de temperatura. Incluso una unidad tan pequeña como el ergio, es demasiado grande para servir de unidad de medición de la temperatura. Con su empleo, las temperaturas que se encuentran con frecuencia estarían expresadas por números ínfimamente pequeños. Por ejemplo, la temperatura de fusión del hielo sería igual a 5,65⋅10 -14 erg. Además, la medición de la temperatura expresada en ergios, sería muy dificultosa. Por esta causa e incluso porque se utilizaba la magnitud de temperatura mucho antes de que fuesen desarrolladas las representaciones cinético-moleculares, que aclararon el verdadero sentido de la temperatura, la miden en unidades viejas, en grados, a pesar de la convencionalidad de esta unidad. Pero si se mide la temperatura en grados, entonces es necesario introducir el coeficiente correspondiente, que transforme las unidades de energía en grados. Está admitido designarlo por la letra k. Entonces la ligazón entre la temperatura T, medida en grados, y la energía cinética media se expresa por la igualdad: kT v m · 2 3 2 2 de aquí tenemos kT v m 2 3 2 2 · (3.1) Recordemos que la fórmula (3.1) se refiere a la molécula que convenimos en considerar semejante a un punto. Su energía cinética es la energía cinética del movimiento de traslación, cuya velocidad puede ser descompuesta en tres componentes. A causa de los movimientos moleculares caóticos se puede admitir que 13 la energía de las moléculas se distribuye, uniformemente, por todas las tres componentes de la velocidad, de modo que a cada una de ellas le corresponde la energía kT 2 1 El factor k que expresa la relación entre la unidad de energía y la unidad de temperatura, el grado Kelvin, se llama constante de Boltzmann. Es claro, que su valor numérico se debe establecer experimentalmente. Debido a la importancia particular de esta constante ella fue determinada por muchos métodos. Expongamos el valor más exacto de esta constante en la actualidad. En el sistema SI K J k / 10 380662 , 1 23 − ⋅ · En el sistema CGS K erg k / 10 380662 , 1 16 − ⋅ · De la fórmula (3.1) se deduce que el cero de temperatura es la temperatura, para la cual es igual a cero la energía cinética media de los movimientos desordenados de las moléculas, es decir, la temperatura para la cual se suspende el movimiento caótico de las moléculas. Esto es aquel cero absoluto, origen de lectura de la temperatura absoluta, que se citó anteriormente. De la fórmula (3.1) también se deduce que no pueden existir temperaturas negativas, ya que la energía cinética es una magnitud esencialmente positiva. Sin embargo, mas adelante, se mostrará que para determinados sistemas se puede introducir, formalmente el concepto de temperaturas negativas. Sobre ellas verdaderamente, no se puede decir que estas temperaturas son mas bajas que el cero absoluto y que ellas se refieren al estado de equilibrio del sistema. Ya que la temperatura se determina por la energía media del movimiento de las moléculas, entonces ella igual que la presión es una magnitud estadística. No se puede hablar de <temperatura> de una o de unas cuantas moléculas, sobre las moléculas <calientes> o <frías>. No tiene sentido, por ejemplo, hablar sobre la temperatura de un gas en el espacio cósmico, donde el número de moléculas en unidad de volumen es tan insignificante que ellas no forman parte en el sentido corriente de la palabra y no se puede hablar sobre la energía media del movimiento de las moléculas. Las energías ligadas a los movimientos caóticos de las partículas de un gas son muy pequeñas. De la fórmula (3.1) y del valor expuesto de la constante de Boltzmann se ve que a la temperatura de 1 K le corresponde una energía igual a 1,38⋅10 -23 J. Para la temperatura más baja conseguida en la actualidad (del orden de 10 -6 K) la energía media de las moléculas es igual, aproximadamente, a 10 -29 J. Incluso la máxima temperatura conseguida artificialmente, cerca de 100 millones de grados, desarrollada durante la explosión de la bomba atómica, corresponde a una energía insignificantemente pequeña de las partículas 10 -15 J. En vista de que la temperatura juega un papel muy importante en la Física y Técnica, ella junto con la longitud, masa y tiempo figura entre las magnitudes fundamentales del sistema SI y la unidad de temperatura, el grado Kelvin, es una de las unidades fundamentales de este sistema (la dimensión de la temperatura se representa por la letraΘ). En el SI la unidad de temperatura (grado Kelvin) se establece no a base del intervalo de temperaturas <temperatura del hielo en fusión – temperatura del agua en ebullición>, sino a base del intervalo <cero absoluto – temperatura del punto triple del agua>. El punto triple del agua es la temperatura, para la cual el agua, el vapor y el 14 hielo se encuentran en equilibrio (véase § 130). A la temperatura del punto triple del agua se le adjudica el valor 273,16 K (exactamente). De tal modo un grado Kelvin es igual a 1/273,16 parte del intervalo de temperaturas desde el cero absoluto de temperatura hasta la temperatura del punto triple del agua. Ya que la temperatura del punto triple del agua es igual a 0,01°C, entonces las medidas del grado en las escalas de Celsius y de Kelvin son iguales, y cualquier temperatura puede expresarse bien en grados Celsius(°C) o bien en grados Kelvin (°K) 1.4. ECUACIÓN DE ESTADO DEL GAS IDEAL Las representaciones cinético-moleculares desarrolladas anteriormente y las ecuaciones obtenidas a base de ellas permiten hallar las relaciones, que ligan entre sí las magnitudes que determinan el estado de un gas. Estas magnitudes son: la presión P, bajo la cual se encuentra el gas, su temperatura T y el volumen V que ocupa una determinada masa de gas. A ellas se les llama parámetros de estado. Las tres magnitudes enumeradas no son independientes. Cada una de ellas es función de las otras dos. La ecuación que enlaza todas las tres magnitudes –presión, volumen y temperatura del gas, para su masa dada- se llama ecuación de estado y puede ser escrita en forma general así: ( ) T V f p , · Esto significa que el estado de un gas se determina sólo por dos parámetros (por ejemplo, la presión y el volumen, la presión y la temperatura o por ultimo, el volumen y la temperatura) el tercer parámetro se determina por los otros dos de forma unívoca. Si la ecuación de estado es conocida en forma explícita, entonces se puede calcular cualquier parámetro conociendo los otros dos. Para el estudio de los distintos procesos en los gases (y no sólo en los gases) es cómodo utilizar la representación gráfica de la ecuación de estado, en forma de curvas que relacionan uno de estos parámetros con el otro, cuando el tercero está dado y es constante. Por ejemplo, cuando se da la temperatura constante, la relación entre la presión del gas y su volumen tiene la forma representada en la fig. 4. A las diferentes curvas les corresponden diferentes valores de temperatura: mientras más alta sea la temperatura tanto más alta descansará la curva en el gráfico. En este diagrama el estado del gas está representado por un punto. La curva que relaciona un parámetro con otro indica el cambio de estado, llamado proceso en el gas. Así, por ejemplo, las curvas do la fig. 4 representan el proceso de dilatación o compresión del gas para una temperatura constante dada. En adelante, utilizaremos ampliamente gráficos semejantes al estudiar los distintos procesos en los sistemas moleculares. La ecuación de estado para los gases ideales se puede obtener fácilmente de las ecuaciones fundamentales de la teoría cinetica (2.4) y (3.1). En efecto, poniendo en la ecuación (2.4) en lugar de la energía cinética media de las moléculas su expresión de la ecuación (3.1) obtenemos: nkT p · (4.1) Si el volumen V contiene N partículas, entonces NkT pV · ; poniendo esta expresión en (4.1) tenemos: 15 NkT pV · (4.2) Esta ecuación, en la cual entran los tres parámetros de estado, es la ecuación de estado de los gases ideales. Sin embargo, es útil transformarla de tal modo que en ella, en lugar del número de partículas N, difícil de medir directamente, figure la magnitud M de la masa del gas, fácil de medir. Para tal transformación utilizaremos el concepto de molecula-gramo o mol. Recordamos que un mol se llama tal cantidad de sustancia, cuya masa expresada en gramos es igual a la masa molecular relativa de la sustancia (a veces dicen «al peso molecular»). Esta unidad singular de cantidad de sustancia es notable, porque como se sabe, un mol de cualquier sustancia contiene un mismo número de moléculas. En efecto, si designamos las masas relativas de dos cualesquiera substancias por 1 µ y 2 µ , y las masas de las moléculas de estas substancias por 1 m y 2 m , entonces podremos escribir las igualdades evidentes: 2 2 2 1 1 1 , N m N m · · µ µ (4.3) en donde N1 y N2 son los números de partículas en el mol de estas substancias. Ya que de la misma definición de la masa relativa se deduce que 2 1 2 1 m m · µ µ , entonces dividiendo la primera de las igualdades (4.3) por la segunda, obtenemos que N1=N2, es decir, que el mol de cualquier sustancia contiene el mismo número de moléculas. El número de partículas en el mol que es igual para todas las sustancias se llama número de Avogadro. Lo designaremos por N0. De tal modo podemos determinar el mol como unidad de una magnitud especial, la cantidad de sustancia: 1 mol es la. cantidad de sustancia que contiene un numero de moléculas o de otras partículas (por ejemplo, átomos, si la sustancia está compuesta de átomos), igual al número de Avogadro. Si dividimos el número de moléculas N que tiene una masa determinada de gas por el número de Avogadro N0 obtenemos el número de moles de esta masa. Pero esta misma magnitud se puede obtener dividiendo la masa M del gas por su masa relativa µ así pues 0 0 , , N M N donde de N N M µ µ · · Pongamos esta expresión para N en la fórmula (4,2). Entonces la ecuación de estado toma la forma: kT N M pV 0 µ · (4.4) En esta ecuación entran dos constantes universales, el número de Avogadro N0 y la constante de Boltzmann k. Conociendo a una de ellas, por ejemplo, la constante de Boltzmann se puede determinar la otra (número de Avogadro) con un experimento sencillo, utilizando la misma ecuación (4.4.). Para esto, es necesario coger un gas cualquiera, con una masa relativa conocida y, llenar con él una vasija de volumen V conocido, medir la presión p de este gas y su temperatura T y determinar su masa M, pesando la vasija vacía (evacuada) y luego rellena de gas. El número de Avogadro resultó igual a 6,02⋅10 23 mol -1 . 16 El valor del número de Avogadro más exacto en la actualidad es: N0= 6,0220943⋅10 21 mol -1 . El producto de las constantes universales N0 k, evidentemente, también es una constante universal. Ella recibió el nombre de constante universal de los gases, y, corrientemente, se designa por R: R = N0k ≈ 6,02⋅10 23 ⋅1,38⋅10 -23 = 8,31 J/mol⋅K = 8,31⋅10 7 erg/mol⋅K. (Valor exacto: R = 8,31441 J/mol⋅K). Sustituyendo en la ecuación (4.4) N0k por la constante universal de los gases R, obtenemos: RT M pV µ · (4.5) A la ecuación de estado del gas ideal representada en tal foram, frecuentemente, se le llama ecuación de Clapeyron – Mendeliev. La magnitud µ M que figura en la ecuación, representa el número de moles en la masa dada de gas. Para un mol de gas, es decir. Para el caso cuando µ · M , la ecuación (4.5) tiene la forma: RT pV · (4.6) 1.5. MOVIMIENTO BROWNIANO El así llamado movimiento browniano sirve como una de las demostraciones más convenientes de la realidad del movimiento de las moléculas. Fue descubierto en el año 1827 por oí botánico ingles Brown al estudiar las pequeñísimas esporas de la suspensión acuosa. Al mirar con un microscopio de gran aumento, el descubrió que éstas se encuentran en movimiento desordenado continuo, como si ejecutasen un baile salvaje y fantástico. Los experimentos sucesivos demostraron que estos movimientos no están ligados al origen biológico de las partículas o con cualquier movimiento del líquido. Semejantes movimientos son realizados por cualesquier partículas pequeñas suspendidas en el líquido o en el gas. Movimientos desordenados de tal género los realizan, por ejemplo, las partículas de humo en el aire inmóvil. Tal movimiento desordenado de las partículas suspendidas en el líquido o en el gas recibió el nombre de movimiento browniano. Experimentos especiales mostraron que el carácter del movimiento browniano depende de las propiedades de líquido o gas en el que están suspendidas las partículas y no depende de las propiedades de la sustancia de estas partículas. La velocidad de movimiento de las partículas brownianas crece con el aumento de la temperatura y con la disminución de las dimensiones de las partículas. Todas estas leyes son fáciles de explicar si admitimos que los movimientos de las partículas en suspensión se originan a consecuencia de los choques, que sufren ellas por parte de las moléculas en movimiento del líquido o gas en que se encuentran Naturalmente, cada partícula browniana está sometida a tales golpes por todas partes. Durante el movimiento completamente desordenado de las moléculas, parecería ser y era de esperar, que el número de choques que recibe la partícula 17 desde cualquier dirección debería ser exactamente igual al número de choques desde dirección contraria, de manera que todos estos choques deben compensarse completamente unos con otros y la partícula debe quedarse inmóvil. Así, precisamente, ocurre si las partículas no son muy pequeñas. Pero cuando tenemos partículas microscópicas (10 -4 , 10 -5 cm) la cuestión es diferente. Del hecho que los movimientos moleculares son caóticos, se deduce solamente que en termino medio el número de choques es igual para las distintas direcciones. Pero en un sistema tan estadístico como un líquido o gas son inevitables las desviaciones de los valores medios. Tales desviaciones de los valores medios de unas u otras magnitudes, que se realizan en un pequeño volumen o durante pequeños intervalos de tiempo, se llaman fluctuaciones. Si en un líquido o gas se encuentra un cuerpo de dimensiones corrientes, entonces el número de choques que sufren por parte de las moléculas es tan grande que no se pueden apercibir ni golpes separados, ni el predominio casual de golpea en una dirección sobre los golpes en otra dirección. Para las partículas pequeñas el número general de golpes que sufren no es relativamente grande, de modo que se hace sensible el predominio de golpes, ya sea en una o en otra dirección. Precisamente, gracias a tales fluctuaciones del número de choques, se originan los movimientos convulsivos tan característicos de las partículas en suspensión que se llaman movimiento browniano. Está claro, que los movimientos de las partículas brownianas no son movimientos moleculares: nosotros vemos no el resultado del choque de una molécula, sino el resultado del predominio del número de choques en una dirección sobre el número de golpes en dirección contraria. El movimiento browniano sólo descubre, claramente, la misma existencia del movimiento molecular desordenado. De tal modo, el movimiento browniano se explica por que se origina una fuerza resultante de determinada dirección, como resultado de la desigualdad casual del número de choques de las moléculas con la partícula en distintas direcciones. Ya que las fluctuaciones son corrientemente momentáneas, después de un corlo intervalo de tiempo cambia la dirección de la resultante y junto con ella cambia la dirección de desplazamiento de la partícula. De aquí que el caos observado en los movimientos brownianos refleje el caos de los movimientos moleculares. La explicación cualitativa expuesta del movimiento browniano la completaremos con el examen cuantitativo de este fenómeno. Su teoría cuantitativa fue dada por primera vez por Einstein e independientemente por Smolujovsky (el año 1905). Aquí expondremos la deducción de la consecuencia más fundamental de esta teoría, más sencilla que la de estos autores. A consecuencia de la compensación incompleta de los choques de las moléculas sobre la partícula browniana, como vimos, actúa cierta fuerza resultante F, bajo cuya acción se mueve la partícula. Además de esta fuerza sobre la partícula actúa la tuerza de rozamiento f, originada por la viscosidad del medio y dirigida en sentido contrario a la fuerza F. Para sencillez supongamos que la partícula tiene forma de esfera con un radio a. Entonces la fuerza de rozamiento puede ser expresada por la fórmula de Stokes av f πη 6 · donde η es el coeficiente de rozamiento interno del líquido (o gas), y v es la velocidad de movimiento de la partícula. La ecuación del movimiento de la partícula (segunda ley de Newton) tiene por eso la forma: ar F mr πη 6 − · (7.1) 18 Aquí, m es la masa de la partícula, r es su radio vector con relación a un sistema de coordenadas arbitrario, r = v es la velocidad de la partícula y F es la resultante de las fuerzas originadas por los choques de las moléculas. Examinemos la proyección del radio vector r sobre uno de los ejes de coordenadas, por ejemplo, sobre el eje X. Para esta componente la ecuación (7.1) se escribe en la forma: ax F mx x πη 6 − · (7.2) donde, Fx es la componente de la fuerza resultante F sobre el eje X. Nuestra tarea consiste en hallar el desplazamiento x que la partícula browniana recibe bajo la acción de los choques de las moléculas. Cada partícula está sometida constantemente a los choques con las moléculas, después de lo cual cambia la dirección de su movimiento. Las diferentes partículas reciben desplazamientos, que se diferencian tanto en magnitud como en dirección. El valor probable de la suma de los desplazamientos de todas las partículas es igual a cero, ya que los desplazamientos pueden tener con igual probabilidad signo positivo o negativo. El valor medio de la proyección del desplazamiento x de las partículas, por eso, será igual a cero. Sin embargo, no será igual a cero el valor medio del cuadrado del desplazamiento, es decir, la magnitud 2 x , ya que 2 x no cambia su signo cuando cambia el signo de x. Transformemos, por eso, la ecuación (7.2) de tal modo, que entre en ella la magnitud 2 x . Para ello, multipliquemos por x ambas partes de esta ecuación axx xF mxx x πη 6 − · (7.3) Utilicemos las identidades evidentes: ( ) ( ) dt x d xx dt dx dt x d xx 2 2 2 2 2 2 1 , 2 1 · , ` . | − · Poniendo estas expresiones en (7.3) obtendremos: ( ) ( ) x xF dt x d a dt dx m dt x d m + − · , ` . | − 2 2 2 2 2 3 2 πη Esta igualdad es justa para cualquier partícula y por lo cual también es justa para los valores medios de las magnitudes que figuran en ella, si se toman los valores medios de un número bastante grande de partículas. Por esta razón, se puede escribir: ( ) ( ) x xF dt x d a dt dx m dt x d m + − · , ` . | − 2 2 2 2 2 3 2 πη donde 2 x es el valor medio del cuadrado del desplazamiento de la partícula, y 2 , ` . | dt dx es el valor medio del cuadrado de su velocidad. 19 El valor medio de la magnitud x xF que entra en la igualdad es igual a cero ya que para un gran número de partículas x y Fx pueden tomar con la misma frecuencia tanto valores positivos como negativos. Por eso la ecuación (7.2) toma la forma: ( ) ( ) dt x d a dt dx m dt x d m 2 2 2 2 2 3 2 πη − · , ` . | − (7.4) La magnitud 2 , ` . | dt dx representa en esta ecuación el valor medio del cuadrado de la proyección de la velocidad sobre el eje X. Ya que el movimiento de las partículas es completamente caótico, entonces los valores medios de los cuadrados de las proyecciones de la velocidad, según todos los tres ejes de coordenadas, deberán ser iguales unos a otros, es decir, 2 2 2 , ` . | + , ` . | + , ` . | dt dz dt dy dt dx Es también evidente, que la suma de estas magnitudes deberá ser igual al valor medio del cuadrado de la velocidad 2 v de las partículas: 2 2 2 2 v dt dz dt dy dt dx · , ` . | + , ` . | + , ` . | Por consiguiente, 2 2 3 1 v dt dx · , ` . | De tal modo, la expresión que nos interesa, que figura en (7.4) es igual a: 2 3 2 3 1 2 2 2 v m v m dt dx m · · , ` . | La magnitud 2 2 v m es la energía cinética media de la partícula browniana. Al chocar las partículas brownianas con las moléculas del liquido o gas se intercambian con ellas la energía y se encuentran en equilibrio térmico con el medio en donde se mueven. Por eso la energía cinética media del movimiento de traslación de la partícula browniana deberá ser igual a la energía cinética media de las moléculas de líquido (o gas) que como sabemos es igual a 3/2 kT: kT v m 2 3 2 2 · y por consiguiente, 20 kT v m dt dx m · · , ` . | 2 3 2 2 2 La circunstancia de que la energía cinética media de la partícula browniana sea igual a 3/2 kT (lo mismo que para la molécula gaseosa) tiene una importancia de principio. En efecto, la ecuación fundamental (3.1) deducida anteriormente, es justa para cualesquiera partículas que no actúan una sobre la otra, que realizan un movimiento caótico. Es indiferente que las partículas sean moléculas invisibles para el ojo, o partículas brownianas mucho mayores que contengan miles de millones de moléculas. La partícula browniana se puede considerar, desde el punto de vista cinético-molecular como una molécula gigante. Por eso, la expresión de la energía cinética media para tal partícula debe ser la misma que para las moléculas. Las velocidades de las partículas brownianas, desde luego son incomparablemente menores en correspondencia a su mayor masa. Volvamos ahora a la ecuación (7.4) y teniendo en cuenta (7.5) escribámosla en la forma: ( ) ( ) dt x d a kT dt x d m 2 2 2 2 3 2 πη − · − Esta ecuación se integra fácilmente. Designando ( ) dt x d 2 obtenemos: aZ kT dt dZ m πη 3 2 − · − y después de la separación de variables, nuestra ecuación se transforma en dt m a a kT Z dZ πη πη 6 3 − · − Integrando la parte izquierda de esta ecuación entre los límites de 0 hasta Z, y la parte derecha desde 0 hasta t, obtenemos: ∫ ∫ − · − Z t dt m a a kT Z dZ 0 0 6 3 πη πη o bien t m a a kT In a kT Z In πη πη πη 6 3 3 − · , ` . | − − , ` . | − De donde ( ) dt x d e a kT Z t m a 2 6 1 3 · , ` . | − · − πη πη 21 Fácilmente nos podemos cerciorar que la magnitud t m a e πη 6 − es insignificantemente pequeña para las condiciones corrientes del experimento. En efecto, las medidas de las partículas brownianas no sobrepasan de 10 -4 cm, la viscosidad del líquido por lo común es próxima a la viscosidad del agua, es decir, aproximadamente igual a 10 -2 (en el sistema de unidades CGS), la densidad de la sustancia de las partículas es del orden de la unidad. Teniendo presente, que la masa m de la particula es igual a ρ π 3 3 4 a , obtenemos que el exponente t m a πη 6 − , para t > l0 --5 s, es tal que la magnitud t m a e πη 6 − se puede despreciar. Por consiguiente, si el intervalo de tiempo entre las observaciones consecutivas de las partículas son superiores a 10 -5 s, lo que naturalmente, siempre tiene lugar, entonces: ( ) a kT x dt d πη 3 2 · (7.6) Para intervalos de tiempo t ∆ finitos y para los desplazamientos 2 x ∆ correspondientes, la ecuación (7.6) se puede escribir en la forma: a kT t x πη 3 2 · ∆ ∆ (7.6a) de donde t a kT x ∆ · ∆ πη 3 2 (7.7) El valor del cuadrado del desplazamiento de la partícula browniana en el intervalo de tiempo t ∆ a lo largo del eje X, o de cualquier otro eje, es proporcional a este intervalo de tiempo. La fórmula (7.7) permite calcular el valor medio del cuadrado de los desplazamientos, tomándose la media para todas las partículas participantes del fenómeno. Pero esta fórmula es justa, también, para el valor medio del cuadrado de muchos desplazamientos sucesivos de una sola partícula en iguales intervalos de tiempo. Desde el punto de vista experimental es más cómodo observar, precisamente, los desplazamientos de una partícula. Estas observaciones fueron hechas por Perrin en el año 1909. Perrin observó el movimiento de las partículas a través de un microscopio, cuyo ocular estaba dotado de una red de líneas perpendiculares entre sí, que servían de sistema de coordenadas. Utilizando esta red, Perrin señaló en ella las posiciones sucesivas de la partícula escogida por él después de determinados intervalos de tiempo t ∆ (30 s). Uniendo luego los puntos, que indicaban las posiciones de la partícula, obtuvo un cuadro semejante al representado en la fig. 7. En esta figura están indicados tanto los desplazamientos de las partículas, como de sus proyecciones sobre el eje X. Es necesario tener en cuenta, que los movimientos de la partícula son mucho más complejos de lo que se puede juzgar según la fig. 7, ya que aquí están señaladas las posiciones después de intervalos de tiempo no muy pequeños (del orden de 30 s). Si 22 disminuimos estos intervalos, entonces resulta que cada segmento rectilíneo de la fig. 7 se desarrolla en una trayectoria en zigzag, tan compleja, como la de toda la figura. En sus observaciones, Perrin pudo medir los desplazamientos x ∆ y calcular los valores medios de sus cuadrados. Los datos de estas mediciones estaban en buena concordancia con la fórmula (7.7). De esta forma se ratificó la justeza de la explicación cinético-molecular del fenómeno del movimiento browniano y de la misma teoría cinético-molecular. La fórmula (7.7) puede ser utilizada para determinar la constante k de Boltzmann si son conocidos los valores de la viscosidad η del líquido, de su temperatura T y del radio a de la partícula. El valor de esta constante obtenida por Perrin y otros investigadores a base de semejantes mediciones es próximo al valor citado anteriormente de k = 1,380⋅10 -16 erg/grad. Indiquemos aquí, que el mismo Perrin utilizó los datos que obtuvo para determinar el número de Avogadro según la fórmula k R N · 0 ya que la constante R puede ser determinada de la ecuación de estado. Los experimentos de Perrin tuvieron un gran valor para fundamentar por fin la teoría cinético-molecular. 1.6. FORMULA BAROMÉTRICA Los movimientos moleculares caóticos conducen a que las partículas del gas se distribuyan uniformemente por el volumen de la vasija, de modo que en cada unidad de volumen en término medio se contiene el mismo número de partículas. En el estado de equilibrio, la presión y temperatura también son iguales en todo el volumen. Pero esto ocurre así, sólo en el caso, cuando sobre las moléculas actúan fuerzas externas. Con la existencia de tales fuerzas, los movimientos moleculares conducen a un comportamiento particular de los gases. Examinemos, por ejemplo, un gas (aire) que se encuentra bajo la acción de la fuerza de gravedad. Si no existiese el movimiento térmico de las moléculas, todas ellas «caerían» sobre la Tierra bajo la acción de la fuerza de gravedad y todo el aire formaría una capa delgadísima sobre la superficie de la Tierra. Si no existiese la fuerza de gravedad, pero existiesen los movimientos moleculares, las moléculas se dispersarían por todo el espacio universal. La existencia de la atmosfera, como envoltura aérea de la Tierra, en su forma actual, es debida a la presencia 23 conjunta del movimiento térmico de las moléculas y de la fuerza de atracción a la Tierra. Con ello se establece una distribución de las moléculas, completamente determinada, según la altura de la atmósfera. En correspondencia a esta distribución de las moléculas se establece una ley determinada para el cambio de presión de un gas con la altura que no es difícil hallar. Examinemos una columna vertical de aire (fig. 8). Supongamos, que al nivel de la Tierra, donde x=0, la presión es igual a p0 y a la altura x es igual a p. Al cambiar la altura en dx la presión cambia en dp. La presión del aire a una altura determinada será igual, como es sabido, al peso de la columna vertical de aire que se encuentra a esta altura sobre una superficie igual a la unidad. Por eso, dp es igual a la diferencia de los pesos de las columnas de aire sobre la unidad de superficie a las alturas x y x + dx, o sea, igual al peso de la columna de aire de altura dx y superficie de la base de una unidad dp=-pg dx, donde p es la densidad del aire (la masa de la unidad de volumen) y g es la aceleración de la fuerza de gravedad. La densidad p del gas es igual, evidentemente, al producto de la masa m de la molécula por el número n de ellas en la unidad de volumen: mn p · De la teoría cinética se sabe [fórmula (4.1)] que kT p n · . Por consiguiente, kT mp p · y pdx kT mg dp − · Esta ecuación (para la separación de variables) se puede escribir en la forma: dx kT mg p dp − · (8.1) Si consideramos que la temperatura es la misma a cualquier altura (lo que no es justo en general), entonces, integrando esta ecuación, obtenemos: C In x kT mg p In + − · (8.1a) donde C es la constante de integración. De aquí x kT mg Ce p − · (8.1b) La constante C se determina de la condición, que para x = O la presión p = p0. Poniendo en la ecuación (8.1b) estos valores de x y p, obtenemos 0 p C · Por consiguiente, la relación que nos interesa entre la presión del aire y la altura sobre la superficie de la Tierra tiene la forma: x kT mg o e p p − · (8.2) 24 O teniendo en cuenta que 0 N m µ · ( µ es el peso molecular, es decir, la masa del mol, N0 es el número de Avogadro), obtenemos: x RT g e p p µ − · 0 (8.2a). La ecuación (8.2) que establece la ley de disminución de la presión con la altura se llama fórmula barométrica. De esta ecuación se ve que la presión del gas disminuye con la altura según la ley exponencial. Para determinar la altura sobre la tierra se utiliza esta ley, midiendo la presión a la altura dada y al nivel del mar (natural-mente, la última es suficiente medirla una sola vez). Los aparatos que sirven para medir la altura de cúspides montañosas, del vuelo de los aviones, etc., son unos barómetros especiales, cuya escala está graduada directamente en metros. Sin embargo, para casos finos es necesario introducir en la ecuación (8.2) una corrección de la temperatura que, como se sabe, disminuye con el aumento de altura, mientras que la fórmula barométrica fue obtenida por nosotros con la suposición de la constancia de temperatura a cualquier altura. Utilizando la fórmula barométrica (8.2), también se puede determinar la constante de Boltzmann, pero en este caso la exactitud no es muy grande debido precisamente a la corrección de temperatura. Ya que la presión de un gas, como vimos anteriormente, es proporcional al número n de moléculas en la unidad de volumen ( NkT p · ), entonces la fórmula (8.2) también expresa la ley de disminución de la densidad de las moléculas con la altura x kT mg e n n − · 0 (8.3) donde n y n0 son los números de moléculas en una unidad de volumen en los puntos, entre los cuales la diferencia de alturas es igual a x. Esta fórmula, así como la fórmula (8.2a), indica que la atmósfera de la Tierra debe prolongarse hasta el infinito. Al deducir la fórmula barométrica (8.2a) o (8.3) suponíamos que la aceleración de la fuerza de gravedad g era constante, es decir, no dependía de la altura x. A base de esto, al integrar la ecuación (8.1) sacamos a g fuera del signo integral. Tal simplificación es aceptable para valores de x relativamente pequeños (del orden de decenas de kilómetros). Para grandes alturas es necesario tener en cuenta, que la aceleración da la fuerza de gravedad disminuye a la medida que nos separamos de la superficie de la Tierra. En efecto, de la ley de gravitación universal se deduce que a la distancia r desde el centro de la Tierra, la aceleración de la gravedad es ( ) ( ) 2 0 2 x r M r M r g + · · · γ γ donde γ es la constante de gravitación (en el sistema SI tiene el valor 2 2 11 / 10 67 , 6 kg m N ⋅ × · − γ y en el sistema CGS 2 2 8 / 10 67 , 6 g cm din ⋅ ⋅ · − γ ), M es la masa de la Tierra y r0 es el radio de la Tierra. Por eso, la ecuación (8.1) deberá ser escrita en la forma ( ) 2 0 x r dx kT Mm p dp + − · γ 25 Después de la integración obtenemos: C In x r kT Mm p In + + · 0 1 γ o bien , ` . | + · , ` . | + · , ` . | + · x r r kT mg C x r r kT m r M C x r kT Mm C p o 0 2 0 0 2 0 2 0 exp exp 1 exp γ γ (8.4) La constante de integración C se determina de la condición que para x = 0, la presión es p = p0. Poniendo estos valores de x y p en (8.4) obtenemos: kT mgr e p C 0 0 − · y la dependencia entre la presión y la altura tiene, finalmente, la forma: ] ] ] , ` . | + − − · x r r kT mgr p p 0 0 0 0 1 exp (8.5) De esta fórmula se deduce el resultado, paradojo a primera vista, de que incluso a una distancia infinita de la Tierra, es decir, cuando x→∞ la presión no es igual a cero: kT mgr e p p 0 0 − · ∞ Esto significa, que la atmósfera de la Tierra (como la de otros planetas) debería prolongarse hasta el infinito y en ningún lugar debería ser igual a cero la densidad de su gas. Ya que esto es, físicamente, imposible (el número de moléculas es finito mientras que el volumen del universo es infinito), entonces es necesario suponer que la atmósfera de la Tierra no se encuentra en estado de equilibrio. La ausencia del estado de equilibrio consiste en que el gas atmosférico ininterrumpidamente se dispersa en el universo. Esto, sin embargo, no condujo (ni conducirá durante miles de millones de años) a que la Tierra perdiese su atmósfera, ya que sólo una insignificante parte de partículas de aire abandonan la envoltura atmosférica de la Tierra. Pero esta situación pudo conducir a la pérdida de la atmósfera en la Luna, si es que la tuvo en el pasado (véase abajo con más detalle). 1.7. LEY DE BOLTZMANN La fórmula barométrica obtenida anteriormente, se refiere al caso cuando el gas se encuentra bajo la acción de la fuerza de gravedad. La magnitud mgx en la fórmula (8.3) x kt mg e n n − · 0 representa la energía potencial de la molécula a la altura x. Por eso, se puede decir que la fórmula (8.3) nos da el número n de partículas, cuya energía es U = mgx, si el número de partículas con energía igual a cero es 0 n (x se cuenta desde 26 el origen). No existe ningún fundamento para considerar que la conducta de un gas cambia esencialmente si actúa sobre él, en lugar de la fuerza de gravedad otra fuerza cualquiera, y que ja expresión de la energía toma otra forma. Si el Cas se encuentra en cualquier campo de fuerzas, de modo que sus partículas poseen cierta energía potencial, entonces el número de partículas quo poseen la energía U dada se determina por la fórmula kT U o e n n − · (9.1) La fórmula (9.1) se llama ley de Boltzmann. Ella permite determinar la parte de partículas que, en las condiciones de equilibrio térmico, poseen una energía U: kT U o e n n − · (9.2) De la fórmula (9.2) se ve que la parte 0 n n de partículas con una energía U dada depende, además del valor de esa energía, solamente de la temperatura. Esto permite tratar a la misma temperatura de una forma algo distinta, precisamente como magnitud de la cual depende la forma de distribución de las partículas según su energía. Para una temperatura dada la parte de moléculas, que poseen una u otra energía U', depende del valor de U y disminuye, rápida mente, con el aumento de U. Esto significa, que la parte de moléculas con una gran energía siempre es muy pequeña. Cuanto más baja sea la temperatura, tanto más rápido disminuirá 0 n n con el aumento de U. 1.8. CONCEPTO DE PROBABILIDAD La ley de Boltzmann, así como la fórmula barométrica se puede tratar más cómodamente desde otro punto de vista, utilizando el concepto de probabilidad. Recurrimos a esté término, a diferencia de la «certeza» o «determinación», en los casos, cuando se trata de sucesos casuales, es decir, aquellos cuyas condiciones de aparición por unas u otras causas no son conocidas, y que por eso no se puede prever de antemano-con seguridad. Al adquirir, por ejemplo, un billete en el tranvía, corrientemente, no sabemos de antemano si el número será par o impar. Por eso, tal «suceso» como la adquisición de un billete, precisamente, con número par se puede considerar como un suceso casual. Si adquirimos, por ejemplo, 10 billetes (claro está, no en una adquisición), entre ellos pueden hallarse tres, seis u ocho billetes con números pares. Pero también puede ocurrir que entre ellos no se halle ningún par, o al revés, que sean pares todos los 10 billetes. Sin embargo, en esta aparente arbitrariedad completa existe una ley determinada. Ella consiste en que, si repetimos el experimento (la compra de billetes) un número de veces suficientemente grande, entonces en la mitad de los casos, aproximadamente, el billete tendrá un número par. Y mientras mayor sea el número de tales «experimentos», tanto más próxima a la mitad será la parte de billetes con números pares. En tal caso se dice que la probabilidad de adquirir billetes con número par es igual a ½. Del mismo modo, podemos tener la seguridad de que al lanzar <muchas veces la/moneda, aproximadamente en la mitad de los casos caerá con la parte del escudo 27 mirando hacia arriba. Y esto será tanto más cierto, cuanto mayor sea el número de lanzamientos. Estos experimentos y otros semejantes nos permiten dar la siguiente definición de la probabilidad: La probabilidad de un suceso se llama el límite al cual tiende el .cociente entre el número de experimentos, que llevan a su realización, y el número total de experimentos, cuando este último aumenta infinitamente. Si del número N de experimentos (u observaciones), N' llevan a la realización del suceso que nos interesa, entonces la probabilidad W de este suceso se expresará por la fórmula: En el caso que hemos examinado con los números de los billetes, la probabilidad del número par es igual a 1/2. Naturalmente, tal será la probabilidad del número impar. La suma de estas dos probabilidades es igual a la unidad. Ella nos da, evidentemente, la probabilidad del «suceso» consistente en que el billete tenga un número par o impar. Pero tal suceso es inevitable, o sea que la probabilidad igual a la unidad, significa la certeza. Por el contrario, si cualquier suceso no es posible (por ejemplo, la falta absoluta de números), entonces su probabilidad es igual a cero. En el ejemplo con los billetes (lo mismo que con el lanzamiento de las monedas) el «experimento» (la compra de billetes'), puede llevar a uno de los dos resultados: el número de billete puede ser par o impar, y ambos resultados tienen la misma posibilidad. Pero no siempre ocurre así. Por ejemplo, del hecho de que al tirar sobre el blanco son posibles sólo dos resultados, acertar o errar, no se deduce que la probabilidad de acertar es igual a 1/2, ya que el acertado o yerro no son resultados de tiro igualmente posibles. Y si se realiza un gran número de disparos, la relación entre el número de aciertos y el número de disparos, es dudoso que sea igual a la mitad: para el tirador hábil, abastecido con un arma de buen reglaje, será próximo a la unidad, para el mal tirador se diferenciará poco de cero. Sin embargo, a pesar de que la probabilidad de cada uno de los dos resultados de tiro posible no es igual a 1/2, su suma también en este caso será igual a la unidad: |se puede afirmar con completa seguridad que el tiro conduce a un resultado determinado, acierto o yerro!. Teorema de la suma de probabilidades. Examinemos ahora otro ejemplo que nos permite formular uno de los principios más importantes de la teoría de probabilidades, y además nos da todavía otra definición do la propia magnitud de la probabilidad. Ella será útil en lo sucesivo. Supongamos que en una caja se encuentran 20 bolas pulidas, completamente iguales según sus dimensiones y peso, y supongamos que 5 de ellas están pintadas de color blanco y las restantes, de negro. Si sacamos ahora de la caja una bola, ya que las bolas no se diferencian una de la otra en nada, a excepción del color, está claro, que la probabilidad de sacar una bola cualquiera será igual a la probabilidad de sacar otra cualquiera. Para cada bola que deseásemos señalar de cualquier forma, la probabilidad de que sea sacada es evidentemente igual a 1/20. Examinemos ahora ¿qué probabilidad hay para que sea sacada una bola blanca? Ya que para cada bola (lo mismo da blanca que negra) la probabilidad de que sea sacada es igual a 1/20 y en total hay 5 bolas blancas (y nos es igual cuál se sacará de ellas), entonces la probabilidad buscada será igual a la suma de las probabilidades de todas las bolas blancas: 28 N N W N ` lim ∞ → · 20 5 20 1 20 1 20 1 20 1 20 1 · + + + + · W Este resultado expresa uno de los principios más importantes de la teoría de probabilidades, el teorema de la suma de probabilidades, que dice así: Si Wlt Wa, W3, etc., son las probabilidades de varios sucesos que se excluyen unos a otros, entonces la probabilidad de que se realice uno cualquiera de ellos es igual a la misma de las probabilidades de todos estos sucesos. Esto significa, que la suma de probabilidades de varios sucesos nos da la probabilidad de que se realice o uno, o el otro, o el tercero, etc. Aquí suponemos que estos sucesos, o aunque sea dos de ellos, no pueden ocurrir al mismo tiempo. De modo que en nuestro ejemplo la probabilidad de sacar una de las bolas blancas es 5/20, y ya que la operación de sacar la bola se realiza sólo una vez, si se ha sacado una bola blanca, ya no se puede sacar ninguna otra. El ejemplo expuesto nos permite dar una nueva definición de la probabilidad que se diferencia un poco de la anterior. Hemos halla-do que la probabilidad de ser sacada una bola blanca es igual a 5/20. Pero el número 20 es el número de todos los resultados posibles de la operación de sacar la bola, y el número 5 es el número de casos (de los 20 posibles) que favorecen la realización del suceso dado, la aparición de la boja blanca. Esto precisamente, permite definir la probabilidad del suceso dado como el cociente del número de casos que favorecen su realización y el número total de casos posibles si iodos los casos son igualmente posibles, Esta definición de la probabilidad pertenece a Laplace. Como se ve fácilmente, ella no contradice a la definición anterior. En la definición de la probabilidad, que acabamos de exponer, es de importancia el hecho de que todos los casos sean igualmente posibles, igualmente probables. Precisamente así está planteada la cuestión en nuestro ejemplo con las bolas. En las aplicaciones de la teoría de probabilidades en la Física, corrientemente, también solemos encontrarnos con sucesos igualmente probables. Volvamos ahora a la fórmula .de la ley de Boltzmann (9.2). De todo la que fue dicho aquí sobre la probabilidad, está claro que la magnitud n/na tiene en esta fórmula, precisamente, el sentido de probabilidad. En efecto, cualquiera de las n0 moléculas puede poseer la energía potencial U. Es decir, n0 es el número total de casos posibles. Bn realidad, n moléculas poseen esta energía U. Por consiguiente, n es el número que denominábamos anteriormente número de casos «favorables». Por eso, la relación n/n0 que llamábamos (completamente fundamentado) parte de moléculas que poseían la energía U, es al mismo tiempo la probabilidad de que cualquiera de las n0 moléculas posea tal energía. Teorema de la multiplicación de probabilidades. Todavía nos | queda por exponer otro principio importante de la teoría de probabilidades, el teorema de la multiplicación de probabilidades. El se refiere al caso, cuando se determina la probabilidad de un suceso complejo consistente en la simultaneidad de dos o más sucesos independientes. Los sucesos se llaman independientes, si la probabilidad de uno de ellos no depende de que se realice o no, otro cualquiera. Volviendo a los ejemplos anteriores con los billetes y el tirador podemos, por ejemplo, plantear la tarea siguiente: ¿cuál es la probabilidad de que el tirador, al dirigirse al campo de tiro en el tranvía, adquiera un billete con número par, y que luego su primer disparo sea coronado con el éxito? Es claro que estos dos sucesos son independientes. Supongamos que para nuestro tirador la probabilidad W1 de acertado es igual a 0,8. Esto significa, que de las 10 asistencias al campo de tiro, en ocho casos caerá en el blanco del primer disparo. Pero con esto, solamente en la mitad de ellas, al mismo tiempo adquiere te billete con número par, ya que la probabilidad Wt de recibir tan billete par es igual' a 1/2. Es decir, la probabilidad WJt buscada del suceso complejo, la coincidencia de un número par con el disparo acertado, es igual al producto de las probabilidades de cada uno de ellos: 29 La probabilidad de simultaneidad de dos o varios sucesos independientes es igual al producto de las probabilidades de cada uno de ellos por separado. Probabilidad y valor medio de una magnitud. En los párrafos anteriores ya hemos utilizado repetidamente los valores medios de distintas magnitudes físicas que caracterizan el movimiento de las partículas: velocidad media, energía media, etc. Recurrimos a este método de descripción de los sistemas moleculares, porque para el gran número de partículas, de las que están compuestos, no existe posibilidad ni necesidad de considerar las magnitudes referentes a cada una de ellas por separado. Como vimos, la utilización de los valores medios de las magnitudes no nos estorbó para obtener leyes completamente exactas, como, por ejemplo, la ecuación de estado " de los gases ideales. No es difícil ver que los valores medios de las magnitudes físicas también están íntimamente ligados al concepto de probabilidad. A causa de los movimientos desordenados continuos de las partículas, cualquier sistema molecular deberá pasar, durante un intervalo de tiempo bastante amplio a través de una serie innumerable de estados que se sustituyen unos a otros de un modo complicado, debido a las múltiples acciones intermoleculares. Nuestro sistema permanecerá en cada estado no sólo una vez, sino muchas veces. Supongamos que es necesario determinar una magnitud cualquiera a, que se refiere al sistema o a una cualquiera de sus partes. Para eso, tendremos que realizar (claro está, mentalmente) un conjunto de observaciones sobre el sistema en sus distintos estados. Designemos por N el número de tales observaciones. Entonces, resulta que para N1 observaciones (de las N), la magnitud que nos interesa tiene valor a1, N2 observaciones nos dan para a el valor a2, etc. Por definición el valor medio de a será igual a: ∑ ∑ · + + + + + + · 1 1 1 3 2 1 3 3 2 2 1 1 ... ... N a N N N N a N a N a N a Ya que la suma es igual al número total de observaciones N, entonces 1 1 2 2 1 1 ..... a N N a N N a N N a ∑ ∑ · + + · Pero N1/N, es decir, el cociente del número de observaciones para las cuales la magnitud a tiene un valor a1 y del número total de observaciones N es la probabilidad de este valor. Exactamente igual, N2/N es la probabilidad de que el valor de a sea igual a a2, etc. Por consiguiente, el valor medio de la magnitud a es igual a la suma de los productos de sus distintos valores por las probabilidades correspondientes. i i a W a W a W a W a ∑ · + + + · .... 2 2 2 2 1 1 Ya indicamos que las leyes de la Física Molecular siempre tienen un carácter probable, pero no pierden a causa de esto su exactitud y precisión. Esto ocurre así, porque las magnitudes físicas que describen cualquier sistema, que se encuentre en condiciones externas invariables, también resultan ser, prácticamente, constantes e iguales a sus valores medios. En estos casos se dice que el sistema se encuentra en estado de equilibrio. Esta cuestión se examinará más detalladamente en adelante. 30 4 . 0 5 . 0 * 8 . 0 2 1 12 · · · W W W 1.9. CONCEPTO DE DISTRIBUCIÓN. FUNCIÓN DE DISTRIBUCIÓN Como sabemos, en las ecuaciones fundamentales de ip teoría: cinética de los gases ideales-figura la energía cinética media de las moléculas, que a su vez se determina por su velocidad cuadrática media. El sentido de velocidad cuadrática media consiste en que es la velocidad que deberían poseer todas las moléculas (si las magnitudes de sus velocidades fuesen iguales y sus direcciones, de igual probabilidad), para que la presión del gas fuese la que es en realidad. De hecho, las velocidades do las moléculas no son iguales, y esto incluso lo tuvimos en cuenta al deducir la ecuación fundamental. Los hechos experimentales señalan esto. Así, por ejemplo, en los experimentos de Stern; en los cuales se "inedia la velocidad de las moléculas, la banda desplazada no resaltó ser nítida, sino borrosa debido a que las moléculas con distintas velocidades caían en distintos lugares del blanco. Sobre esto, también testimonia la ley, examinada en el § 8, de distribución de las moléculas según su altura en el campo giratorio (fórmula barométrica). Si todas las moléculas tuviesen la misma velocidad, su distribución sería completamente diferente. En efecto, imaginémonos que todas las moléculas que se encuentran cerca de la superficie de la Tierra tienen una misma velocidad, cuya componente vertical es igual a u. Estas moléculas se elevarían hasta la altura x, determinada por la condición: mgx mu · 2 2 , es decir, hasta la altura g u x 2 2 · , después de lo cual volverían a la Tierra con la energía cinética inicial, es decir, se comportarían corno se comporta cualquier cuerpo lanzado hacia arriba. En tales condiciones, la atmósfera tendría una frontera brusca a la altura £, fuera de cuyos límites no existiría. La experiencia, sin embargo, indica que la atmósfera no tiene frontera brusca, su densidad disminuye con la altura de acuerdo con la fórmula barométrica. De tal modo, la suposición sobre la igualdad de la velocidad de todas las moléculas contradice a la experiencia. Debido a los movimientos desordenados de las moléculas y a sus choques mutuos, las moléculas de un gas se distribuyen según sus velocidades de tal modo que entre ellas se encuentran tanto las muy rápidas como las muy lentas. A pesar del caos completo de los movimientos moleculares, a pesar del carácter casual de los choques y de los cambios de velocidad de las moléculas originados por ellos, la distribución de las moléculas según sus velocidades, como demuestra la teoría y la experiencia, resulta ser no casual, no arbitraria, sino completamente determinada. En su carácter no influyen ni los choques entre las moléculas, ni incluso el campo exterior. Resulta ser unívoco y el único posible. Y esto no sólo no contradice a la representación del carácter caótico de los movimientos moleculares, sino que precisamente se condiciona por éste. Antes de comenzar la deducción de la ley de distribución de las moléculas según sus velocidades, aclaremos la esencia de la tarea sobre la distribución. Determinar la distribución de las moléculas según sus velocidades, parece ser que significa determinar el número de moléculas que poseen una u otra velocidad dada. Sin embargo, la pregunta no tiene sentido en este aspecto, ya que el número pro bable de moléculas que tienen exactamente (matemáticamente exacta) la velocidad dad?, es 31 igual a cero, El número de valores de velocidades distintas es infinitamente grande y el número de moléculas es finito. Por eso, el número de moléculas que corresponden a cada valor de la velocidad dado arbitrariamente, es igual a cero. A consecuencia de esto, la pregunta debe formularse de otro modo: ¿cuántas moléculas (o qué parte de moléculas) poseen velocidades comprendidas en un determinado intervalo, próximo a la velocidad dada? Precisamente así se plantea siempre la tarea estadística. Si se exige, por ejemplo, hallar la distribución de la población de un país según su edad, esto no significa que es necesario determinar el número probable de personas que tienen una u otra edad exacta (matemáticamente exacta). Tal pregunta no tiene sentido, ya que el número de distintos valores de edad es infinitamente grande y el número de personas es finito. Se puede, solamente, determinar el número probable de personas, cuya edad está comprendida en un intervalo de valores determinado. Cuando hablamos en nuestra conversación diaria que aquel hombre tiene 18 años, con esto no queremos decir que al tiene justo 18 años, O días, O minutos, O segundos. Nuestra, afirmación significa, solamente, que su edad so encuentra en el intervalo entre 18 y 19 años. Lo mismo, por ejemplo, cuando el Ministerio de Instrucción Pública planifica el trabajo de las escuelas en el año escolar, al interesarse del número de niños de siete años de edad que ingresan en la escuela, no se interesa de aquellos niños que el 1 de septiembre, a las 8 de la mañana cumplen exactamente los 7 años. En realidad, le interesa el número de niños, cuya edad se encuentra entre los siete y ocho años. Función de distribución. Al estudiar la distribución de las partículas según sus velocidades, buscaremos también el número de' partículas cuyas velocidades (o cuyas componentes de velocidad) se encuentran en un determinado intervalo de valores de velocidad (o de sus componentes). Es evidente, que el número de partículas Δn en una unidad de volumen cuyas velocidades se encuentran en un determinado intervalo desde v hasta v + Δv será tanto mayor, cuanto más grande sea el intervalo, es decir, Δn ~ Δv, o bien Δn = aΔv (11.1) donde a es el coeficiente de proporcionalidad. También está claro, que Δn depende además de la misma velocidad, ya que en intervalos iguales en magnitud pero con diferentes calores absolutos de velocidad, el número de partículas será diferente, como es diferente, por ejemplo, el número de personas en los hiérvalos de edades de 99 a 100 años y de 30 a 31 años, a pesar de que en ambos casos son iguales los intervalos. Esto significa, que en la fórmula (11.1) el coeficiente de proporcionalidad debe ser función de la velocidad: a =f (v) Por último, e1 número Δn también debo ser proporcional al número de partículas n en la unidad de volumen. Por eso, la fórmula para. Δn deberá tener la forma: Δn = nf(v) Δv Corrientemente, esta fórmula se escribe en la forma siguiente: Δn/n=f(v) Δn (11.2) La magnitud, en esta fórmula, representa la parte de partículas en la unidad de volumen del gas cuyas velocidades se encuentran en el intervalo desde v hasta v + Δv. La función f(v) se llama función de distribución. El objeto de nuestra tarea es hallar la forma de esta función. El sentido de la función de distribución está claro de la fórmula (11.2). En efecto: f(v) = Δn/n, para Δn=1 32 Esto significa, que (v) es igual a la parte de partículas, cuyas velocidades se encuentran en el intervalo unitario de velocidades próximo a la velocidad v. Pasando al límite, la fórmula (11.2) se puede volver a escribir en la forma: dn/n = f(v) dv (11.3) De lo dicho anteriormente sobre la probabilidad se deduce que la magnitud dn/n, en la fórmula (11.3) tiene el sentido de probabilidad: esto es la probabilidad de que cualquiera de las moléculas del gas, contenida en la unidad de su volumen, posea la velocidad que descansa en el intervalo dv próximo a la velocidad v. La magnitud de la función de distribución (v) se le puede adjudicar el sentido de probabilidad de que cualquier molécula de gas en la unidad de su volumen tenga una velocidad, comprendida en el intervalo unitario próximo a la velocidad v. A ella la llaman, por eso, densidad de probabilidad. La formula barométrica obtenida anteriormente debe su forma a que las velocidades' de las moléculas no son iguales y están distribuidas de un modo determinado. El carácter de esta distribución precisamente depende de la forma de la función f (v). Utilizando la fórmula barométrica ya conocida, determinaremos la forma de la función de distribución que conduce a la relación (8.3) entre la densidad do las moléculas y la altura: Observemos que la función de distribución se puede hallar también por otros caminos. Maxwell la obtuvo (en el año 1859) a partir de consideraciones basadas en la teoría de probabilidad. Boltzmann (en el año 1877) dedujo esta fórmula, al considerar los choques de las moléculas gaseosas, debido a los cuales se establece la distribución. Como consecuencia de esta fórmula se puede obtener la fórmula " barométrica. Para hallar la ley de distribución, utilizaremos la fórmula barométrica va obtenida con el objeto de simplificar el cálculo. 1.10.DISTRIBUCION DE LAS MOLECULAS SEGÚN LAS COMPONENTES DE LA VELOCIDAD. Imaginemos una vasija con gas, colocada en el espacio vacío en el campo de gravedad. Dentro de la vasija el gas se encuentra en equilibrio y sus moléculas están distribuidas según sus velocidades de una forma determinada. Se exige hallar esta distribución. Si en algún momento se rompe la vasija, entonces las moléculas del gas empiezan a moverse en todas direcciones y en particular hacia arriba, contra la dirección de la fuerza de gravedad. La existencia de la fuerza de gravedad nos ayudará a hallar aquella distribución que había en el gas antes de romper la vasija. Dirijamos uno de los ejes coordina dos, por ejemplo el eje Z, según la vertical con el origen de referencia en aquel sitio donde se encuentra la vasija. Está claro que la fuerza de gravedad sólo influye en la componente z de las velocidades de las moléculas, de manera que buscaremos la distribución de las moléculas no por sus velocidades, sino por los valores de las componentes Vz de sus velocidades. El movimiento de las moléculas hacia arriba a lo largo del eje Z va acompañado con una disminución de la componente z de sus velocidades. Por ejemplo, si para una molécula esta componente es zo v a una determinada altura inicial 0 z , entonces a la altura z será justa la relación de la ley de conservación de la energía: 33 X kT mg o e n n ) ( − · mgz mv mv o + · 2 2 2 2 2 (12.1) donde Vz es el valor de la componente z de la velocidad a la altura z. Está claro, aquellas moléculas que tengan la energía cinética no pueden elevarse a una altura mayor que z. Para ellas la máxima altura de elevación z se determina por la igualdad g v z z 2 / 2 0 · . A esta altura, para tales moléculas Vz se hace igual a cero, después de lo cual ellas caen acelerándose, cómo cualquier cuerpo lanzado verticalmente hacia arriba. Separemos a una altura arbitraria z una capa de gas de altura dz con el área de la base igual a la unidad (fig. 10). En esta capa el gas se compone de moléculas en movimiento! Estas son las moléculas que pasan a través de ella de abajo arriba y de arriba abajo (recordemos que sólo nos interesan las componentes de las velocidades de las moléculas según el eje Z). La diferencia entre las moléculas que llegan de abajo y de arriba, consiste en que las moléculas que llegan de abajo tienen componentes z de velocidades, que por su módulo, obligatoriamente, superan al valor √2gz, mientras que las moléculas que llegan de arriba pueden tener componentes z de velocidades con cualesquiera valores, desde O hasta oo. En condiciones de equilibrio, cuando debe ser constante el número de moléculas en la capa, el número de moléculas que llegan de arriba abajo, deberá ser igual al número de moléculas que llegan de abajo arriba. A la altura z0 el número de moléculas en la unidad de volumen con componentes z de velocidades, que descansan en el intervalo desde vz0 hasta vz0 +dvz0 se determina por la igualdad En la unidad de tiempo atraviesa nuestra capa a la altura z un número 0 0 0 0 ) ( z z z z dv v f v n tales moléculas (véase la pág. 27). El número total de moléculas que atraviesan la capa abajo arriba (designamos este número por Nt) será igual a De tal modo obtenemos que el número de moléculas que atraviesan la capa de arriba abajo (NI) será igual a Durante el equilibrio, como se indicó, N↑ y N↓ deberán ser iguales entre sí, Dividiendo ambas partes de esta igualdad por nz0 y teniendo en cuenta que, de acuerdo a la fórmula barométrica kT mgz z z e n n o − · obtenemos: 34 o o o o z z z z dv v f n dn ) ( · ∫ ∫ ∞ ∞ · · gt z z z gt z z z z z t o o o o o o o o dv v f v n dv v f v n N 2 2 ) ( ) ( ∫ ∫ ∞ ∞ · · 0 0 ) ( ) ( z z z z z z z z t dv v f v n dv v f v n N ∫ ∫ ∞ ∞ · · 0 2 ) ( ) ( z z z gz z z z z z dv v v f n dv v v f n o o o ∫ ∫ ∞ ∞ − · 0 2 ) ( ) ( z z z gz kT mgz z z z dv v v f e dv v v f o o o De la ley de conservación de la energía por medio de su diferenciación obtenemos z z z z dv v dv v o o · Sustituyendo bajo el signo de integral, en la parte izquierda de la igualdad, el valor de vz y dvz. Con ello hay que cambiar el límite inferior de integración por el cero, de modo que De aquí se deduce que f(vzo) = f(vz) kT mgz z z e v f v f o ) ( ) ( · Teniendo en cuenta la formula (12.1) de la ley de conservación de la energía, no es difícil observar que la igualdad 12.3 puede ser justa solamente si kT mv z z Ae v f 2 ) ( − · y kT mv z z Ae v f 2 0 ) ( − · Por lo tanto, la función de distribución de las moléculas según las componentes de la velocidad por el eje Z tiene la forma kT mv z z Ae v f 2 ) ( − · El número de moléculas en la unidad de volumen, cuyas componentes x descansan dentro del intervalo desde vz hasta vz + dvz ahora se expresan por la formula z kT mv n dv nAe d z 2 2 − · o z kT mv n dv Ae n d z 2 2 − · Aún nos queda determinar la constante A, que entra en la función de distribución. Para esto es suficiente integrar dn/n para todos los valores posibles de vz desde –oo hasta + oo. Entonces obtenemos la probabilidad de que la molécula de gas posea una velocidad con un determinado valor de la componente z. A n d n · ∫ ∞ ∞ − 1 2 2 · − ∞ ∞ − ∫ z kT mv dv e z De donde 1 2 ) ( 2 − − ∞ ∞ − ∫ · z kT mv dv e A z 35 ∫ ∫ ∞ ∞ − · 0 0 ) ( ) ( z z z kT mgz z z z dv v v f e dv v v f o Para calcular la integral introduzcamos la nueva variable x 2 = mv 2 z / 2KT x m kT v z 2 · y x d m kT dv z 2 · Por eso ∫ ∫ ∞ ∞ − − − ∞ ∞ − · dx e m kT dv e x z kT mv z 2 2 2 2 Se sabe que π · ∫ ∞ ∞ − − dx e x 2 Por consiguiente m kT dv e z kT mv z π 2 2 2 · − ∞ ∞ − ∫ Y la constante A que nos interesa de la ecuación (12.4) será igual a: 2 1 2 , ` . | · kT m A π La expresión de la función de distribución toma ahora la forma: kT mv kT mv z z z z e kT m e kT m ndv dn v f 2 2 1 2 2 1 2 2 2 1 2 ) ( − − , ` . | · , ` . | · · π π Gráficamente, esta función tiene la forma representada en la fig. 11. Del gráfico se ve que la función f(uz) tiende a cero cuando vz —>oo. Pero la parte de moléculas con la componente z de la velocidad, igual a cero, no es igual a cero. Como se ve de la fórmula (12.5) y de la curva fig. 11, la parte de moléculas cuyas componentes z de velocidades es próxima a cero, es igual a ÍA (en esto consiste el sentido físico de esta (constante). Al elevar la temperatura disminuye esta parte de moléculas. La función de distribución de las moléculas según las componentes de velocidad la obtuvimos, considerando el gas en el campo de gravedad. Recordemos que esto no significa que esto significa que la forma de la distribución de las moléculas según sus componentes de velocidad esté de algún modo relacionada con la acción de la fuerza de gravedad o que precisamente la fuerza de gravedad cree esta distribución. Como ya indicamos, la fórmula barométrica que utilizamos en nuestra deducción, por sí misma, es una consecuencia de la distri- bución de las moléculas según sus velocidades. El papel de la fuerza de gravedad en nuestra deducción sólo consiste en que ella «reveló.» la distribución que existía en el gas. El que la fuerza de gravedad no juegue un papel en el establecimiento de la distribución ya se ve por el hecho de que en la función de distribución no figura la magnitud g que caracteriza la fuerza de gravedad. 36 1.11.DISTRIBUCIÓN DE LAS MOLÉCULAS POR VELOCIDADES La expresión que acabamos de obtener para la función de distribución de las moléculas de un gas según las componentes z de velocidades No puede ser un <<privilegio>> precisamente de la componente z de la velocidad. Es evidente que las expresiones, totalmente semejantes, deberán determinar también la distribución de las moléculas por las otras componentes de velocidades, de modo que Ahora también podemos hallar la probabilidad de que la velocidad de la molécula satisfaga al mismo tiempo las tres condiciones: 1) La componente según el eje X descansa en los límites de v x a v x + dv x 2) La componente según el eje Y descansa en los límites de v y a v y + dv y 3) La componente según el eje Z descansa en los límites de v z a v z + dv z Los valores de las componentes de la velocidad según cada uno de los ejes. Por eso, la probabilidad de que la velocidad de la molécula satisfaga al mismo tiempo las tres condiciones indicadas es la probabilidad de un <<suceso>> complejo. Y como sabemos ella es igual al producto de las probabilidades de cada uno de los sucesos por separado. Si designamos por dn xyz el número de moléculas en la unidad de volumen del gas, cuyas componentes sobre los ejes coordenados descansan en los límites indicados anteriormente, entonces podemos escribir donde de aquí (13.1) Esta fórmula indica cuántas moléculas del número contenido en la unidad de volumen de gas, poseen velocidades, cuyas componentes según los ejes coordenados se encuentran en los intervalos entre v x y v x + dv x , v y y v y + dv y , v z y v z + dv z es decir, poseen velocidad que descansa en el intervalo dado en magnitud y en dirección. A esta fórmula se le puede dar una interpretación geométrica. 37 kT mv z z z Ae ndv dn 2 2 − · kT mv y y kT mv x x y x Ae ndv dn Ae ndv dn 2 2 2 2 , − · · z y x kT mv xyz dv dv dv e A n dn 2 3 2 − · 2 2 2 2 z y x v v v v + + · z y x kT mv xyz dv dv dv e nA dn 2 3 2 − · z y x kT mv xyz dv dv dv e kT m n dn 2 2 3 2 2 − , ` . | · π o Imaginémonos que hemos reunido todas las moléculas de la unidad de volumen del gas cuyas componentes de velocidad v están comprendidas en los intervalos anteriormente indicados y luego las soltamos. Después de 1 s todas se encontrarán a la distancia v de su posición inicial, en el paralelepípedo con los lados dv x , dv y y dv z , es decir, en el volumen dw = dv x dv y dv z . Esto está indicado en la fig. 12, en donde está representado nuestro experimento mental en un sistema específico de coordenadas, sobre cuyos ejes están colocados las componentes v x , v y , y v z . El número de moléculas, referido a la unidad de volumen de este paralelepípedo (no confundirlo con el número de moléculas en la unidad de volumen del gas; aquí se trata de la unidad de volumen en el <<espacio>> de velocidades, de acuerdo a (13.1) es igual a Esta magnitud no puede depender, naturalmente, de la dirección del vector de velocidad v. Por eso, no es difícil hallar ahora la función de distribución de las moléculas según las velocidades, independientemente de su dirección. En realidad su reunimos todas las moléculas de la unidad de volumen del gas, cuyas velocidades están incluidas en el intervalo de v a v+ dv por todas las direcciones, y luego las soltamos, entonces esparciéndose en todas direcciones, después de un segundo se encontrarán distribuidas uniformemente en una capa esférica de espesor dv y de radio v (fig. 13). Esta capa esférica está compuesta de aquellos <<paralelepípedos>> sobre los que se habló anteriormente. El número de moléculas en la unidad de esta capa (de nuevo, no se le puede confundir con el número de moléculas en la unidad de volumen del gas) es el mismo que en cada paralelepípedo, es decir, se determina por la fórmula (13.1). El número de moléculas en toda la capa es el número de moléculas 38 kT mv xyz e kT m n dw dn 2 2 3 2 2 − , ` . | · π en la unidad de volumen del gas, cuyas velocidades descansan en el intervalo de v a v+ dv. Este número sería igual a donde dΩ es el volumen de la capa esférica a 4лv 2 dv. De tal modo, Está fórmula expresa la ley de Maxwell de distribución de las moléculas según las velocidades. La magnitud dn/n es la probabilidad de que una molécula de gas, elegida arbitrariamente, resulte que descansa en el intervalo entre v y v+ dv. En otras palabras, dn/n es la parte de todas moléculas de la unidad de volumen, cuyas velocidades descansan en el intervalo de v a v+ dv . La magnitud Representa la función de distribución de las moléculas según sus velocidades. Ella determina la parte de moléculas de la unidad de volumen de gas, cuyas velocidades están comprendidas en el intervalo de velocidades igual a la unidad, que comprende a la velocidad dada. La forma gráfica de la función de distribución de Maxwell está representada en la fig. 14. Como era de esperar ella se hace se hace cero para v=0 y para v→ ∞: en el gas no hay moléculas inmóviles y no hay moléculas con velocidades infinitamente grandes. Como se ve en la curva de la fig. 14, la función de distribución tiene un máximo para un determinado valor de la velocidad vmp Esto significa que la parte mayor de todas las moléculas del gas se mueven con velocidades, cuyos valores son próximos a vmp. También se puede decir que las velocidades próximas a vmp se registran en las moléculas del gas más frecuentemente que otras y la probabilidad de que la velocidad de la molécula sea próxima a vmp es la máxima. Por eso, la velocidad vmp que corresponde al máximo de la curva de distribución de Maxwell se llama la velocidad más probable. 39 Ω , ` . | · − d e kT m n dn kT mv 2 2 3 2 2π · , ` . | · − dv e v kT m n dn kt mv 2 2 2 3 2 2 4 π π , 2 4 2 2 2 3 2 dv e v kT m n kT mv − , ` . | · π dv e v kT m n dn kT mv 2 2 2 3 2 2 4 − , ` . | · π o ( ) kT mv e v kT m ndv dn v f 2 2 2 3 2 2 4 − , ` . | · · π Con objeto de comprender mejor la diferencia entre distribución según las velocidades y distribución según las componentes de las velocidades, examinemos la analogía con otro proceso, en el cual las leyes de causalidad juegan el papel principal, como en el caso del establecimiento de la distribución de moléculas. Imaginémonos que se realiza el tiro sobre el punto central del blanco. Por muy hábil que sea el tirador y perfecta su arma, las baladas no caerán cerca, a diferentes distancias de él (fig. 15). Esto explica por diferentes factores que son imposibles de tener en cuenta: las cargas del cartucho no completamente iguales, la influencia del viento y otras (en el caso de un gas, el choque entre las moléculas juega el papel de tales factores causales, sobre el que se hablará más adelante). Para un número de disparos suficientemente grande, la distribución de las balas alrededor del centro, es decir, la distribución según las distancias a él, resulta que se somete a una ley completamente determinada. No es difícil aclarar el carácter de esta ley. En la fig. 15 está representada la distribución de los impactos alrededor del blanco. Esta distribución se puede valorar de dos formas. 40 41 Se puede dividir toda la superficie del blanco en bandas anulares (fig. 16) como se hace en los concursos de tiro, trazando una serie de circunferencias a una misma distancia ∆r una de la otra, y determinar el número de impactos que corresponden a una distancia dad r del centro en el intervalo de r hasta r + ∆r. En este caso, el número de impactos en el círculo central, si éste es suficientemente pequeño, será próximo a cero, porque en un círculo suficientemente pequeño no se puede acertar. Al aumentar el número de impactos en ella, alcanzando un máximo determinado, después del cual disminuirá y a una distancia lo suficientemente alejada del centro se hará igual a cero (véase la curva de la fig. 16). Se puede proceder de otro modo. Dividimos la superficie del blanco en bandas, trazando una serie de rectas paralelas, situadas a la misma distancia ∆r una de la otro (fig, 17). Si determinamos ahora el número de impactos ∆n, correspondientes a cada banda, resulta, como se ve fácilmente en la figura, que decrece monótonamente a medida que nos separamos de la banda central, tendiendo a cero a una distancia del blanco suficientemente grande; esto se ve en la curva de la fig. 17 análoga a la curva de la fig. 11. El primero de los métodos expuestos para describir la distribución, corresponde a la determinación de la función f(vx), según las componentes de velocidades. Utilizando la curva de distribución de las moléculas según sus velocidades, se puede hallar, gráficamente, la parte dn/n de moléculas en la unidad de volumen del gas, cuyas velocidades descansan en el intervalo dv dado de velocidades. Ella es igual a la superficie de la franja rayada en la fig. 14, con base dv y altura f(v). Está claro que toda la superficie limitada por la curva de distribución y el eje de las velocidades nos da el número total de moléculas en la unidad de volumen. Como se ve la fórmula (13.3) la forma de la curva de distribución depende de la naturaleza del gas (en la fórmula ente la masa m de la molécula) y de la temperatura. En la fig. 18 están dadas las curvas de distribución de las moléculas de nitrógeno según sus velocidades para distintas temperaturas. De ellas se ve que al elevar la temperatura, crecen las velocidades de las moléculas, de modo que toda la curva se desplaza al lado de las grandes velocidades. Pero las superficies limitadas por las curvas y el eje de las velocidades, quedan, naturalmente, 42 invariables. A consecuencia de esto disminuye el máximo de la curva al elevar la temperatura. Al deducir la ecuación de Maxwell de la distribución de las moléculas según sus velocidades no teníamos en cuenta los choques entre las moléculas, a pesar de que los choques no pueden dejar de influenciar en las velocidades de las moléculas y, por lo tanto, también sobre su distribución según las velocidades. Precisamente debido a los choques se establece la distribución de Maxwell según las velocidades. En efecto, supongamos que el gas se encuentra en tal estado en que todas las moléculas tienen las mismas (en módulo) velocidades. Tal estado no puede ser estable (equilibrado), porque los choques entre las moléculas, indiscutiblemente, conducirán a que las velocidades de las moléculas dejen de ser iguales. En cada choque entre las moléculas aumenta la velocidad de una de ellas y disminuye la velocidad de la otra. Y, precisamente, Maxwell llamó la atención sobre el hecho de que debía existir tal estado, durante el cual el número de moléculas, cuyas velocidades aumentan al chocar, es igual al número de moléculas para las cuales disminuye la velocidad a consecuencia de los choques. Tal estado es el de equilibrio. Precisamente a este estado corresponde la distribución de Maxwell según las velocidades. Después Boltzmann demostró que si un gas se encuentra en el estado, para el cual las moléculas están distribuidas por sus velocidades no según Maxwell, entonces tal el gas, debido a los choques de las moléculas pasa por sí mismo al estado con la distribución de Maxwell. La distribución de Maxwell (algunas veces la llama: distribución Maxwell – Boltzmann) es la distribución equilibrada. Con esto empezamos nuestro análisis. Por eso, por ejemplo, al deducir la fórmula (12.4) no nos era necesario tener en cuenta los choques. En efecto, si algunas moléculas que dejaron la capa de ∆z0 no alcanzaron la capa ∆z debido a los choques, sin embargo, otras moléculas, que no debieron caer en ella, llegaron a ella como resultado de los choques. Los movimientos moleculares realizados en el gas, siempre los llamábamos caóticos. Ahora podemos dar una definición exacta sobre el concepto caótico de los movimientos térmicos: el movimiento de las moléculas es completamente desordenado (caótico) si las velocidades de las moléculas están distribuidas según la ley de Maxwell. Tales movimientos completamente caóticos los realizan las moléculas cuando el gas se encuentra en estado de equilibrio. Como vimos en el §3, este estado se caracteriza por la magnitud de la temperatura, que a su vez se determina por la energía cinética media del movimientote las moléculas. De aquí se deduce que la temperatura se determina por la energía cinética media, precisamente, de los movimientos caóticos. Cualquier movimiento dirigido de las moléculas, cualesquiera que fuesen velocidades en tal movimiento, no tiene ninguna relación con la temperatura. Por muy grande que sea la velocidad del aire que forma un viento fuerte ella no lo hace más caliente. Los vientos, incluso los más fuertes, pueden ser fríos y 43 calientes, porque la temperatura del gas no se determina por la velocidad dirigida del viento, sino por los movimientos caóticos, que las moléculas realizan al mismo tiempo que el movimiento dirigido del gas como un todo e independiente de él. 1.12.VELOCIDADES MEDIAS DE LAS MOLECULAS Utilizando la función de distribución de Maxwell se puede calcular una serie de magnitudes importantes de la Física Molecular. Señalemos aquí, en calidad de ejemplos, los cálculos de la velocidad media aritmética v, la velocidad cuadrática media − · 2 0 v v que ya calculamos anteriormente (véase la pág. 45) y por último, la velocidad más probable vmp. Empecemos por la velocidad media aritmética de la s moléculas. La velocidad media aritmética v es por definición igual a la relación entre la suma de todas las velocidades de toas las moléculas de la unidad de volumen y el número de moléculas que hay en la unidad de volumen. El número de moléculas en la unidad de volumen, cuyas velocidades están comprendidas en el intervalo de v a v+ dv, evidentemente, es igual a n f(v) dv. La suma de las velocidades de tales moléculas es igual a vn f (v) dv. Para hallar la suma de las velocidades hay que integrar esta función por todas las velocidades posibles de cero al infinito. Por consiguiente, la suma de todas las velocidades es igual y la velocidad media aritmética v es igual a (14.1) Poniendo aquí la expresión (13.3) obtenida anteriormente para f(v) obtenemos: (14.2) Para calcular la integral que figura en esta expresión, transformemos la expresión subintegral: Ya que v dv = 1/2d (v2), entonces y 44 ( ) , 0 ∫ ∞ dv v vnf ( ) ( ) ∫ ∫ ∞ ∞ − · · 0 0 . 1 dv v vf dv v vnf n v ∫ ∞ − − , ` . | · 0 2 3 2 3 2 2 4 dv e v kT m v kT mv π vdv e v dv e v kT mv kT mv 2 2 2 3 2 2 − − · ( ) 2 2 2 2 3 2 2 2 1 v d e v dv e v kT mv kT mv − − · ( ) ∫ ∞ − − , ` . | · 0 2 2 2 2 3 . 2 1 . 2 4 2 v d e v kT m v kT mv π Introduciendo por partes nos da: Por lo tanto, para la integral de la fórmula (14.2) obtenemos la expresión: Poniéndola en (14.2) hallamos para v la expresión: (14.3) De un modo semejante se puede también calcular el valor medio aritmético de la componente de velocidad sobre cualquier eje coordinado. Propiamente hablando, el valor medio de cualquier componente de la velocidad es igual a cero, ya que ella puede ser con la misma probabilidad positiva, o negativa. Pero esto no se puede decir sobre el valor medio del módulo de tal componente. Hallemos, por ejemplo, el valor aritmético medio del módulo de la componente x de la velocidad, es decir, la magnitud |vx|. Para ella se puede escribir la ecuación, análoga a (14.1): (14.4) Aquí f (vx) es la función de distribución de las moléculas según la componente vx, que hallamos anteriormente: Poniendo esta expresión en (14.4) obtenemos: 45 ∫ ∞ − · 0 1 dz ze z ∫ ∞ − , ` . | · 0 2 2 3 2 2 m kT dv e v kT mv m kT m kT kT m v 8 2 . 2 4 2 2 3 · , ` . | , ` . | · − π ( ) ∫ ∞ ∞ − − · . x x x x dv v f v v ( ) kT mv x e kT m n v f 2 2 1 2 2 1 − , ` . | · ∫ ∞ ∞ − − − , ` . | · . 2 1 2 2 1 2 x kT mv x x dv e v kT m n v x La integral que figura en esta fórmula se resuelva con la ayuda de la sustitución de variable mv 2 x/2kT≡z 2 . Entonces para |vx| se obtiene la expresión: (14.5) Esta expresión permite resolver la tarea interesante sobre el número medio de golpes de las moléculas sobre la unidad de superficie de la pared de la vasija en la unidad de tiempo. En el § 2 (pág. 26) vimos que en el número de moléculas que atraviesan la superficie con un área S en el tiempo ∆t es igual a 1/2nvx S ∆t. De aquí se deduce que en la unidad de superficie en la unidad de tiempo caen 1/2nvx moléculas. Sustituyendo aquí vx por su valor medio |vx| obtenemos que el número medio de golpes v de las moléculas contra la unidad de superficie en la unidad de tiempo es igual a: Velocidad media cuadrática de las moléculas. Para hallar la velocidad media cuadrática 2 − v de las moléculas es necesario calcular la relación entre la suma de los cuadrados de las velocidades de las moléculas de la unidad de volumen y el número de moléculas en este volumen. Repitiendo los razonamientos anteriores obtenemos: Poniendo aquí la expresión (13.3) de f (v) obtenemos: Por medio de la integración por partes hallamos la integral que entra aquí y obtenemos: (14.6) Tal expresión también la obtuvimos anteriormente. 1.13.VELOCIDAD MÁS PROBABLE DE LAS MOLECULAS. 46 . 2 m kT v x π · − . 4 2 1 − − − · · v n v n v x x ( ) ∫ ∞ − · 0 2 2 . dv v f v v ∫ ∞ − − , ` . | · 0 2 4 2 3 2 . 2 4 2 dv e v kT m v kT mv x π ∫ ∞ − , ` . | · 0 2 5 2 4 2 8 3 2 π m kT dv e v kT mv x Calculemos ahora la velocidad vmp más probable de las moléculas, alrededor de la cual se agrupan las velocidades del mayor número de moléculas de un gas. Esta velocidad corresponde al máximo de la curva de distribución de Maxwell (véase la fig. 14). Por eso, para hallar la velocidad vmp , es necesarioigualar a cero la derivada de la unión de distribución (13.3): Esta igualdad se cumplirá si Realizando la diferenciación obtenemos: Esta igualdad se cumple bien para v=0, bien para v=∞, o bien con la condición de que 1-(mv 2 mp /2kT)=0. Es claro, que las dos primeras condiciones no corresponden al máximo de la curva de la distribución. Por consiguiente, el valor vmp se determina de la condición: de donde Comparando las expresiones (14.3), (14.6) y (15.1), hallamos la relación entre las velocidades calculadas: Como se ve la diferencia entre estos tres valores no es muy grande: las velocidades media aritmética y media cuadrática son próximas a la velocidad más probable. 1.14. FOMULAS DE MAXWELL PARA LAS VELOCIDADES RELATIVAS Para resolver muchas tareas es cómodo utilizar la fórmula de Maxwell en la forma que se obtiene, si se expresan las velocidades de las moléculas no en las unidades 47 ( ) ] ] ] ] , ` . | · − kT mv e v kT m dv d v f dv d 2 2 2 3 2 2 4 π 0 2 2 2 · , ` . | − kT mv e v dv d 0 2 1 2 2 2 2 · , ` . | − − kT mv e v kT mv , 0 2 1 2 · − kT mv mp m kT v mp 2 · mp mp v v v v v 22 . 1 2 3 09 . 1 8 3 · · · · π corrientes sino relativas, tomando por unidad de velocidad la velocidad más probable vmp de las moléculas. La velocidad relativa u, por consiguiente, será igual a Aquí v es la velocidad dada las moléculas y Vmp es la velocidad más probables para la temperatura dada. Como acabamos de aclarar. En la fórmula de Maxwell figura dos veces la expresión m/2kT. Sustituyendo en ella esta expresión por su igual 1/v 2 mp y designando v/vmp por la letra u, se le puede dar a la ecuación de Maxwell la forma siguiente: (16.1) Esta ecuación es universal. En esta forma la función de distribución no depende ni del género de gas ni de la temperatura. Semejante ecuación también se puede escribir para la función de distribución de las moléculas según las componentes de velocidad sobre los ejes coordinados. Si se trata, por ejemplo, de la componente x de la velocidad, entonces, introduciendo también aquí la velocidad relativa ux = vx / vmp se puede representar la función de distribución (12.5)en la forma (16.2) Para resolver distintas tareas ligadas con la distribución de las moléculas según sus velocidades es cómodo utilizar las fórmulas de distribución, precisamente, en la forma (16.1) y (16.2). En la fig. 19 está representada la curva de distribución para las velocidades relativas. Las funciones Y 48 mp v v u · kT mv e v kT m dnv d 2 2 2 3 2 2 4 − , ` . | · π 2 2 4 u e ndu d u − · π 2 1 x u x e ndu du − · π 2 2 4 u e u − π 2 1 x u e − π Pueden ser calculadas de antemano para los diferentes valores u y ux y representadas en forma de gráficos, a partir de los cuales se pueden determinar las magnitudes buscadas. En la tabla 1 están expuestos los valores de estas funciones, calculados con una exactitud suficiente para resolver muchas tareas. Supongamos, por ejemplo, que se exige hallar la parte de moléculas de nitrógeno cuyas velocidades están comprendidas entre 275 y 276 m/s para la temperatura ambiente (300k). Ante todo hallamos la velocidad más probable: La velocidad relativa u será igual a: De la expresión u = v / vmp. En el caso dado, el intervalo de velocidad igual a 1 m/s, es suficientemente pequeño para considerar que du = ∆ v/ vmp = 0.0025. Según el gráfico, que puede construir cualquiera con los datos de la tabla 1, hallamos que la velocidad realtiva u = 0.70 al valor de la función De aquí Es decir, sólo 0.17% de todas las moléculas poseen velocidades que descansan dentro del intervalo de velocidades, indicado en la tarea. u, ux ( ) 2 2 4 u e u u f − · π ( ) 2 1 x u x e u f − · π u, ux ( ) 2 2 4 u e u u f − · π ( ) 2 1 x u x e u f − · π 0.1 0.022 0.558 1.2 0.770 0.133 0.2 0.087 0.524 1.3 0.703 0.104 0.3 0.185 0.515 1.4 0.623 0.079 0.4 0.308 0.480 1.5 0.535 0.059 49 s m RT m kT v mp / 394 28 10 . 3 . 10 . 31 , 8 . 2 2 2 2 3 ≈ · · · µ 70 . 0 394 275 ≈ · · mp v v u . 677 . 0 4 2 2 · · −u e u ndu dn π 3 10 . 7 , 1 0025 , 0 . 677 , 0 − · · n dn 0.5 0.439 0.439 1.6 0.477 0.044 0.6 0.567 0.393 1.7 0.362 0.031 0.7 0.677 0.345 1.8 0.286 0.022 0.8 0.761 0.297 2.0 0.165 0.010 0.9 0.813 0.251 2.2 0.086 0.004 1.0 0.830 0.208 2.4 0.041 0.002 1.1 0.814 0.168 3.0 0.003 - Una de las tareas interesantes, creadas por la distribución de las moléculas según sus velocidades es la determinación de la parte de moléculas, cuyas velocidades superan a la dada. Para resolver tales tareas también es cómodo utilizar la fórmula de Maxwell para las velocidades relativas, es decir, la fórmula Está claro que si es necesario hallar la parte de moléculas, cuyas velocidades superan a un valor dado determinado v, y por lo tanto determinado u, entonces es necesario integrar la ecuación entre los límites desde el u dado hasta el infinito, de modo que Donde n>u es el número de moléculas, cuyas velocidades relativas son mayores que la u dada. Por consiguiente, la solución de la tarea se reduce al cálculo de la integral que figura aquí. En la tabla 2 están expuestos sus valores para distintos valores de u. En la tabla se ve que el número de moléculas, cuyas velocidades superan a la más probable, es decir, las moléculas con v>vmp alcanzarán el 57.24% de todas las moléculas del gas, o sea, más de la mitad. Esto significa que la curva de distribución de Maxwell no es simétrica con relación al máximo, lo que se ve claramente de los gráicos representados anteriormente (véase las figs. 14, 18, 19). u dz e z z u 2 2 4 − ∞ ∫ π u dz e z z u 2 2 4 − ∞ ∫ π u dz e z z u 2 2 4 − ∞ ∫ π 0.1 0.9992 0.8 0.7340 1.5 0.2123 0.2 0.9941 0.9 0.6550 1.6 0.1632 50 du e u ndu dn u 2 2 4 − · π ∫ ∞ − > · u z u dz e z n n 2 2 4 π 0.3 0.9807 1.0 0.5724 1.7 0.1230 0.4 0.9582 1.1 0.4900 1.8 0.0905 0.5 0.9190 1.2 0.4105 1.9 0.0602 0.6 0.8685 1.3 0.3370 2.0 0.0460 0.7 0.8061 1.4 0.2702 2. TEORÍA CINÉTICA DEL CALOR. LEY DE CONSERVACIÓN DE LA ENERGÍA. 2.1. ENERGÍA INTERNA DEL GAS IDEAL Se sabe que la energía media de la molécula del gas ideal, si consideramos a sus partículas como puntos, se determina por la expresión: kT mv 2 3 2 2 · Es necesario señalar otra vez, que esta expresión es justa para las moléculas consideradas como puntos, capaces de realizar solamente movimiento de translación. Tal representación del gas se puede justa para los gases monoatómicos. Si la molécula del gas contiene no uno, sino varios átomos, entonces puede realizar también otras formas de movimiento, giratorio y oscilatorio, con los cuales también está ligada una determinada energía. Sin embargo, limitémonos por ahora sólo al caso de los gases monoatómicos y escribamos la expresión para la energía de todas las moléculas de la masa dada de gas. Si el gas contiene N moléculas, entonces su energía total U será igual a: NkT U 2 3 · (20.1) 51 Para una mol esta expresión toma la forma: RT kT N U 2 3 2 3 0 · · (20.2) Esta energía se llama energía interna del gas ideal. Energía interna de un cuerpo se llama en general a la energía total que se refiere a las mismas moléculas, es decir, su energía “invisible”. Aquí entra la energía cinética del movimiento de las mismas moléculas, la energía cinética del movimiento de los átomos dentro de la molécula (si la molécula no es monoatómica), la energía potencial de interacción de los átomos dentro de la molécula e incluso la energía cinética de las partículas que entran en la composición de los átomos (núcleos y electrones). En ella no se incluye, sin embargo, la energía cinética que el gas puede poseer, si él se mueve como un cuerpo entero, y la energía potencial que puede poseer si se encuentra en un campo de fuerzas cualesquiera. La energía interna de una masa dada de gas ideal depende, como se ve de las fórmulas (20.1) y (20.2), solo de la temperatura y no depende ni de la presión, ni del volumen del gas. (Para los gases reales esto no es cierto). De las fórmulas expuestas se ve que para cambiar la temperatura de un gas, es necesario cambiar su energía interna. Como se sabe de la Mecánica, el cambio de energía está ligado al trabajo: la energía del cuerpo varía si el cuerpo realiza un trabajo o si se realiza un trabajo sobre él, y este cambio es, precisamente, igual al trabajo realizado. De aquí, al parecer, resulta que el cambio de la temperatura del gas, o en general de cualquier cuerpo se puede conseguir sólo gracias al trabajo mecánico: para calentar un cuerpo es necesario realizar un trabajo sobre él, y para enfriarlo es necesario crear tales condiciones, para las cuales él mismo pudiese realizar un trabajo. La experiencia muestra, en efecto, que se puede cambiar la temperatura de un cuerpo por medio de un gasto correspondiente de trabajo mecánico. Así por ejemplo, los cuerpos se calientan con el rozamiento de uno con otro (en esto está basado el medio antiquísimo de obtener fuego). Como se mostrará más adelante, el gas también puede calentarse a cuenta del trabajo realizado. 2.2. CANTIDAD DE CALOR Se sabe, sin embargo, que un gas, como cualquier otro cuerpo, se puede calentar o enfriar con otro método durante el cual el trabajo no juega ningún papel a primera vista. Este método consiste en que el cuerpo se pone en contacto con otro cuerpo que tiene una temperatura diferente a la suya propia. Se puede conseguir el mismo resultado sin el contacto directo, cuando dos cuerpos con diferentes temperaturas están separados por cualquier medio o incluso por el vacío. En el primer caso se dice que el calentamiento o enfriamiento se realiza por medio de la conductibilidad térmica, en el segundo caso, por medio de la irradiación. Pero de la fórmula (20.1) se deduce que el cambio de temperatura de un gas siempre está ligado con el cambio de energía. Cuando el cambio se realiza como resultado de un gasto de trabajo, la causa del cambio está clara, ya que el trabajo es un cambio de energía. Es decir, en el método por contacto de una forma determinada se realiza la entrada ( al calentarse) o a la salida (al enfriarse) de energía. 52 El mecanismo de transmisión de energía en el método por contacto consiste en que las partículas de los cuerpos en contacto, durante los choques entre sí, se cambia su energía de modo que las partículas del cuerpo más caliente pierden energía, entregándola a las partículas del cuerpo menos caliente. Es decir, en este caso, en lugar de un cambio de energía a cuenta de trabajo gastado, se consigue el mismo resultado por medio de la transmisión de la energía de las partículas en movimiento caótico de un cuerpo, a las partículas del otro cuerpo. Sin embargo, debido a una serie de circunstancias, ligadas a la historia del desarrollo de la Física, en el caso cuando el cambio de temperatura del cuerpo (calentamiento o enfriamiento) se realiza por este método (“por contacto” o por irradiación), dicen que al cuerpo se le entrega o se le extrae una determinada cantidad de calor. Es decir, la cantidad de calor representa en sí la energía que se transmite de un cuerpo a otro durante su contacto (directamente, o a través de un tercer cuerpo) o por medio de irradiación. En realidad, durante la transmisión de calor también tenemos relación con el trabajo, pero en este caso el trabajo lo realizan no los cuerpos macroscópicos en movimiento ordenado, sino las micropartículas en movimiento desordenado. Como veremos más adelante, esta circunstancia juega un papel muy importante. 2.3. EQUIVALENTE MECÁNICO DEL CALOR No existe ninguna otra diferencia entre el calor y el trabajo(energía). Por eso, deben medirse en unas mismas unidades. En el sistema SI como unidad de cantidad de calor se toma 1 julio (J). Pero, por causas históricas, hasta el último tiempo, la cantidad de calor se medía en calorías y kilocalorías. Ya en los tiempos “antecinéticos”, fue introducida una unidad especial para la cantidad de calor, cuando consideraban el calor como una sustancia especial, semejante a un líquido determinado capaz de fluir de un cuerpo a otro. Ahora, cuando ya está clara la equivalencia de energía y calor, esta unidad ha perdido su sentido físico particular, pero se conserva todavía en la Física y la Técnica por tradición. La kilocaloría se determina como la cantidad de calor, cuya entrega (o extracción) origina el calentamiento (o enfriamiento correspondiente) de un kilogramo de agua en un grado Kelvin a la presión atmosférica. La equivalencia entre el calor y la energía fue demostrada de una forma clarividente ya en el siglo pasado en la década del 50, por J. Joule, mostrando en una serie de experimentos escrupulosos, que el calentamiento originado por una kilocaloría es el mismo que el que da siempre un mismo trabajo determinado. Resultó, precisamente, que 1 kcal = 4186.8 J También se utiliza la unidad 1000 veces menor que la kilocaloría, o sea, la caloría – gramo, o simplemente, caloría (cal): 1 cal = 4.1868 J El número que indica la relación de la unidad mecánica a la unidad de calor, se llama equivalente mecánico de calor: 53 I = 4186.8 J / kcal = 4.1868 J / cal La magnitud inversa se llama equivalente térmico del trabajo mecánico: I’ = 2.39 E 10 -4 kcal / J = 0.239 cal / J En la exposición sucesiva, no utilizaremos estos equivalentes. En los casos, cuando en una misma ecuación figuren la cantidad de calor y el trabajo o energía, consideraremos que ellos se miden en unas mismas unidades (en calorías o julios, indiferentemente). 2.4. PRIMER PRINCIPIO DE LA TERMODINÁMICA El cambio de estado de cualquier cuerpo o sistema de cuerpos, en general, va acompañado de un trabajo realizado por este sistema, o por un trabajo realizado sobre él por las fuerzas externas. Este trabajo puede ser expresado por los parámetros que determinan el estado del sistema. Si el estado de un cuerpo se determina, como ya sabemos, por dos de los tres parámetros p, V y T, entonces, en caso general, el cambio de cualquiera de ellos deberá acompañarse con un trabajo externo. Así, por ejemplo, el cambio de temperatura de un gas, es decir, el calentamiento o enfriamiento, se puede realizar como resultado de un gasto de trabajo mecánico externo (calentamiento), o a cuenta del trabajo realizado contra las fuerzas externas (enfriamiento). Este trabajo mecánico se realiza al comprimir el gas con una fuerza externa cuando el gas se calienta, o al dilatar el gas cuando el mismo realiza un trabajo, enfriándose con ello. El cambio de volumen del gas también puede realizarse sin cambiar su temperatura, entonces se exige correspondientemente un trabajo menor. Pero como fue indicado, el estado de un gas ( o de otros cuerpos) se puede cambiar, comunicándole o, al revés, quitándole una cantidad determinada de calor, es decir, poniéndolo en contacto con un cuerpo más caliente o más frío que él. ¿Qué trabajo se realizará cambiar el estado por este método? La ley de la conservación de la a energía da contestación a esta pregunta. Si se le comunica a un gas ( o a otro cuerpo cualquiera) una cantidad determinada de calor dQ se realiza en general un trabajo dA y se cambia su energía interna en dU . La ley de conservación de la energía dice así: el trabajo, realizado por el sistema, es igual a la diferencia entre la cantidad de calor, comunicado al sistema, y el cambio de su energía interna dU dQ dA − · o dA dU dQ + · (23.1) 54 Esta ecuación expresa la ley más importante de la naturaleza, la ley de conservación de la energía aplicable a la energía mecánica y térmica. Esta ley recibió el nombre de primer principio de la Termodinámica. Trabajo, al cambiar el volumen del gas. No es difícil calcula el trabajo, ligado a la dilatación o comprensión de un gas, es decir, al cambio de su volumen. Supongamos que el gas se encuentra en un cilindro, cerrado con un émbolo móvil de superficie S (Fig. 31). Supongamos que el émbolo desciende en un distancia dx , bajo la acción de una fuerza externa F, comprimiendo el gas. El gas continuará comprimiéndose hasta que la fuerza F se equilibre con la fuerza que actúa sobre el émbolo por parte del gas e igual a pS , donde p es la presión del gas. El trabajo dA, gastado en el desplazamiento del émbolo en la distancia dx , es, evidente, igual a pS dx . Pero Sdx no es otra cosa, que el cambio de volumen del gas dV durante la compresión, es decir, Sdx = - dV de donde dA= - p dV (23.2) Por el contrario, durante la dilatación del gas, es decir, al aumentar el volumen del gas en dV , el mismo gas realiza un trabajo contra las fuerzas externas igual a + p dV . El cambio de volumen del gas va acompañado de un trabajo igual al producto de la presión bajo la cual se encuentra el gas, por su cambio de volumen. La fórmula (23.2) es cierta no solo para los gases, sino para cualquier cuerpo. Si al cambiar el estado de un cuerpo se realiza un trabajo sólo a cuenta del cambio de volumen, entonces se puede escribir el primer principio de la Termodinámica en la forma siguiente: dV p dU dQ . + · (23.3) Son posibles los casos, cuando el cambio de estado de los cuerpos va acompañado de cambios eléctricos, magnéticos o de otros parámetros, entonces, a la parte derecha de la ecuación (23.3) se le debe añadir los sumandos correspondientes: energía eléctrica, magnética u otras formas de energía. Aquí, nos limitamos solo al examen de los cambios de los parámetros p y V. También se puede calcular el trabajo exterior en el caso, cuando el cambio de los parámetros de estado no es infinitamente pequeño. Si un cuerpo pasa del estado 1 al estado 2, entonces, el trabajo A ligado a esto se determina por medio de la integración de la ecuación (23.2): ∫ ∫ · · 2 1 2 1 .dV p dA A Esta integral se puede determinar gráficamente. En efecto, como fue indicado, el estado de un cuerpo se caracteriza con un punto en la curva I en la Fig. 32, entonces ∫ 2 1 .dV p es igual a la superficie rayada por debajo de la curva. 55 Si el paso desde el estado 1 al estado 2 se realiza de tal modo que el cambio de la presión con el volumen se representa con la curva II entonces el trabajo ligado a este paso será otro. El trabajo exterior, realizado por un cuerpo (o sobre él), al cambiar su volumen depende de la sucesión de estados, que pasa el cuerpo desde el estado inicial hasta el final. En relación a la energía interna U se puede decir que depende sólo del estado del cuerpo, y su cambio no depende de los estados intermedios, en los que se encontraba el cuerpo. Por eso la ecuación (23.3) se puede escribir en la forma: ∫ ∫ + − · 2 1 2 1 2 1 .dv p U U dQ donde U1 y U2 son los valores de la energía interna del cuerpo en los estados correspondientes 1 y 2. En caso particular, si el cuerpo, como resultado de todos los cambios de estado, volvió al estado inicial, es decir U1 = U2 , en este caso se dice que el proceso de cambio de estado es circular o cíclico. Tal proceso se representa gráficamente por una curva cerrada (Fig. 33) y el trabajo realizado (o gastado) en este caso se determina por la superficie rayada. Es evidente, que si el trabajo ∫ · dV p A . , de un ciclo es positivo, es decir, si el cuerpo mismo realizó un trabajo contra las fuerzas externas, esto significa, que el cuerpo recibió del exterior una misma cantidad de calor Q. Si este trabajo A de un ciclo es negativo, es decir, si fue realizado sobre el cuerpo un trabajo por la fuerzas exteriores, con esto se desprendió una cantidad de calor Q igual al trabajo. De tal modo, durante el proceso cíclico Q = A No debemos extrañarnos de la forma “no corriente” de la curva p = f (v) en las Figs. 32 y 33 cuando crece la presión en algunos de sus tramos al aumentar el volumen. La función “corriente” en donde la presión es inversamente proporcional al volumen del gas, se observa solo para una temperatura constante, es decir, para un proceso isotérmico. El proceso que hemos examinado del cambio de volumen del gas, se refiere al caso, cuando el gas se le comunica o se le quita una determinada cantidad de calor y sobre él se realiza (o el mismo realiza) un trabajo, y durante los diferentes estadios del cambio de volumen la temperatura del gas es diferente. No hay nada de extraño en que al mismo tiempo que se dilata (elevación de émbolo) el gas pueda elevar tanto su temperatura, a cuenta de la fuente de calor, que 56 se eleve su presión a pesar del aumento de volumen (y al contrario, al comprimirse, el gas puede dar calor a un cuerpo más frío y bajar su presión). Esto explica la circunstancia de que al pasar de un mismo estado inicial (p1V1) a un mismo estado final (p2V2), pero por distintos estados intermedios, se obtiene un trabajo diferente, y por consecuencia, en un proceso circular no será igual a cero. Sobre esto está basado el trabajo de las máquinas térmicas (de los motores). Resulta innecesario subrayar que un cuerpo no podrá realizar ni un trabajo positivo, si durante todo el proceso circular la temperatura del cuerpo es invariable (es decir, si el proceso es isotérmico). En un gas, evidentemente, es imposible tal circular isotérmico en general, ya que si el cambio de presión en el volumen se realiza a lo largo de la isoterma, entonces se puede volver al estado inicial solo a lo largo de esta misma isoterma, pero tal proceso no se puede llamar circular en el sentido citado anteriormente. Procesos cuasiestáticos. Al deducir la ecuación (23.2) para el trabajo de un gas, ligado al cambio de su volumen, suponíamos, que durante todo el proceso del cambio de volumen la presión, en cada momento de tiempo, era igual en todos los puntos del gas. En caso contrario, el valor de la presión p hubiese sido completamente indeterminado. Entre tanto, asegurar tal constancia de presión en todo el volumen del gas ( como en cualquier otro cuerpo), durante el proceso de su dilatación o compresión, no es fácil en general. Si la dilatación o compresión de un gas se realiza rápidamente, entonces la presión no tiene tiempo de igualarse en todas su diferente partes. Bajo la acción de la diferencia de presiones se origina un flujo de gas con diferentes velocidades en distintos puntos y, en particular, también flujos turbulentos. Para la creación de estos movimiento se exige un trabajo determinado. Además, en las distintas partes del gas se pueden tener diferentes temperaturas y densidades. En una palabra, con el cambio rápido de volumen, el gas no se encuentra en estado de equilibrio. Para que el gas se encuentre en equilibrio, durante el proceso de su cambio de volumen (o de otra magnitud que caracterice el estado), es necesario que el desarrollo de este proceso sea muy lento, en el límite, infinitamente lento. En este caso, todas las desviaciones del equilibrio tendrían tiempo de desaparecer, y el gas pasará a través de una serie de estados de equilibrio que se transforman uno en otro. Tales procesos se llaman cuasiestáticos porque durante ellos, en cada momento de tiempo determinado, el estado del gas se diferencia muy poco del estado estático, durante el cual son iguales los parámetros de estado en todo el volumen. Esta claro, que solo los procesos cuasiestáticos se pueden representar gráficamente en forma de curvas semejantes a las expuestas en la Fig. 32. Es imposible representar un proceso que no sea cuasiestático. La ecuación (23.2) y sus consecuencias se pueden utilizar solo para los procesos cuasiestáticos. Si el proceso del cambio de volumen, es decir la compresión o dilatación del gas se realiza no cuasiestáticamente, entonces el trabajo realizado durante la compresión o dilatación será menor que durante el proceso cuasiestático. Esto se puede comprender de las consideraciones siguientes. Imaginémonos que el gas, en el cilindro con émbolo (Fig. 31), se encuentra al comienzo en equilibrio, esto significa que la presión p del gas en el interior de la vasija es igual a la presión exterior. Supongamos que bajo la acción de unas u otras causas empieza a dilatarse el gas( no 57 cuasiestáticamente), es decir, empieza a desplazarse el émbolo hacia arriba. Es evidente que la presión exterior p1 se ha hecho menor que la presión p de equilibrio y, por consiguiente, que el trabajo exterior es p1 dV < p dV Correspondientemente, durante la compresión no cuasiestática del gas, la presión exterior p1 es mayor que la de equilibrio y por eso el trabajo (en este caso negativo) es -p1 dV < -p dV Y solo durante el proceso cuasiestático la presión exterior se diferencia infinitamente poco de la de equilibrio y, por consiguiente, en este caso se realiza el máximo trabajo. Además, el gas puede dilatarse sin realizar en general ningún trabajo exterior. Este caso se puede realizar uniendo dos vasijas una con otra, una de las cuales está llena de gas y la otra vacía. Entonces, el gas fluye desde la primera vasija a la segunda y ocupa, por consiguiente, mayor volumen. Pero con ello no se realizará ningún trabajo exterior (ya que no existen ningunas fuerzas externas, contra las cuales se podría realizar este trabajo). Este proceso se llama proceso de dilatación en el vacío. Y en efecto, durante todo este proceso el gas no se encuentra en equilibrio (por muy lento que transcurra). 2.5. CAPACIDAD CALORÍFICA DE LOS GASES IDEALES Determinemos ahora la cantidad de calor que es necesario comunicar a un gas ideal para su calentamiento o que hay que quitarle para su enfriamiento. De lo dicho en el párrafo anterior, está claro, que la cantidad de calor necesaria para el cambio de la temperatura del gas, depende de si se realiza trabajo con ello, es decir, si con ello cambia el volumen del gas. Si el gas que se calienta (o se enfría) está comprendido en un vasija cerrada por todas partes, cuyo volumen no puede cambiarse (aquí despreciamos la dilatación térmica del material de la vasija), entonces el calor dQ que se le transmite, se gasta exclusivamente en el cambio de su energía interna. Durante el calentamiento, la presión del gas crecerá según la ley que ya conocemos. Si el gas se encuentra en una vasija, semejante a la representada en la Fig. 31, entonces se dilatará realizando el trabajo de dilatación del émbolo, conservando con ello la presión constante. En este caso el calor recibido se determina por la ecuación (23.3): dQ = dU + p dV Está claro, que cuando se conserva constante la presión del gas, se exige mayor cantidad de calor. La cantidad de calor necesaria para calentar el gas depende de la cantidad de gas que se caliente y en cuántos grados debe cambiarse su temperatura. Cuanto mayores son estas magnitudes tanto mayor es la cantidad de calor que se necesita. Por eso, para la característica de las propiedades térmicas de un gas, como de cualquier otro cuerpo se utiliza una magnitud especial, la capacidad calorífica. 58 Se llama capacidad calorífica de un cuerpo a la cantidad de calor que es necesario comunicarle o quitarle para que cambie su temperatura en un grado Kelvin. La capacidad calorífica referida a la unidad de mas de substancia se llama calor específico. El caracteriza ya no al cuerpo, sino a la sustancia de que está compuesto el cuerpo. La capacidad calorífica referida a un mol de sustancia se llama calor molar. Lo mismo que el calor específico es una característica de la sustancia. De la definición de capacidad calorífica, queda claro que la capacidad calorífica de un cuerpo se expresa en J/K. De acuerdo a esto el calor específico se mide en J/Kg K, y el molar en J/ mol K. Si la cantidad de calor se mide en calorías, entonces el calor específico se mide en cal/g K, y el molar en cal/mol K. Es evidente que 1 cal/g K = 4186.8 J/kg K 1 cal/mol K = 4.1868 J/mol K Entre el calor específico que designaremos por c, y el molar C existe la relación evidente µ C c · Donde µ es el peso molar de la substancia (numéricamente igual a la masa de un mol). Si calentamos un mol de sustancia no en 1 grado, sino en dT grado, entonces el calor, gastado en esto, es igual a dQ = C dT de donde dT dQ C · (24.1) Supongamos que el calentamiento se realiza en condiciones, cuando queda constante el volumen (V= const.). El calor molar correspondiente se llama calor específico a volumen constante o calor isocórico (equivolumétrico)) 1 y se designa por Cv v v dT dQ C , ` . | · (24.2) Ya que el calor se gasta con ello en el cambio de la energía interna dU, entonces dQ = dU y v v dT dU C , ` . | · (24.3) De donde dU = Cv dT. La ecuación de la ley de conservación de la energía (23.3) ahora se puede escribir en la forma: 1 El término equivolumétrico es equivalente al término isocórico. (N del T) 59 dQ = Cv dT + p dV (24.4) Por consiguiente, el calor aportado al cuerpo se gasta en el cambio de temperatura dT (cambio de energía interna) y en el cambio del volumen dV (con esto está ligado el trabajo mecánico exterior). Si durante el calentamiento se observa la presión constante, entonces la capacidad calorífica se llama calor específico a presión constante Cp (también se puede llamar calor isobárico) p p dT dQ C , ` . | · utilizando los resultados de la teoría cinética de los gases, se puede calcular fácilmente los calores molares del gas ideal. 2.6. CAPACIDAD CALORÍFICA DE LOS GASES Y NÚMERO DE GRAOS DE LIBERTAD DE LAS MOLÉCULAS Para la comparación con los resultados de los cálculos teóricos de la capacidad calorífica, hemos elegido los datos experimentales que se refieren a los gases monoatómicos, es decir, aquellos gases cuyas moléculas se componen de un solo átomo. Y esto no es casual. Una de las suposiciones que constituyen la base de la teoría cinética, de la cual exactamente se deduce la teoría de la capacidad calorífica expuesta anteriormente, consiste en que podemos considerar las partículas del gas ideal como puntos o, por lo menos, como pequeñísimas bolitas. Los gases que más se aproximan a esta representación de los gases son precisamente los gases monoatómicos. La energía media de tal partícula se determina totalmente por la energía cinética media 2 2 v m de su movimiento de traslación. Esta energía se puede representar como la suma de tres sumandos : de las energías cinéticas del movimiento de la molécula según tres direcciones perpendiculares entre si: 2 2 2 2 2 2 2 2 z y x v m v m v m v m + + · donde vx, vy, vz son las componentes de la velocidad de la molécula según los tres ejes coordenados. El caos completo de los movimientos moleculares nos permite considerar que los valores medias de las energías cinéticas, según las tres direcciones, son iguales unos a otros 2 3 1 2 2 2 2 2 2 2 v m v m v m v m z y x · · · (26.1) Ya que de acuerdo a la ecuación fundamental de la teoría cinética kT v m 2 3 2 2 · 60 entonces cada uno de los tres sumandos de la igualdad (26.1) es igual a kT 2 1 . La descomposición de la energía cinética de la partícula en tres componentes independientes, esta ligada a que ella se considera como un punto material libre que posee tres grados de libertad. Recordemos que se llama numero de grados de libertad de un sistema mecánico al numero de coordenadas independientes que determinan su posición y configuración en el espacio. Es decir, a cada grado de libertad de la molécula monoatómica le corresponde una energía igual a kT / 2. Si existiese, por ejemplo, un gas hipotético tal, cuyas moléculas pudiesen moverse solo a lo largo de una línea determinada (gas de una dimensión), entonces, la energía cinética media de la molécula de tal gas sería igual a kT / 2. El calor molar a volumen constante de tal gas, sería igual no a 3/2 R, sino a ½ R. El gas de dos dimensiones es decir, el gas cuyas moléculas están limitadas en su movimiento por un plano determinado, poseería un calor específico Cv igual a 2/2 R = R 1 2.7. CAMBIO DEL ESTADO AL VARIAR EL VOLUMEN DEL GAS De la ecuación de la ley de conservación de la energía (24.4) pdV CvdT dQ + · se ve que el calor aportado al gas puede originar un cambio de temperatura del mismo (dT) y un cambio de volumen (dV). En los párrafos anteriores examinamos, desde el punto de vista energético, el proceso del cambio de temperatura del gas. Ahora llamamos la atención sobre la cuestión de la dilatación o compresión del gas ideal, es decir, sobre la cuestión del cambio de su estado al variar el volumen. Se mostró que la cantidad de calor, necesaria para el cambio de temperatura del gas, depende de las condiciones, en las cuales se realiza este cambio, de si se conserva durante el calentamiento invariable su volumen o su presión, es decir se se considera el cambio de temperatura isocoro o isobérico. La presión y dilatación del gas también pueden transcurrir en distintas condiciones y, de las condiciones del experimento depende el resultado enérgico del proceso, es decir, el trabajo realizado durante este proceso (porque el cambio del volumen del gas está relacionado precisamente con el trabajo). La comprensión y dilatación del gas se puede realizar de tal modo que su temperatura quede constante. Tal proceso se llama isotérmico. El se puede realizar colocando el gas en una vasija provista de un émbolo, conservando constante la temperatura de la vasija. Para esto se la coloca en un termostato, aparato dotado de cualquier fuente de energía (con horno eléctrico, soplete, etc.) Cuando hay un buen contacto del gas con el medio del termostato, se puede conseguir que cuando el gas segregue energía, disminuya la cantidad de calor suministrado por la fuente, y al absorber el gas energía, aumente el calor y con ello se asegure la temperatura constante. Un dispositivo especial, el termorregulador, mantiene automáticamente la temperatura constante en el termostato. 61 Si en estas condiciones trasladamos el émbolo hacia abajo con ayuda de una fuerza exterior (véase fig. 31), el gas se comprimirá, y la fuerza exterior realizará un trabajo. Por el contrario, durante la dilatación realiza un trabajo positivo la fuerza que presiona sobre el émbolo. El cambio de volumen también se puede realizar en condiciones, cuando el gas no se le transmite ni se le quita calor. Tal proceso se llama adiabático. A diferencia del proceso isotérmico, que exige un buen contacto con el medio del termostato, en el proceso adiabático se exige, por el contrario, un aislamiento térmico cuidadoso entre el gas y el medio ambiente. 2.8. TRABAJO DURANTE EL CAMBIO ISOTÉRMICO DEL VOLUMEN DEL GAS IDEAL Para determinar el trabajo durante el cambio isotérmico del volumen del gas, es necesario calcular la integral de acuerdo con la ecuación (23.2) ∫ ∫ · pdV dA a lo largo de la isotermia. No podemos sacar p fuera del signo integral, ya que la presión varía continuamente durante la dilatación. Pero la presión cambia con el cambio del volumen según la ley de Boyle-Mariotte, es decir, te cons RT pV tan · · , donde V RT p · . Poniendo esta expresión de p bajo el signo de integración, obtenemos para el trabajo A, durante el cambio del volumen de V1 a V2. ∫ ∫ · · · 2 1 2 1 1 2 ln V V V V V V RT V dV RT V dV RT A (29.1) Esta es la expresión del trabajo de dilatación isotérmica (o compresión) de 1mol de gas ideal. Si la masa del gas es igual no a 1mol entonces la fórmula (29.1) toma la forma: 1 2 ln V V RT M A µ · (29.2) donde M/µ es el número de moles. De las fórmulas (29.1) y (29.2) se ve que el trabajo de la dilatación isotérmica no depende de la diferencia de los volúmenes, entre los que se realiza la dilatación, sino de su relación. Lo mismo se refiere, naturalmente a la compresión. Ya que según la Ley de Boyle-Mariotte p1V1 = p2V2, entonces 2 1 1 2 p p V V · 62 Por eso, en las fórmulas (29.1) y (29.2), en lugar de la relación de los volúmenes se puede poner la relación inversa de las presiones. Entonces, 2 1 ln p p RT M A µ · Como ya se indicó anteriormente, durante la dilatación isotérmica el calor transmitido al gas se gasta sólo en la relación de trabajo exterior. Por el contrario, durante la compresión isotémica, el trabajo de las fuerzas externas pasa a aumentar la energía interna (calentamiento) de los cuerpos circundantes. Esto corresponde, formalmente, a que la capacidad calorífica del gas dT dQ es igual a ∞ (ya que dT = 0). 2.9. CAMBIO ADIABÉTICO DEL VOLUMEN DEL GAS IDEAL Durante el proceso adiabático el gas no entrega calor a los cuerpos circundantes, lo mismo que tampoco lo recibe del exterior dQ = 0. La ley de conservación de la energía, en este caso, toma la forma: dT C pdV v · − (30.1) Esto significa, que el trabajo, ligado al cambio de volumen del gas, deberá acompañarse con el cambio de la energía interna, y por lo tanto, de la temperatura. El signo menos de la expresión (30.1) significa que el aumento de volumen del gas (dilatación) va acompañado con la disminución de su temperatura, y con la compresión, con el aumento de la temperatura. En el primer caso el gas realiza un trabajo a cuenta de su propia energía interna, por eso desciende su temperatura. En el segundo caso, la fuerza exterior realiza el trabajo y, a cuenta de este trabajo, crece la energía interna, y por lo tanto aumenta la temperatura del gas. Nos podemos representar fácilmente el cuadro “cinético” de este cambio de temperatura. Imaginémonos una vasija en forma de cilindro con gas y con un émbolo (fig. 37). Supongamos que el émbolo asciende con una velocidad µ (el gas se dilata). Examinemos una molécula determinada, que se mueve con una velocidad ν en la misma dirección que el émbolo. Si la velocidad de esta molécula, que va “alcanzando” al émbolo en relación a las paredes de la vasija es igual a ν, entonces, en relación al émbolo, su velocidad será igual a ν → u. Después que nuestra molécula “alcanza” al émbolo y se realiza un choque elástico, su velocidad con relación al émbolo deberá quedarse como antes ν → u, a pesar de que ya se mueve no tras el émbolo, sino, al contrario. Esto significa que su velocidad en relación a las paredes de la vasija deberá ser menor que la anterior en la magnitud ν → 2u. De tal modo, todas las moléculas que chocan con el émbolo retroceden de él con una velocidad menor que antes del choque. Esto conduce a la disminución de la velocidad media de la molécula y, por lo tanto, a la disminución de la temperatura. 63 Ecuación de Poisson. Antes de calcular el trabajo del cambio adiabático del volumen del gas, es necesario hallar la relación entre el volumen del gas y su presión, ya que en el proceso adiabático ya no se determina por la ley de Boyle-Mariotte. Para ello es necesario de la ecuación. 0 · + pdV dT C v (30.2) excluir a T. Esto se puede hacer, utilizando la ecuación de estado RT pV · , cuya diferencia da: RdT Vdp pdV · + , de donde R Vdp pdV dT + · Poniendo este valor de dT en (30.2) obtenemos: 0 · + + pdV R Vdp pdV C v , O, después de cambiar R por su valor igual R C C v p · → , tenemos: 0 · + pdV C Vdp C p v Designemos la relación de los calores específicos por γ · v p C C , entonces, la última ecuación toma la forma: 0 · + V dV p dp γ . (30.3) Con la suposición de que γ es constante, se puede escribir: ∫ ∫ · + 0 V dV p dp γ Después de la integración, obtenemos: te cons V p tan ln ln · + γ , o bien te cons pV tan · γ (30.4) Esta es la relación buscada entre la presión y el volumen del gas ideal, durante el proceso adiabático del cambio de volumen. La ecuación (30.4) se llama Ecuación de Poisson, o ecuación de la adiabata, y la magnitud v p C C · γ exponente de la adiabata. 64 Al integrar (30.3) tomamos γ como constante. Rigurosamente hablando, esto no es completamente justo. El calor específico Cv y, por consiguiente, Cp y γ pueden cambiarse con el cambio de volumen, de la presión y de la temperatura. Por eso, la ecuación de Poisson (30.4) es rigurosamente justa, para un intervalo limitado de valores de presiones y volúmenes. La ecuación diferencial (30.3) es exacta. De la ecuación de Poisson se ve que a diferencia del proceso isotérmico, durante el cambio adiabético del volumen del gas, su presión cambia inversamente proporcional, no a la primera potencia del volumen, sino a V γ , siendo γ mayor que la unidad, ya que Cp > Cv. Está claro que el gráfico de la presión en función del volumen ahora ya no será una hipérbola. Ya que γ > 1, entonces la curva p = f (V) para el proceso adiabático, llamada adiabata 2 , está más inclinada que la isoterma, como se ve en la fig. 38 en donde está representada la adiabata y la isoterma del gas ideal para su comparación. El descenso más rápido de la presión con aumento de volumen, durante el proceso adiabético, se explica con que durante el proceso de dilatación adiabática del gas ideal, disminuye su presión, no solo a cuenta del aumento de volumen, sino a consecuencia del descenso de la temperatura que ocurre con ello. No es difícil hallar la relación entre los otros parámetros del gas para el proceso adiabético. Así por ejemplo, excluyendo la presión p de la ecuación, (30.4) y de la ecuación de estado pV = RT, obtenemos la relación entre la temperatura y el volumen del gas, durante el cambio adiabético. Poniendo en la ecuación (30.4) el valor V RT p · , obtenemos: const V V RT · γ o , 1 const TV · − γ (30.5) (ya que R es constante). Del mismo modo, colocando en la ecuación (30.4) el valor V de la ecuación de estado P RT V · , obtenemos la relación entre la presión y la temperatura, durante el proceso adiabético: const p RT p · , ` . | γ y 2 Adiabata y adiabática son términos equivalentes (N. del T.) 65 const p T · −γ γ 1 (30.6) Elevando ambas partes de la igualdad (30.6) a la potencia 1/γ obtenemos: const Tp · − γ γ 1 (30.7) Es claro que las objeciones hechas sobre los límites de aplicación de la ecuación de Poisson también se refieren a las fórmulas (30.5) y (30.7). 2.10. TRABAJO DURANTE EL CAMBIO ADIABÁTICO DEL VOLUMEN DEL GAS Aplicando la ecuación de la adiabética que acabamos de obtener, ahora podemos calcular el trabajo realizado por el gas durante su dilatación adiabática (o el trabajo realizado por las fuerzas externas al comprimir el gas). Calculemos el trabajo de dilatación del gas (1 mol) desde un valor inicial del volumen V1 has V2. Como anteriormente, el trabajo elemental durante el cambio de volumen en dV será igual a pdV dA · . El alcance entre la presión p del gas y su volumen V se determina por la ecuación de la adiabata (para que el proceso de dilatación esté en equilibrio, es necesario llevarlo a lo largo de la adiabata) const pV · γ , que también podemos escribirlo en la siguiente forma γ γ 1 1 A p pV · donde p1 es la presión inicial del gas, V1 es su volumen inicial. De donde γ γ V V p p 1 1 · Poniendo el valor de p en la fórmula del trabajo, obtenemos: dV V V p dA γ γ 1 1 · Para obtener el trabajo de dilatación desde V1 hasta V2, es necesario integrar la expresión para dA en estos límites: ∫ ∫ · · 2 1 2 2 1 1 1 1 V V V V V dV V p V dV V p A γ γ γ γ 66 Después de la integración obtenemos, para la integral de la parte derecha de la igualdad, la siguiente expresión: ∫ , ` . | − − · − − 2 1 1 2 1 1 1 1 1 1 V V V V V dV γ γ γ γ . Por eso, la expresión del trabajo A toma la forma: ] ] ] ] , ` . | − − · − − 1 2 1 1 1 1 1 1 1 . 1 γ γ γ γ V V V V p A De la educación de estado se deduce que 1 1 1 V RT p · , de donde obtenemos la expresión final: ] ] ] ] , ` . | − − · −1 2 1 1 1 1 γ γ V V RT A . (31.1) Si la masa de gas es igual a M, esta fórmula toma la forma: ] ] ] ] , ` . | − − · −1 2 1 1 1 1 γ γ µ V V RT M A . (31.2) Ya que 1 2 2 1 1 1 − − · γ γ V T V P , entonces 1 2 1 2 1 T T V V · , ` . | − γ . Por eso, la fórmula para el trabajo durante el cambio adiabético del volumen se puede representar en la forma ( ) ( ) 2 1 2 1 1 2 1 1 1 1 T T C T T R T T RT A V − · − · , ` . | − − · − γ γ , Ya que V C R · −1 γ La comparación de las expresiones (31.1) y (29.2) muestra que, durante la dilatación abiabática, se realiza menor trabajo que en la isotérmica (para un mismo cambio de volumen). Esto está ligado, evidentemente, con la mayor pendiente de la adiabata en comparación de la isoterma, ya que debido a esto, en cualquier estadio del proceso de dilatación, en condiciones iniciales iguales, la presión durante el proceso adiabético, será menor que durante el isotérmico. 67 El trabajo durante la dilatación adiabética del gas, depende fundamentalmente del valor del exponente de la adiabata v p C C · γ . Se ve fácilmente, que si 1 → γ , el trabajo de la dilatación adiabética tenderá al valor del trabajo en el proceso isotérmico. Podemos convencernos de esto, hallando el valor límite de la parte derecha de la ecuación (31.1) para 1 → γ (utilizando el Teorema de L´Hopital). En los gases poliatómicos, para los cuales el valor de γ es el más próximo a la unidad, existe la mínima diferencia entre los valores de los trabajos en los procesos isotérmicos y adiabético. La comparación de los dos procesos examinados es más cómodo realizarla si recurrimos a la representación gráfica del proceso de cambio de volumen del gas. En el gráfico de dependencia entre la presión del gas y su volumen (fig. 39), el trabajo elemental dA del cambio de volumen del gas dV, se representa por la superficie limitada por el tramo de la curva AB y por el segmento dV sobre el eje de las abscisas (cuadriculada) El trabajo de cambio de volumen del gas desde el valor V1 hasta el valor V2, que es igual a ∫ 2 1 V V pdV , se representa por toda la superficie rayada, limitada por los tramos correspondientes de la curva AB y el segmento del eje de las abscisas. En la fig. 40 están expuestas, para su comparación, las curvas 1 y 2 que representan la isoterma y la adiabata de un mismo gas y para condiciones iniciales iguales. El trabajo del cambio isotérmico y del volumen del gas desde V1 hasta V2 es igual a la superficie ABV2V1 y el trabajo correspondiente a la dilatación adiabética es igual a la superficie AB1V2V1 que es, evidentemente, menor (véase la fig. 40). Mientras menor sea la constante γ de la adiabata, tanto más próxima estará la adiabata de la isoterma y tanto menor será la diferencia entre las superficies por debajo de ambas curvas. En el lÍmite, cuando 1 → γ , la adiabata se convierte en isoterma. 68 3. ELEMENTOS DE LA TERMODINÁMICA 3.1. ESTADOS DE EQUILIBRIO La teoría cinética de los gases explica muchos fenómenos de los gases ideales, en los cuales los movimientos de las moléculas se pueden considerar libres, debido a la pequeñez de las fuerzas de interacción entre ellas. En los casos cuando no se pueden depreciar las fuerzas de interacción, como, por ejemplo, en los gases reales, la teoría describe con mucha más precisión los procesos que ocurren en ellos. Esto se explica con el cuadro detallado de los movimientos moleculares no es conocido en la mayoría de los casos, ya que no se consigue tener en cuenta, lo suficientemente exacto, todas las fuerzas que actúan sobre las moléculas. Cualquier sistema molecular está compuesto de un número enorme de partículas que interaccionan entre sí, que se mueven constantemente y cambian su posición mutua. En tales condiciones es imposible conocer, exactamente, las fuerzas que actúan sobre la molécula en cualquier momento de tiempo, y por lo tanto conocer sus movimientos. Por eso, no se pueden determinar teóricamente el enlace entre los movimientos moleculares y las propiedades de la substancia. Sin embargo, puede ser estudiada una serie de propiedades de la substancia, muchos fenómenos en ella, sin un conocimiento detallado del mecanismo de los movimientos moleculares, si utilizamos solamente las magnitudes macroscópicas, es decir, las magnitudes que caracterizan la substancia en total, pero cuya aplicación a partículas por separado no tiene sentido. A tales magnitudes se refieren, ante todo, la presión y la temperatura. Como ya vimos anteriormente, estas magnitudes solo tienen sentido en relación al conjunto de un gran número de partículas. No se puede hablar de la presión o temperatura de una molécula. Esto se deduce de que ambas magnitudes se determinan por la energía cinética media de las partículas. Una situación análoga ya la hemos encontrado en la mecánica. Al resolver una serie de tareas, relativas al puro movimiento mecánico, frecuentemente, resulta difícil determinar los parámetros fundamentales que caracterizan este movimiento, es decir las coordenadas y los impulsos de distintos cuerpos del sistema en cualquier momento de tiempo. En estos casos se recurre a la ayuda de las leyes generales, que se refieren a todo el sistema en su conjunto. Tales leyes son las leyes de conservación de 69 la energía y del impulso. Estas se pueden utilizar sin saber con detalle el carácter de la interacción de los cuerpos y de sus movimientos, porque estas leyes son justas para cualesquiera movimientos y cualesquiera interacciones. De la misma manera, al estudiar las propiedades de la substancia, ligadas con los movimientos térmicos de las partículas, también se utilizan algunas leyes generales, siempre justas, independientemente del carácter de los movimientos de las moléculas, de la interacción entre ellas, de la estructura de la substancia. Estas leyes generales se refieren a la energía, a sus cambios y a las magnitudes ligadas a ella. La parte de la Física que se ocupa del estudio de las propiedades generales de la substancia, ligadas con los movimientos térmicos en las condiciones de equilibrio, se llama Termodinámica. La situación particular de la Termodinámica en la Física, está ligada a que por causas, sobre las cuales hablaremos más adelante, cualquier forma de energía, durante sus transformaciones, al fin y al cabo se transforma en energía de movimientos térmicos. Sí por ejemplo, en el proceso del movimiento mecánico, la energía del cuerpo o del sistema de cuerpos disminuye, debido a la acción de las fuerzas de rozamiento, entonces, esto se realiza porque ella se transforma en calor, los cuerpos que frotan se calientan. Se transforma también en calor la energía de la corriente eléctrica, la energía de la luz, la energía de las reacciones químicas, etc. Cualquier forma de energía, en el proceso de transformación puede pasar a través de muchas formas de energía, pero el resultado final de todas estas transformaciones inevitablemente es la energía térmica. Un gran interés práctico tiene la transformación de la energía mecánica en calor y el proceso inverso de obtención del trabajo mecánico, a base de la energía térmica. Esta cuestión la examinaremos lo más detalladamente posible. Pero antes de empezar esta cuestión y de formular las leyes de la Termodinámica; es necesario dedicar alguna' atención a la cuestión importante sobre el equilibrio, concepto que se introduce en la Termodinámica de modo semejante a como esto se hacía en la Mecánica. En Mecánica se llama equilibrio al estado del cuerpo, durante el cual éste se encuentra en reposo, (claro está, respecto a un determinado sistema de coordenadas). En la Termodinámica el concepto de equilibrio es un tanto más amplio. Un sistema se encuentra en equilibrio termodinámico, si las magnitudes macroscópicas, que determinan su estado, quedan constantes (y añadimos iguales a sus valores medios). En primer lugar, esto se refiere a la presión y a la temperatura. En estado de equilibrio no se puedan realizar tales fenómenos, como la conductibilidad calorífica, la difusión, las reacciones químicas, las transiciones fásicas. Pero el equilibrio termodinámico (algunas veces también lo llaman equilibrio estadístico), se diferencia, esencialmente, del mecánico en que, a pesar de que las magnitudes macroscópicas que caracterizan el sistema quedan constantes, las partículas, de que se compone el sistema (átomos, moléculas), no interrumpen sus movimientos complejos. Y la circunstancia de que esto no dificulta a quedar el sistema en estado invariable, está condicionada por el gran número de estas partículas. Así, por ejemplo, si ponemos en contacto dos cuerpos que poseen la misma temperatura, entonces, como es bien conocido de la experiencia diaria, el calor no 70 pasará de un cuerpo a otro y la temperatura de los cuerpos en contacto queda invariable, los cuerpos se encontrarán en equilibrio. Mientras tanto, no está excluido que en algunos, puntos de contacto de estos cuerpos las partículas de uno de ellos poseen una energía cinética mayor, que las partículas del otro. En estos puntos se realizará, naturalmente, el paso de calor de un cuerpo a otro. Pero él se compensará, indudablemente, con el pasó inverso en otros puntos, donde la diferencia de energías tenga el signo contrario. En general, la energía térmica no pasa dé un cuerpo a otro en el caso de los cuerpos con la misma temperatura, y a esto hay que añadir que las partículas de los cuerpos a lo largo de la superficie de contacto teniendo las energías «individuales» más diferentes, poseen el mismo valor medio de energía para, ambos cuerpos. Lo mismo se refiere al hecho muy conocido, de .que el gas en estado de equilibrio se distribuya uniformemente por todo el volumen de la vasija, de modo que su densidad, es igual en todas partes de la vasija. Esto está completamente condicionado con que el número de moléculas de gas es extraordinariamente grande. Si hubiese en la vasija, por ejemplo, cien moléculas en total, entonces, siendo el movimiento de las moléculas completamente caótico, no podríamos esperar que en cada una de las dos mitades de la vasija se contuviesen en cualquier momento exactamente 50 moléculas. Pero incluso, para un gran número de partículas, pueden tener lugar algunas desviaciones en su distribución uniforme por el volumen en algunas partes de la vasija. Es igual y constante sólo ladensidad media del gas en todo el volumen. Nos encontramos con una posición análoga al establecer el equilibrio entre el líquido y el vapor en una vasija cerrada. Se forma vapor sobre el líquido como resultado de la evaporación, proceso que consiste en, que las moléculas de líquido que poseen gran velocidad, abandonan el líquido en su superficie. Pero parte de las moléculas que abandonaron el líquido, durante su movimiento caótico puede volver de nuevo a él y esto se realiza, tanto más frecuentemente, cuanto mayor sea la cantidad de vapor. El equilibrio entre el líquido y su vapor comienza cuando el número de moléculas, que abandonaron el líquido en la unidad de tiempo, se hace igual al número de moléculas que regresan del vapor al líquido. El vapor se satura y después de esto no se realiza en el sistema ningún cambio macroscópico, la presión y la temperatura quedan constantes. Sin embargo, la salida de las moléculas del líquido y su regreso del vapor continúan también después de establecerse el equilibrio. Y no está excluido en este caso que en algunas partes del volumen, en estado de equilibrio, la densidad del vapor pueda diferenciarse del valor medio, es decir, de la densidad del vapor saturado. Estos ejemplos indican dos particularidades del estado de equilibrio. En primer lugar, el concepto de equilibrio termodinámico es una determinada idealización, porque, hablando en rigor, durante el equilibrio los parámetros, de estado no quedan, constantes, sino que sufren unas pequeñas oscilaciones alrededor de sus valores de equilibrio (medios). Tales oscilaciones, como se indicó anteriormente, se llaman fluctuaciones. En segundo lugar, se puede hablar de equilibrio termodinámico sólo en el caso, cuando es muy grande el número de partículas que componen el sistema. Observemos que las leyes de la Termodinámica sobre las que hablaremos en este capítulo, sólo se refieren a los sistemas compuestos de un gran número de partículas. 3.2. PROCESOS REVERSIBLES E IRREVERSIBLES 71 Si por cualquier causa el sistema no se encuentra en equilibrio o ha sido sacado de él y luego se le deja a su albedrío (esto significa, que no se somete a las acciones externas), entonces, como demuestra la experiencia, se realiza por sí mismo el paso al estado de equilibrio. Se puede incluso decir que el estado de equilibrio es aquel estado, al cual pasa cualquier sistema molecular en ausencia de acciones externas sobre él. El proceso de paso al equilibrio se llama relajación y el tiempo empleado en él se llama tiempo de relajación. Pero cuando ya se ha establecido el equilibrio, el sistema, como muestra la práctica, no puede volver a su estado de desequilibrio inicial. En otras palabras, el cambio de estado, que sufrió el sistema, pasando al estado de equilibrio, no puede realizarse en dirección contraria sin la acción exterior. Así, por ejemplo, si dos cuerpos que están en contacto, poseían al principio una diferencia de temperaturas y fueron, puestos a su albedrío, entonces, se iguala, al fin y al cabo la temperatura de ambos cuerpos. Pero el proceso inverso, el aumento de la diferencia de temperaturas entre ellos, no se realiza sin la acción exterior. El gas por si mismo siempre se distribuye uniformemente por todo el volumen de la vasija, y tal estado corresponde al equilibrio. Pero el gas nunca se acumula en una parte de la vasija en mayor cantidad (con mayor densidad) que en otra parte, sin la acción de las fuerzas externas. Exactamente igual, si introducimos en la vasija dos gases diferentes, ellos mismos se mezclan a consecuencia de la difusión mutua de modo que la composición de la mezcla se hace igual en todas partes. En esto consiste el estado de equilibrio. Sin embargo, para separar de nuevo estos gases, se exige gastar grandes fuerzas del exterior. Los ejemplos expuestos indican una particularidad importante de los procesos que se realizan en los sistemas moleculares, que es su irreversibilidad. En esto, precisamente, los procesos moleculares se diferencian de los puramente mecánicos, los cuales se caracterizan por su rigurosa reversibilidad. Se llama proceso reversible al cambio de estado del sistema (o de un cuerpo por separado) que, al ser realizado en dirección contraria lo vuelve a su estado inicial, de modo que el sistema pase a través de los mismos estados intermedios que en el proceso directo, pero en orden inverso y el estado de los cuerpos exteriores al sistema queden invariables. Son reversibles todos los movimientos, examinados en la Mecánica, excepto aquellos en los que actúa la fuerza de rozamiento (la acción de la fuerza de rozamiento conduce a la segregación de calor, y el proceso deja de ser puramente mecánico). Así, por ejemplo, cuando cae una bola elástica sobre una superficie dura, se realiza el cambio de la energía potencial de la bola en cinética, ya que en el momento, cuando la bola se pone en contacto con la tabla en donde cae, su energía cinética es exactamente igual a la energía potencial inicial, si no existe la fuerza de rozamiento con el aire, durante el movimiento de la bola hacia abajo. Al chocar, se origina la fuerza de elasticidad (debido a la deformación de la bola y de la tabla), y si no interrumpimos el proceso, entonces estas fuerzas obligan a la bola a empezar el movimiento inverso 72 hacia arriba. Con ello de nuevo la energía potencial, esta vez la energía de deformación, se transformará en la energía cinética del movimiento de la bola y ésta se elevará a la misma altura, que cuando empezó su caída. Este proceso puede repetirse muchas veces. Está claro, que el movimiento hacía arriba de la bola es un proceso inverso a su caída, y no es difícil observar que durante su elevación la bola pasa por todos los mismos estados intermedios, determinados por sus coordenadas que tenía durante su caída, pero en orden contrarío. Por consiguiente, este proceso puramente mecánico es reversible. Es cierto, que el proceso pasará como acabamos de describir, sólo en el caso si no existen las fuerzas de rozamiento con el aire, si la hola es completamente elástica, si también la tabla sobre la que ella choca es completamente elástica. Todos estos «sí» indican que el proceso reversible, incluso en el ejemplo mecánico examinado, es una determinada idealización, ya que de hecho no existen cuerpos completamente elásticos, nunca se puede excluir completamente la fuerza de rozamiento, etc. Pero, por lo menos en su esencia, el movimiento mecánico es reversible. Los procesos que no satisfacen la condición de reversibilidad expuesta anteriormente se llaman irreversibles. Expongamos aquí un ejemplo que permite precisar el concepto de la reversibilidad e irreversibilidad de los cambios o procesos, Supongamos que un muelle, sujeto por uno de sus extremos, se deforma (se estira) con una fuerza F, aplicada a su otro extremo (fig. 90). El muelle se estira aumentando su energía potencial a cuenta del trabajo de la fuerza F. Si después de que el muelle resulta estar estirado en una longitud determinada suspendemos la acción de la fuerza, entonces, el muelle vuelve a su estado inicial, disminuyendo correspondientemente su energía potencial. ¿Se puede considerar reversible el proceso descrito de estiramiento del muelle? Se ve fácilmente, que si estiramos rápidamente el muelle (más adelante se verá lo que significa «rápidamente»), e inmediatamente suspendemos la acción de la fuerza, entonces el proceso no será reversible. En efecto, cuando la fuerza F empieza a estirar el muelle, ante todo se deforma aquella parte del muelle, a la cual está directamente aplicada la fuerza, es decir, a la parte colindante con el extremo libre. La deformación se transmite poco a poco a las restantes partes del muelle y, por último, sufre la deformación aquella parte que colinda con el extremo fijado. Después de suspender la acción de la fuerza el muelle empieza a encogerse. Pero también ahora la deformación, esta vez la deformación por compresión, al principio la sufre la parte del muelle colindante con el punto de aplicación, ya que ella, 73 evidentemente, es la primera en «sentir» que la fuerza ha dejado de actuar. De esta parte se transmite poco a poco la deformación a lo largo del muelle, hasta que no se restablezca el estado inicial. De tal modo, a pesar de que el proceso de compresión va en sentido contrario, con ello el muelle no pasa por los estados intermedios en orden contrario: durante el proceso directo se deformó al principio aquella parte del muelle que colinda con el extremo libre, y de él se transmitió la deformación a las partes restantes del muelle; del mismo modo y no en orden contrario se deformó el muelle durante la compresión, por eso, en el experimento descrito no se puede considerar reversible el proceso de estiramiento del muelle. La irreversibilidad se manifiesta con que, al suspender rápidamente la acción de la fuerza, el muelle se pone en movimiento oscilatorio, que no es reversible: la fuerza de rozamiento conduce al amortiguamiento de las oscilaciones y su energía se transforma en calor. Por esta causa, la compresión rápida o la dilatación de un gas isotérmica o adiabática, no son procesos reversibles. Lo mismo que en el caso del muelle, la reversibilidad consiste aquí en que la ordenación de los estados intermedios durante los procesos directo e inverso resultan ser iguales. Al número de procesos irreversibles se refiere también la dilatación de un gas en el vacío, no equilibrado por las fuerzas externas. Son irreversibles todos los procesos de transporte, conductividad calorífica, difusión y de rozamiento interno. 3.3. PROCESOS CUASIESTÁTICOS En relación al concepto de reversibilidad e irreversibilidad recordaremos lo que se dijo en el cap. II sobre los procesos cuasiestáticos (véase la pág. 115). En algunos casos de los procesos que se desarrollan irreversiblemente en unas condiciones, pueden ser reversibles en otras. Por ejemplo, el proceso de estiramiento del muelle, descrito anteriormente, puede ser realizado de una forma reversible. Para esto, es necesario que la fuerza exterior que estira al muelle aumente constantemente a medida del estiramiento, para que sea en cada momento igual y contraria a la fuerza de elasticidad del propio muelle. En otras palabras, es necesario que el muelle se encuentre en cada momento dado en estado de equilibrio. Para ello es estiramiento deberá realizarse tan lentamente, que la deformación tenga tiempo de transmitirse en toda la longitud del muelle y siempre sea igual en todos los puntos. Entonces estará en equilibrio en cualquier momento. Por principio, el proceso se debe realizar infinitamente lento. El tiempo de estiramiento debe ser prácticamente muy grande en relación al tiempo de relajación. Si la duración del proceso es menor que el tiempo de relajación, entonces no tiene tiempo de establecerse el equilibrio, el proceso resulta ser muy rápido para ser reversible. Recordemos que los procesos, en la marcha de los cuales el sistema está todo el tiempo en equilibrio, se llaman cuasiestáticos. Está claro que estos procesos son reversibles, ya que todos los estados intermedios están en equilibrio. En los ejemplos, expuestos anteriormente, de comprensión y estiramiento de un muelle o de un gas, el tiempo de relajación es el tiempo de propagación del sonido, ya que las ondas acústicas representan en sí la dilatación y compresión propagadas en el cuerpo. La dilatación del gas o su compresión, realizada con ayuda de un émbolo, será cuasiestática, si la velocidad de traslación del émbolo es pequeña en relación con la velocidad del sonido en el gas, ya que en estas condiciones, la presión tiene tiempo de 74 igualarse en todo en volumen del gas. Como vimos (véase la pág. 116) el trabajo de dilatación del gas era el máximo en este caso. Recordemos una vez más que los procesos cuasiestáticos pueden ser representados como la curva de la presión en función del volumen o de la temperatura. El proceso irreversible no puede ser representado por esta curva. Si el proceso no está en equilibrio (no es cuasiestático), entonces, no se puede hablar de una determinada presión o una determinada temperatura, correspondiente al valor dado del volumen. Todos los procesos que se desarrollan naturalmente, tales como el paso del calor del cuerpo más caliente al menos caliente, la igualación de concentraciones en las mezclas gaseosas, etc., siempre son procesos irreversibles y naturalmente no cuasiestáticos. 3.4. IRREVERSIBILIDAD Y PROBABILIDAD De tal modo, vemos que los procesos ligados a los movimientos térmicos de las moléculas, se diferencian de los movimientos mecánicos en que ellos frecuentemente suelen ser irreversibles. Entre tanto, el movimiento de las moléculas de por sí, por lo menos en su primera aproximación, se someten a las leyes de la Mecánica, y nosotros utilizamos estas leyes al deducir las ecuaciones fundamentales de la teoría de los gases ideales. Surge la pregunta natural ¿de qué modo el conjunto de partículas, cada una de las cuales se somete a las leyes de la Mecánica y cuyos movimientos son, por consiguiente, reversibles, sólo es capaz de cambios irreversibles (si excluimos los procesos cuasiestáticos, que no se realizan por sí mismos)? Como veremos ahora, la causa de esto es la grandiosidad del número de partículas y el caotismo absoluto de sus movimientos. Para aclarar la causa de esta diferencia cualitativa, que se origina durante el cambio cuantitativo del número de partículas, examinemos el siguiente ejemplo. Sea que la vasija de volumen V esté rellena de aire. Dividamos imaginariamente el volumen de la vasija, supongamos en cinco partes, cada una de las cuales con un volumen V t , e introduzcamos en una de ellas, por ejemplo, en la inferior, una molécula señalada con un rayado (fig. 91), verbigracia, la molécula de éter. Tomando parte en los movimientos térmicos desordenados con las partículas de aire, nuestra molécula abandonará pronto el volumen separado y en el proceso de su movimiento sucesivo caerá en todas las cinco partes de la vasija, y entre otras, en aquella parte que acababa de abandonar. Si planteamos la pregunta de si es un proceso reversible el paso de la molécula de éter desde el volumen V t rayado al no rayado, deberemos responder a ella afirmativamente, ya que sin ninguna acción externa nuestra molécula se encuentra de nuevo, rápidamente, en la parte de volumen de la vasija abandonada por ella. Y si controlamos cada segundo su posición, no existe ninguna duda de que aproximadamente en una quinta parte de observaciones la encontraremos en el volumen V t . Utilizando el concepto de probabilidad que introducimos anteriormente (pág. 65) se puede decir, que la probabilidad de hallar la molécula en el volumen V t es igual a 1/5. Esta probabilidad es bastante grande para considerar el proceso reversible, capaz de desarrollarse en ambas direcciones. Si introducimos ahora no una, sino dos moléculas de éter, entonces la probabilidad de encontrarse a un mismo tiempo en el volumen V t , de acuerdo al teorema de la multiplicación de probabilidades (las moléculas se mueven independientemente una de otra, por eso aquí se debe emplear precisamente este teorema) será igual a (1/5) 2 . 75 Esta probabilidad ya es mucho más pequeña, de modo que el proceso del paso de dos moléculas de V a V t se puede considerar reversible con menos derecho. Si introducimos 3, 4, 5… moléculas de éter, entonces la probabilidad de hallarlas de nuevo en el volumen inicial será correspondientemente igual a ;... 5 1 ; 5 1 ; 5 1 5 4 3 , ` . | , ` . | , ` . | Con el crecimiento del número de partículas de éter, introducidas al principio en el volumen V t , la probabilidad de hallarlas de nuevo allí se hará cada vez menor. Por consiguiente, el proceso de la mezcla de las partículas de éter en el aire se hará cada vez menos reversible. Esto quedará más claro, si traducimos nuestro raciocinio al lenguaje del tiempo. Supongamos que la molécula que abandonó a V t regresa allí después de 2 segundos. Para esperar el regreso no de una sino de dos moléculas ya se exigen 2 2 s, para 3, 2 3 s, y así sucesivamente. Pero si hay 100 moléculas de éter, entonces para observar el regreso a V t de todas las 100 moléculas, ya sería necesario 2 100 s y este número ya tiene más de treinta cifras, y este tiempo supera en unos millones a la edad de la Tierra. En la naturaleza, sin embargo, el número de partículas corrientemente alcanza no 100, ni 1000 sino miles de millones, decenas, centenas y miles de miles de millones. Está claro, que el proceso de difusión de un gas en otro se puede considerar completamente irreversible, a pesar de que sea posible por principio el proceso reversible natural. Pero éste es tan poco probable que se le puede considerar prácticamente imposible. Generalizando el ejemplo que acabamos de exponer, podemos decir que si del volumen V separamos el volumen V t igual a m 1 parte de V, m V V t · , entonces, la probabilidad W de que se encuentren en la parte separada N partículas, será igual a N m , ` . | 1 , y si N es muy grande, entonces, la probabilidad W será muy pequeña. Imaginémonos ahora que en el volumen V de la vasija, privada de gas, separamos el volumen m V V t · que está separado del volumen restante por un tabique. Introduzcamos N moléculas de gas en el volumen V t y quitemos el tabique. Está claro que, después de esto, en el gas todas sus partículas ocuparán todo el volumen V. Si mantenemos la temperatura constante, entonces esto será una dilatación isotérmica del gas, desde el volumen V t hasta el volumen V. Tal dilatación representa en sí un cambio de estado del gas y ahora deberemos hablar sobre la mayor o menor probabilidad del estado. En nuestro caso se trata del paso de un estado, durante el cual se encuentra reunido el gas en el volumen V t (estado V t ), al estado, cuando él ocupe el volumen V (estado V). La probabilidad W del primero de ellos es igual, como ya hemos visto, a (1/m) N , o bien, ya que t V V m · , entonces . N t V V W , ` . | · Con referencia al estado V, ya que el gas no puede encontrarse en ninguna parte, a excepción del volumen V (V t es también una parte de V), entonces, la 76 probabilidad de este estado es igual a la unidad. Esto ya se ve de la fórmula (6.1), si ponemos en ella V t = V. La probabilidad W del estado, durante el cual el gas se concentra en una parte del volumen, en lugar de ocuparlo todo entero, para grandes valores de N (el número de partículas de la substancia siempre es, prácticamente, muy grande) será extraordinariamente pequeña, incluso si V t se diferencia poco de V. Como ejemplo, calculemos la probabilidad W de que el gas, para la presión atmosférica y a la temperatura ambiente (T = 300K) rellene uniformemente la vasija de volumen V = 1 cm 3 , a excepción de una parte de él igual a una milésima de millón. Es decir, que . 10 1 9 − · · − · − α V V V V V t t El número de molécula es , 10 · 4 , 2 19 ≈ · kT p N entonces, de acuerdo con (76.1) ( ) N N t V V W α − · , ` . | · 1 . (76.2) Apliquemos la fórmula conocida para los pequeños valores de (en nuestro caso = 10 -9 ): ( ) 43 . 0 lg 1 0 10 10 1 · · · − − → e e lím α α α (e es la base de los logaritmos naturales), entonces (76.2) se puede transformar: ( ) ( ) . 10 1 10 1 1 1 1 10 9 19 10 10 · 10 · 4 , 2 · 43 , 0 1 ≈ ≈ − · − · , ` . | · − − α α α α N N N t V V W El número en el denominador de este quebrado es la unidad con diez mil millones de ceros. Aún más pequeña será la probabilidad de que las moléculas del gas se reúnan en un volumen que forme una parte pequeña del volumen de la vasija. En esto se encierra la causa de la irreversibilidad de los procesos que transcurren, naturalmente, si el gas se distribuye por sí solo en todo el volumen de la vasija, pero nunca se concentra en una parte de este volumen, esto no significa que este segundo proceso sea por principio imposible. Al contrario, las leyes de la Mecánica, a las que se someten las moléculas, permiten las dos direcciones del proceso, pero debido al gran número de partículas la probabilidad de una de ellas es tan pequeña, que prácticamente no se puede observar. Los razonamientos expuestos se referían al caso particular de la distribución de las partículas en el volumen. Pero está claro que se pueden referir a cualquier otro proceso, donde toma parte un gran número de partículas. La concentración por sí misma de las moléculas en una parte pequeña del volumen de la vasija es tan poco probable, como el paso por si mismo del calor desde el cuerpo frío al caliente o la separación por si misma de los componentes de una mezcla gaseosa. En todos estos casos semejantes se realiza por si mismo el paso al estado de equilibrio, cuya probabilidad prácticamente, no se realiza nunca, porque es muy pequeña la probabilidad de tal estado. 77 Es decir, la irreversibilidad de los procesos en los sistemas moleculares, compuestos de partículas, cada una de las cuales se somete a las leyes de la Mecánica, es decir, se mueve reversiblemente, se explica exclusivamente con que el número de estas partículas es muy grande. Si éstas fueran muy pocas, el sistema no conocería ningún proceso irreversible. Con referencia a los procesos cuasiestáticos, ya que el paso al equilibrio se realiza en estos casos a través de los estados intermedios, ellos pueden transcurrir con una probabilidad igual en cualquier dirección. 3.5. TRANSFORMACIONES MUTUAS DE LA ENERGÍA MECÁNICA Y TÉRMICA Los conceptos de equilibrio, de la reversibilidad e irreversibilidad de los procesos son generales y se refieren a todos los procesos que se realizan en la naturaleza. Uno de los procesos que se realizan frecuentemente en la naturaleza, al pasar cualquier sistema al equilibrio, es la transformación de la energía mecánica en calor. Un ejemplo de tal transformación es la segregación de calor durante el rozamiento. Recordemos que de aquí en adelante llamaremos energía macroscópica a la energía mecánica, es decir, a la energía cinética del movimiento de los cuerpos a su energía potencial, condicionada por las fuerzas que actúan sobre estos cuerpos. En contraposición a esto, la energía cinética de los movimientos térmicos de las moléculas y la energía potencial de su interacción se llama energía interna. Es decir, la segregación de calor a cuenta de la energía mecánica es el proceso de transformación de la energía macroscópica en la energía de los movimientos térmicos microscópicos. Inversa a este proceso es la transformación de calor en energía mecánica, o lo que es lo mismo, la obtención de energía mecánica a cuenta del calor. A su tiempo, la invención de los métodos para obtener trabajo mecánico a cuenta del calor fue el principio de una nueva época en la historia de la civilización. En nuestros tiempos comenzó una época no menos importante de la utilización de la energía nuclear para obtener trabajo. Pero la energía nuclear en la actualidad se transforma en trabajo mecánico no directamente, sino de nuevo, a través del calor. Con esto se determina la importancia del estudio de las leyes generales que dirigen los procesos de transformación mutua de la energía mecánica y térmica. La Termodinámica nació, históricamente, como un apartado de la Física que estudiaba la ligazón entre las energías mecánica y térmica. En su desarrollo posterior la Termodinámica se ha hecho una ciencia, que estudia la ligazón entre la energía térmica y todas las demás formas de energía: química, eléctrica, energía de irradiación, etc. En los siguientes párrafos nos limitaremos al examen de las leyes generales, que ligan las energías térmica y mecánica. 3.6. PRIMER PRINCIPIO DE LA TERMODINÁMICA La primera ley que liga la energía mecánica y térmica, es la ley de conservación de la energía, que ya examinamos detalladamente en su aplicación al gas ideal (véase la pág. 111). Esta ley se llama primer principio de la Termodinámica. Recordaremos aquí el contenido de esta ley. Si el estado de un sistema se cambia a consecuencia de aportarle una determinada cantidad de calor dQ, y con este cambio el sistema realiza un trabajo dA, entonces la ley de conservación de la energía dice así: la cantidad de calor aportado es igual a la suma del trabajo realizado y del cambio de la energía interna del sistema. La ley de conservación de la energía se expresa matemáticamente en la forma: . dA dU dQ + · (78.1) 78 Como hemos visto . pdV dA · La fórmula (78.1) se puede también escribir así: . dA dQ dU − · Si se trata no de un cambio pequeño, sino del cambio macroscópico del estado, entonces, es necesario sumar todos los dQ y todos los dA y calcular de tal modo el cambio de energía interna durante el paso del sistema, por ejemplo, del estado 1 al estado 2: . 2 1 2 1 2 1 ∫ ∫ ∫ − · dA dQ dU Aquí es importante señalar que la cantidad de calor aportado, así como también el trabajo realizado por el sistema (o sobre él), depende de qué modo precisamente se realizó el paso del estado 1 al estado 2. El cambio de la energía dU, evidentemente, no depende del camino del paso, sino sólo de los estados inicial y final. Por eso, se puede escribir que , 2 1 2 1 1 2 2 1 ∫ ∫ ∫ − · − · dA dQ U U dU pero no se puede escribir ∫ − · 2 1 1 2 Q Q dQ ó 1 2 2 1 A A dA − · ∫ Esto significa, que el sistema en cada estado posee un determinado valor de la energía interna U, pero no se puede decir que él posee una determinada cantidad de valor o de trabajo. Por eso, la energía interna se llama función de estado. Pero ni Q ni A son funciones de estado, sino del proceso de cambio de estado 3 . Tienen una importancia especial los llamados procesos cíclicos (o circulares) durante los cuales, el sistema, pasando por una serie de estados, retorna a su estado inicial. En este caso ∫ · . 0 dU Pero esto no significa naturalmente que Q y A también son iguales a cero. En el proceso cíclico el cuerpo puede recibir o entregar una cierta cantidad de calor, puede realizar un trabajo, o el trabajo puede ser realizado sobre él, pero el cambio de energía interna será igual a cero. En este caso, el primer principio de la Termodinámica se escribe así: ∫ ∫ · , dA dQ donde el signo ∫ significa la integración por el contorno cerrado. El primer principio de la Termodinámica es igualmente aplicable a los procesos en equilibrio y no en equilibrio. A pesar de que lo últimos no pueden ser representados en forma de curva, los estados inicial y final del sistema también están, en este caso, completamente determinados. Recordemos aquí las relaciones fundamentales que obtuvimos aplicando el primer principio de la Termodinámica al gas ideal. El trabajo realizado por un mol del gas ideal, durante su dilatación isotérmica desde el volumen V 1 hasta el volumen V 2 es igual a: 3 Esto significa matemáticamente que, a diferencia de dU, las magnitudes dA y dQ no son diferenciales totales 79 . ln 1 2 V V RT A · Si la temperatura del gas cae desde T 1 hasta T 2 durante la dilatación adiabática, el trabajo (referido a 1 mol) realizado por el gas es igual a: 1 ) ( 2 1 − − · γ T T R A Aquí v p C C · γ es la relación entre la capacidad calorífica para una presión constante y la capacidad calorífica para un volumen constante. Recordemos que las fórmulas expuestas se refieren al caso, cuando el cambio de estado del gas se realizó cuasiestáticamente, es decir, por un camino reversible. Es importante señalar que el primer principio de la Termodinámica no indica en qué dirección van los procesos de cambio de estado. Desde el punto de vista del primer principio, el calor, por ejemplo, puede pasar del cuerpo caliente al frío, y del frío al caliente. Sólo es necesario que la energía entregada por un cuerpo y la recibida por el otro sean iguales una a otra. La irreversibilidad de los procesos de la naturaleza no se deduce, por consiguiente, del primer principio de la Termodinámica. Las relaciones expuestas anteriormente permiten calcular la cantidad de calor segregada como resultado de la realización de trabajo mecánico. Como se sabe, puede considerarse resultado del trabajo mecánico realizado la aparición de una cantidad de calor igual a él. Esto significa que la energía del movimiento macroscópico se transforma por completo en energía de los movimientos microscópicos de las moléculas de substancia. Examinemos ahora el proceso inverso de la transformación del calor en trabajo mecánico. 3.7. TRANSFORMACIÓN DEL CALOR EN TRABAJO MECÁNICO Como sabemos se llama calor a la energía que se transmite del cuerpo con mayor temperatura al cuerpo con menor temperatura, por ejemplo, durante su contacto. Por sí misma, esta transmisión de energía no va acompañada con la realización de trabajo, ya que con ello no hay ningún desplazamiento de los cuerpos. Ella conduce sólo al aumento de la energía interna del cuerpo, al que se le entrega el calor y a la igualación de temperaturas, después de lo cual se suspende el mismo proceso de transmisión térmica. Pero si el calor se transmite al cuerpo que en este caso se dilata, entonces, él puede realizar un trabajo. De acuerdo a la ley de conservación de la energía este trabajo será igual a: , dU dQ dA − · donde dU es el cambio de energía interna. Durante el proceso isotérmico se realiza el máximo trabajo, cuando no cambia la energía interna, de modo que . dQ dA · Un trabajo mayor claro está no puede haber. Por consiguiente, para obtener el trabajo máximo, igual al calor empleado, es necesario transmitir calor al cuerpo que se 80 dilata, de modo que entre él y la fuente de calor no haya diferencias de temperaturas, porque, repetimos, el proceso irreversible de la conductibilidad calorífica es incapaz de transformar el calor en trabajo, conduciendo solamente al aumento de la energía interna en perjuicio del trabajo. Es cierto, que si no hay diferencias de temperaturas entre la fuente de energía y el cuerpo al que se le transmite el calor, entonces, no se transmitirá el calor. Pero, para que se transmita el calor, es suficiente que la diferencia de temperaturas entre ellos sea infinitamente pequeña lo que prácticamente no se diferencia del isotermismo completo. En tales condiciones el proceso de transmisión de calor ocurre de un modo infinitamente lento y, por eso, es reversible. Todo esto se relaciona al acto único de transmisión de calor al cuerpo que realiza un trabajo. En este caso repetimos, el cuerpo puede realizar un trabajo igual al calor entregado por la fuente. Por ejemplo, si un mol de un gas ideal, al recibir el calor, se dilata isotérmicamente desde el volumen V 1 hasta el volumen V 2 , con ello se realizará un trabajo igual a ( ) 1 2 / ln V V R . Pero para la Técnica tienen importancia no estos procesos unitarios de transformación de calor en trabajo. Los mecanismos reales existentes para obtener trabajo a cuenta del calor (máquinas de vapor, motores de combustión interna, y etc.) actúan, como sabemos, cíclicamente, es decir, en ellos los procesos de transmisión del calor y de su transformación en trabajo mecánico se repiten periódicamente. Para eso, es necesario que el cuerpo que realiza el trabajo, al recibir una cierta cantidad de calor de la fuente y realizar un trabajo determinado, vuelva después de esto al estado inicial, para empezar de nuevo el mismo proceso. En otras palabras, el cuerpo deberá realizar procesos circulares. El conjunto de cambios de estado en resultado de los cuales se restablece él (el estado) se llama ciclo. Recordemos, que si caracterizamos el cuerpo con su presión y volumen, entonces su estado se representa por un punto del diagrama p – V. El cambio de estado se representa en este diagrama con una línea, por ejemplo, la línea AaB del diagrama de la fig. 92. El proceso circular (ciclo) se representa por una línea curva cerrada, por ejemplo, la línea AaBbA. El trabajo realizado en un ciclo es igual a la superficie abarcada por esta curva cerrada (véase la pág. 114, fig. 33). Principio de Kelvin. Surge la pregunta importante ¿se puede obtener un trabajo, durante el proceso cíclico que sea igual al calor transmitido por la fuente? A primera vista, parece ser que para esto no hay ninguna barrera. Como resultado del ciclo el cuerpo que realizó el trabajo retorna a su estado inicial y, por consiguiente, queda invariable la energía interna y el trabajo deberá ser igual al calor absorbido. Sin embargo, en realidad, un conjunto de datos experimentales, obliga a dar una contestación negativa a la pregunta. Ya en el siglo pasado (año 1854) fue formulado por V. Thomson (Kelvin) en forma del siguiente principio: Es imposible realizar un proceso cíclico, cuyo único resultado sea la transformación en trabajo del calor quitado de cualquier cuerpo, sin que haya ocurrido ningún cambio en el otro cuerpo o cuerpos. De acuerdo a este principio, basado en numerosísimos datos experimentales, referentes al trabajo de las máquinas térmicas, el calor quitado a la fuente se puede transformar en trabajo (en el proceso cíclico) con la condición indispensable, de que además de esta transformación deberá cambiarse el estado de cualquier otro cuerpo (o cuerpos). Es decir, en el proceso de transformación del calor en trabajo, además de la fuente de calor, de donde se quita el calor, y del cuerpo que realiza el trabajo, al cual se le entrega directamente el calor, también deberá participar otro cuerpo (o cuerpos) 81 cualquiera. ¿Qué cuerpo misterioso es ése y cuál es su papel en el proceso de transformación del calor en trabajo? Como ya sabemos, para la transformación del calor en trabajo, es necesario naturalmente <<quitar>> calor de la fuente y transmitírselo a otro cuerpo de menor temperatura. Pero la simple transmisión no está ligada a ningún trabajo. Por eso, tal transmisión no se realiza, directamente, sino a través de otro cuerpo, que al dilatarse realiza <<de paso>> un trabajo mecánico y regresa a su estado inicial. Él se llama cuerpo de trabajo 4 , mientras que la fuente se llama calentador y el cuerpo con temperatura más baja, al cual se le entrega el calor es el refrigerador. Precisamente el refrigerador es <<aquel cuerpo>> del que se habla en el principio de Kelvin. Él por sí mismo no realiza ningún trabajo, pero es necesario, por que el cuerpo de trabajo le debe entregar calor. La afirmación de que para realizar un trabajo en la máquina cíclica es necesario la participación de dos cuerpos con diferente temperatura se denomina Principio de Carnot. ¿Pero por qué no tuvimos necesidad de este cuerpo complementario que recibe calor, pero no realiza trabajo, cuando hablamos del acto unitario de transformación del calor en trabajo, y por qué no se puede prescindir de él, cuando se trata del proceso cíclico? La cuestión consiste, evidentemente, en que durante el proceso cíclico, circular, el cuerpo de trabajo, después de que al dilatarse realizó un trabajo a cuenta del calor recibido del calentador, debe volver al estado inicial. Si, por ejemplo, al dilatarse el cuerpo de trabajo, realizando un trabajo, pasa a través de una serie de estados a lo largo de la curva AaB (fig. 92), para que vuelva a su estado inicial es necesario comprimirlo. Pero para esto es necesario realizar un trabajo sobre el cuerpo de trabajo. Pero este trabajo deberá ser menor que el trabajo, realizado por el cuerpo de trabajo durante la dilatación. De otra forma el objetivo del ciclo no será conseguido. Y para que el trabajo durante la compresión sea menor que el trabajo de dilatación, el cuerpo de trabajo debe pasar durante la compresión por una serie de estados por la curva que descansa por debajo de la curva de dilatación, por ejemplo, por la curva BbA de la fig. 92. Pero la curva más baja del diagrama p – V corresponde a una temperatura más baja. Esto significa que el cuerpo de trabajo antes de la compresión debe ser enfriado, de él se debe quitar alguna cantidad de calor y entregárselo al refrigerador. Por eso, ninguna máquina térmica (cíclica) no puede realizarse, solamente, con la fuente de calor y el cuerpo de trabajo. Si fuese posible limitarse sólo con la fuente de calor y el cuerpo de trabajo, entonces para obtener trabajo podrían utilizarse tales <<fuentes>> de calor, como son el agua de los mares y océanos, la corteza terrestre, la atmósfera de la Tierra, de las cuales se podría tomar una cantidad de calor, prácticamente ilimitada. La máquina que trabajase a base del calor de estas fuentes, que no exige por lo tanto ningún combustible, tendría tanta importancia como el <<perpetuum mobile>> (tal máquina imaginaria se llama perpetuum mobile de segundo género). Sin embargo, ella no está <<prohibida>> por la ley de conservación de la energía, el trabajo se realiza a base del calor. Pero la experiencia muestra, que tal máquina no puede ser construida. Para que trabaje la máquina térmica cíclica es necesario el refrigerador, cuerpo con temperatura más baja que el calentador. Precisamente, la atmósfera, corrientemente, sirve de refrigerador. A esta cuestión volveremos más adelante. 3.8. CICLO DE CARNOT 4 También se suele llamar <<portador de calor>> (N. del T.) 82 Examinemos ahora el proceso circular, durante el cual, el calor, quitado de cualquier cuerpo, se puede transformar en trabajo, precisamente, de la mejor forma, es decir, de modo que se obtenga el máximo de trabajo. Para realizar este proceso es necesario tener, como sabemos, tres cuerpos: la fuente de calor, del cual se extrae el calor (calentador), un cuerpo más frío, al cual se le entrega el calor (refrigerador), y el cuerpo de trabajo, por medio del cual se realiza la transmisión y se efectúa el propio trabajo. Supongamos, además, para sencillez del razonamiento, que el calentador y el refrigerador tienen una capacidad calorífica, tan grande, que sus temperaturas no cambian porque al primero se le quite y al segundo se le entregue una determinada cantidad de calor. Examinemos cómo el cuerpo de trabajo, realmente, realiza un trabajo en estas condiciones, a base del calor entregado por el calentador. Empecemos el proceso circular sobre el cuerpo de trabajo partiendo de que él se encuentra comprimido hasta una presión determinada y está en contacto con el calentador y tiene, por lo tanto, la misma temperatura qu él (punto A en la fig. 93). Aquí no se verifica el proceso de conducción de calor, ya que no hay diferencia de temperaturas. Por lo tanto, tampoco se realiza la transmisión de calor sin realizar trabajo. Ya que nuestra tarea consiste en obtener el máximo de trabajo no debemos permitir en nuestro ciclo tales procesos. Demos ahora la posibilidad al cuerpo de trabajo de dilatarse y desplazarse y desplazarse cualquier cuerpo, por ejemplo, un émbolo sin interrumpir su contacto con el calentador. Por lo tanto, la dilatación será isotérmica (curva AB en la fig. 93). Con ello se realizará un trabajo. Se realiza, evidentemente, a cuenta del calor quitado del calentador, que sin embargo, no cambia su temperatura, gracias a su gran capacidad calorífica. El calor recibido por el cuerpo de trabajo ahora es necesario entregárselo al refrigerador. Esta transmisión tampoco es conveniente realizarla, por el contacto directo del cuerpo de trabajo con el refrigerador, ya que la temperatura del cuerpo de trabajo, que se dilata isotérmicamente, es mayor que la temperatura del refrigerador y la transmisión de calor durante el contacto no irá acompañada con la realización de trabajo útil. Por eso es necesario, al principio, enfriar al cuerpo de trabajo hasta la temperatura del refrigerador y ya después de esto se les pueden poner en contacto. Para el enfriamiento del cuerpo de trabajo, éste deberá estar aislado del calentador, y luego es necesario darle la posibilidad de dilatarse adiabáticamente (mirar la curva BC de la fig. 93), hasta que él no tome la temperatura del refrigerador (durante la dilatación adiabática los cuerpos se enfrían). El cuerpo, en esta segunda etala, dilatándose y trasladando el émbolo, por ejemplo, realiza, complementariamente, un trabajo mecánico. Después de conseguir, de tal modo, el enfriamiento del cuerpo de trabajo, se le pone en contacto con el refrigerador. Con esto se termina la primera mitad del ciclo, durante el cual el cuerpo de trabajo realizó un trabajo útil a cuenta del calor recibido del calentador. Ahora es necesario volver al cuerpo de trabajo al estado inicial, es decir, restablecer la presión y temperaturas iniciales. Esto significa, que el cuerpo de trabajo debe ser comprimido y puesto de nuevo en contacto con el calentador. Este contacto, como anteriormente, no se debe realizar mientras la temperatura del cuerpo de trabajo sea más baja que la temperatura del calentador. Por eso, el retorno al estado inicial también se realiza en dos etapas. Al principio se comprime el cuerpo de trabajo sin alterar su contacto con el refrigerador, es decir, isotérmicamente (mirar la curva CD en la fig. 93). Luego, aislando el cuerpo de trabajo del refrigerador, complementariamente, se le comprime adiabáticamente, para que se caliente hasta la temperatura del 83 calentador (mirar la curva DA en la fig. 93). Durante la compresión adiabática, el cuerpo se calienta a cuenta del trabajo externo realizado sobre él. Después que en el proceso de compresión adiabática la temperatura del cuerpo se hace igual a la temperatura del calentador, se les pone en contacto y con ello se finaliza el ciclo: el cuerpo de trabajo se encuentra en su estado inicial, y el proceso puede ser empezado de nuevo. El proceso circular descrito se compone, de tal modo, de dos dilataciones y dos compresiones isotérmicas y adiabáticas. Durante las dilataciones, el cuerpo de trabajo realiza un trabajo útil: las compresiones, por el contrario se realizan a cuenta del trabajo realizado sobre el cuerpo de trabajo por las fuerzas externas. En ninguno de todos los estadios del proceso circular examinado no se permite el contacto de dos cuerpos con distintas temperaturas, y de este modo, se evita el origen del proceso irreversible de conducción calorífica. Por consiguiente, el ciclo se verifica de forma reversible (para la completa reversibilidad es necesario realizar las propias dilataciones y compresiones muy lentamente, por principio, con una lentitud infinita, de modo que estos procesos sean cuasiestáticos). El ciclo descrito, realizado por el cuerpo de trabajo, lleva el nombre de ciclo de Carnot, en nombre del científico francés que lo examinó por primera vez. Como resultado del proceso circular de Carnot una determinada cantidad de calor resulta ser transmitida por medio del cuerpo de trabajo desde el calentador al refrigerador. En la marcha del proceso, el cuerpo de trabajo realiza, además de esto, un trabajo. A su tiempo las fuerzas externas realizan un trabajo sobre el cuerpo de trabajo. ¿Se obtiene con esto un trabajo mecánico útil, es decir, se consigue el objetivo de todo el proceso? A primera vista parece ser que el trabajo realizado por el cuerpo de trabajo, durante sus dilataciones en los dos primeros estadios del ciclo, se compensa, completamente, con el trabajo realizado por las fuerzas externas en los dos estadios siguientes de modo, que el trabajo útil al fin de cuentas es igual a cero. Sin embargo, no es difícil de cerciorarse, que en realidad el trabajo positivo realizado por el cuerpo durante su dilatación es mayor que el trabajo negativo realizado sobre él, durante su compresión y, por consiguiente, una parte del calor, recibido del calentador, realmente, se transforma en trabajo mecánico. Nos podemos convencer de esto, lo más sencillamente, en el caso cuando el cuerpo de trabajo es un gas ideal, para el cual se puede calcular exactamente el trabajo de dilatación y compresión. Como vemos, las conclusiones obtenidas con ello, no dependen de la naturaleza del cuerpo de trabajo, es decir, son justas para cualquier cuerpo. Examinemos cuantitativamente todo el ciclo de Carnot, cuando el cuerpo de trabajo es un gas ideal (mirar la fig. 93). Supongamos que de cuerpo de trabajo sirve 1 mol de un gas ideal, y que el estado inicial se caracteriza por la presión p 0 y el volumen V 0 , es decir, por el punto A en la fig. 93. La temperatura del gas R V P T 0 0 0 · , según nuestras condiciones, es igual a la temperatura del calentador. La temperatura del refrigerador la designamos a través de T 1 . Es decir, T 0 > T 1 . En el estado inicial, el cuerpo de trabajo tiene contacto con el calentador. El primer estadio del proceso circular que realiza el gas es su dilatación isotérmica (se conserva el contacto con el calentador) hasta el volumen V 1 . La presión, correspondientemente, desciende por la isoterma hasta el valor p 1 (punto B en la fig. 93). El trabajo positivo, realizado por el gas durante la dilatación, es igual a: 84 , ln 0 0 1 0 1 Q V V RT A · · donde Q 0 es la cantidad de calor quitado del calentador por el gas. A cuenta de este calor fue realizado el trabajo A. El segundo estadio consiste en que el gas se aísla del calentador y su dilatación sucesiva se realiza adiabáticamente, a consecuencia de lo cual se enfría el gas. Esta dilatación adiabática se suspende cuando la temperatura del gas se hace igual a la temperatura del refrigerador T 1 . El valor del volumen, hasta el cual debe dilatarse el gas, se puede determinar teniendo en cuenta que durante la dilatación adiabática es justa la igualdad 1 2 1 1 1 0 − − · γ γ V T V T (80.2) Por consiguiente, el volumen V 2 se puede hallar de la igualdad 1 0 1 1 2 T T V V · , ` . | − γ (80.3) Con esto la presión cambia según la adiabática hasta el valor p 2 (punto C en la fig. 93). El trabajo realizado por el gas en esta segunda etapa del proceso, es igual a (véase la pág. 138): ( ) 1 1 1 1 0 1 2 1 0 2 − − · ] ] ] ] , ` . | − − · − γ γ γ T T R V V RT A (80.4) En la tercera etapa del proceso cíclico, el gas se comprime isotérmicamente por las fuerzas externas a la temperatura T 1 del refrigerador, desde el volumen V 2 hasta el volumen V 3 . El trabajo realizado en este caso sobre el gas es igual a 1 3 2 1 2 3 1 3 ln ln Q V V RT V V RT A · − · · (80.5) A cuenta de este trabajo se desprende el calor Q 1 que se transmite al refrigerador con el que tiene contacto el gas. Por fin, el último cambio que sufre el gas para volver a su estado inicial, es la compresión adiabática hasta el volumen inicial V 0 y la presión p 0 , para las cuales su temperatura de nuevo se hace igual a T 0 . Para esto es necesario que el gas sea comprimido isotérmicamente en la tercera etapa del ciclo hasta el volumen V 3 , determinado por la igualdad 1 0 1 0 3 T T V V v · , ` . | − (80.6) ya que, como anteriormente, 1 0 0 1 3 1 − − · γ γ V T V T El trabajo de compresión en el último estadio del ciclo es igual a 85 ( ) ( ) 1 1 1 0 0 1 4 − − − · − − · γ γ T T R T T R A (80.7) Ahora el gas se encuentra de nuevo en el estado inicial, se realizó el ciclo de Carnot y el gas <<está preparado>> para empezar otra vez el proceso. ¿Cuál es el resultado del ciclo? ¿En qué medida se consiguió su objetivo, o sea, la transformación del calor en trabajo mecánico? El trabajo total A realizado por el gas y sobre el gas, evidentemente es igual a 4 3 2 1 A A A A A + + + · De las igualdades (80.1), (80.4), (80.5) y (80.7) obtenemos: ( ) ( ) 3 2 1 0 1 0 1 0 3 2 1 1 0 0 1 0 ln ln 1 ln 1 ln V V RT V V RT T T R V V RT T T R V V RT A − · − − − − − − − + · γ γ De (80.3) y (80.6) se deduce que . , 3 2 0 1 0 3 1 2 V V V V o V V V V · · Designemos esta relación por r. Entonces r V V V V ln ln ln 3 2 0 1 · · (80.8) Ya que V 1 > V 0 y V 2 > V 3 , entonces ln r > 0. Por consiguiente, el trabajo total es ( ) r T T R A ln 1 0 − · (80.9) y ya que T 0 > T 1 , entonces, A > 0. Es decir, el trabajo, realizado por el gas durante la dilatación es mayor que el trabajo de las fuerzas externas, gastado en su compresión. De tal modo, a cuenta del calor recibido del calentador por el cuerpo de trabajo, ha sido realizado cierto trabajo útil. Sin embargo, este trabajo no es igual a la cantidad Q 0 de calor que recibió el cuerpo de trabajo del calentador. De la cantidad de calor entregada por el calentador 0 1 0 0 ln V V RT Q · una parte, igual a 2 3 1 1 ln V V RT Q · , fue entregada al refrigerador durante la compresión isotérmica del gas, desde el volumen V 2 hasta el volumen V 3 (durante este tiempo el gas se encontraba en contacto con el refrigerador). De tal modo, se consiguió transformar en trabajo útil sólo una parte del calor recibido igual a: 86 ( ) A r T T R Q Q · − · − ln 1 0 1 0 (80.10) El trabajo A se determina gráficamente por la superficie, limitada por la curva ABCD (véase la fig. 93). En esto se diferencia el proceso de transformación del calor en trabajo del proceso inverso de transformación del trabajo en calor. Para determinadas condiciones se puede transformar por completo el trabajo mecánico en calor. El calor se transforma en trabajo sólo parcialmente. Señalemos aquí que de las igualdades (80.1), (80.5) y (80.8) se deduce una relación muy importante que nos hará falta en lo sucesivo. Las igualdades (80.1) y (80.5) se pueden escribir en la forma: 3 2 1 1 0 1 0 0 ln , ln V V R T Q V V R T Q · − · Sumándolas y teniendo en cuenta (80.8), obtenemos: 0 1 1 0 0 · − T Q T Q , de donde 1 1 0 0 T Q T Q · (80.11) Rendimiento del ciclo de Carnot. Del análisis expuesto del proceso circular de Carnot se deduce que por medio de su ayuda no se puede transformar completamente en energía mecánica el calor tomado del calentador. Parte de este calor imprescindiblemente deberá entregarse al refrigerador, a un cuerpo que tenga una temperatura más baja que el calentador. Si la cantidad de calor recibida del calentador por el cuerpo de trabajo es igual a Q 0 , y se ha transformado en trabajo una parte Q 0 - Q 1 de este calor, entonces, la relación 0 1 0 Q Q Q − · η representa en sí el rendimiento del proceso circular (más exactamente, de las máquinas que trabajan según este proceso). Como se ve en la fórmula (80.11), el rendimiento η del ciclo de Carnot se determina por la igualdad: 0 1 0 1 0 1 0 1 1 T T Q Q Q Q Q − · − · − · η (80.12) El rendimiento, por consiguiente, siempre es menor que la unidad y depende de la relación entre las temperaturas del calentador y del refrigerador. El ciclo de Carnot, examinado por nosotros, se realizó en cada uno de sus estadios de forma que no hubo en ningún lugar contacto de cuerpos con diferentes temperaturas, lo que excluye la posibilidad de los procesos irreversibles de conducción calorífica. El cambio de volumen del cuerpo de trabajo también se realizó por un camino reversible, que, como sabemos, asegura con ello el máximo de trabajo realizado (véase 23). Esto significa que fueron aseguradas las mejores condiciones para la utilización de la energía térmica. Por eso, no se puede obtener por principio un rendimiento más elevado que el expresado por la fórmula (80.12) La máquina térmica, que trabaja para los valores dados de temperaturas del calentador y refrigerador, no puede tener un rendimiento mayor que la máquina que 87 trabaja según el ciclo reversible de Carnot, para unos mismos valores de temperaturas del calentador y refrigerador (A esta afirmación algunas veces la llaman primer teorema de Carnot). De la fórmula (80.12) se ve que el rendimiento del ciclo de Carnot no depende del género del cuerpo de trabajo, sino solamente de las temperaturas del calentador y del refrigerador (esta afirmación compone el contenido del segundo teorema de Carnot) Durante el cálculo, tomamos al gas ideal como cuerpo de trabajo solamente porque para él se conoce exactamente la ecuación de estado, lo que permitió calcular fácilmente la magnitud del rendimiento. El hecho de que el rendimiento de la máquina, que trabaja según el ciclo de Carnot, sea el máximo, está condicionado, como vimos (y como veremos detalladamente más adelante), por la circunstancia de que este proceso es completamente reversible. Más adelante serán expuestas las demostraciones generales de ambos teoremas de Carnot. 3.9. MÁQUINA REFRIGERADORA El proceso reversible, como ya se indicó, se caracteriza por el hecho de que si se realiza en dirección contraria, el cuerpo que toma parte en el proceso, pasa por los mismos estados, pero en orden contrario. Aplicado al ciclo de Carnot esto significa que, se transmite el calor no del calentador al refrigerador, sino al contrario, desde el refrigerador al calentador. El ciclo inverso de Carnot se empieza con que el cuerpo de trabajo que se encuentra, por ejemplo, en el estado correspondiente al punto A (fig. 94) se dilata adiabáticamente hasta el estado que responde al punto D (en el ciclo directo, el proceso se empieza con la dilatación isotérmica). Luego le sigue una dilatación isotérmica hasta el estado C. En estos dos primeros estadios del ciclo, el cuerpo de trabajo, dilatándose, realiza un trabajo. En la segunda parte del ciclo, a lo largo de la adiabática CB y de la isoterma BA, el cuerpo de trabajo se comprime, y el trabajo de compresión se realiza sobre el cuerpo por la fuente externa de energía. Como acabamos de indicar, este trabajo supera al trabajo realizado por el mismo cuerpo en la primera mitad del ciclo. Por eso, el resultado del ciclo inverso de Carnot, será no el trabajo exterior útil, sino el transporte del calor, desde el refrigerador al calentador, es decir, desde el cuerpo menos caliente al más caliente. NO es difícil convencerse de que el cuerpo de trabajo durante el proceso inverso de Carnot pasa a través de los mismos estados intermedios que durante el directo, pero en orden contrario. Si la instalación que trabaja según el ciclo directo de Carnot sirve para la transformación del calor en trabajo mecánico, es decir, es una máquina térmica, la máquina que actúa según el ciclo inverpo de Carnot so utiliza para la transmisión del calor desde el cuerpo menos caliente al más caliente, es decir, es una máquina refrigeradora. Con su ayuda a cuenta de un trabajo mecánico externo so quita el calor del cuerpo más frío y se entrega al cuerpo con temperatura más elevada. 3.10. DEMOSTRACIÓN DE LOS TEOREMAS DE CARNOT Ahora se puede exponer una demostración más rigurosa del primer teorema de Carnot (véase la página anterior), que se puede formular así: el rendimiento de la 88 máquina térmica que trabaja para los valores dados de temperaturas del calentador y del refrigerador, no puede ser mayor que el rendimiento de la máquina que trabaja según el ciclo inverso de Carnot para unos mismos valores de las temperaturas del calentador y del refrigerador. Supongamos que tenemos dos máquinas térmicas con un calentador y refrigerador común para ellas: la máquina I que trabaja según el ciclo inverso de Carnot y la máquina II que se diferencia de la I bien por la irreversibilidad de los procesos en ella, o bien por el género de la substancia de trabajo. Supongamos al principio que el rendimiento η2 de la máquina II es mayor que el rendimiento η1 de la máquina I: 1 2 η η > Acoplemos estas máquinas (con un eje común, por transmisiones a correa, etc.) para que una de ellas pueda poner en movimiento a la otra. Supongamos que la máquina II trabaja según el ciclo directo, es decir, recibe el calor Q del calentador, realiza un trabajo A2 y entrega al refrigerador una cantidad de calor igual a Q – A2 Durante esto, ella pone en movimiento a la máquina I, de modo que esta máquina realiza el ciclo inverso. Por consiguiente, la máquina I, transporta el calor desde el refrigerador al calentador, a cuenta del trabajo realizado sobre ella por la máquina II. Supongamos que la máquina I lo transmite al calentador en cada ciclo una cantidad Q de calor, es decir, el mismo que absorbe la máquina II en un ciclo. Supongamos que el trabajo necesario para esto sea igual a A1. El calor tomado del refrigerador por la máquina I es, por lo tanto, igual a Q – A1 Después de un ciclo obtenemos en nuestra máquina combinada I – II el resultado siguiente. 1. El calentador no sufrió ningunos cambios, ya que la máquina I le suministró tanto calor como le quitó la máquina II. 2. El cuerpo de trabajo volvió a su estado inicial en cada una de las máquinas, es decir, tampoco ha sufrido ningún cambio. 3. El refrigerador ha recibido de la máquina II un calor Q – A2 y la máquina I le ha quitado al refrigerador un calor Q – A1 y ya que según nuestra suposición η2 > η1, entonces, A2 > A1 y Q – A1 > Q – A2 Esto significa, que el único resultado de todo el ciclo ha sido la extracción de una cantidad de calor igual a A2 – A1 del refrigerador y de su transformación en trabajo. Pero esto contradice al principio de Thompson. Por consiguiente, η2 no puede ser mayor que el rendimiento η1 de la máquina reversible de Carnot. Demostremos ahora la justeza del segundo teorema de Carnot sobre la independencia del rendimiento de la máquina reversible de Carnot del género del cuerpo de trabajo. Tomemos de nuevo a las dos máquinas unidas entre sí I y II con un calentador y refrigerador común. En este caso ambas máquinas trabajan según el ciclo reversible de Carnot, diferenciándose una de la otra solamente por la substancia de trabajo. Demostremos que son iguales los rendimientos η1 y η2, de ambas máquinas. De nuevo supondremos que la máquina II realiza el ciclo directo y la máquina I el 89 inverso. Al principio supondremos que el rendimiento de ambas máquinas es diferente: sea, por ejemplo, 2 1 η η < Al realizar el ciclo directo, la máquina II recibe del calentador una cantidad Q1 de calor, entrega al refrigerador un calor Q2 y realiza un trabajo equivalente a Q1 – Q2. La máquina I realiza el ciclo inverso, coge un calor Q del refrigerador, entrega un calor Q1 al calentador, a cuenta del trabajo mecánico equivalente a Q – Q2. Si el rendimiento η1<η2, entonces, Q > Q2 La diferencia de calores Q – Q2 se transforma en trabajo. Es decir, como resultado del ciclo, el calentador no sufre ningún cambio, ya que recibe de una máquina tanto calor como entrega a la otra. Los cuerpos de trabajo, realizando un proceso en grupo, también resultan estar en el estado inicial. Es decir, el único resultado del ciclo es la toma de calor (en la cantidad Q – Q2) del refrigerador y su transformación en trabajo, lo que contradice al principio de Thompon. Es decir, no es cierta la suposición de que η1 > η2. Por lo tanto, sólo queda una posibilidad que 2 1 η η · Ya que el cuerpo de trabajo de una de las máquinas puede ser un gas ideal, y ya mostramos que para este caso T T T 2 1 − · η , donde T2 y T1 son las temperaturas correspondientes del refrigerador y calentador, entonces, de aquí se deduce que el rendimiento será uno mismo para cualquier máquina reversible de Carnot. Para el ciclo irreversible el rendimiento es T T T 2 1 − < η (82.1) Recordemos que 1 2 1 Q Q Q − · η , donde Q1 es la cantidad de calor, entregado (al cuerpo de trabaja) por el calentador, y Q2 es la cantidad calor recibido (del cuerpo de trabajo) por el refrigerador. Pero si examinamos nuestro proceso desde el punto de vista de los cambios ocurridos en el mismo cuerpo de trabajo, entonces, Q1 y Q2 son la cantidad de calor recibido y entregado, correspondientemente, es necesario escribirlas con signo contrario. Consideraremos positiva a la cantidad Q1 de calor recibido por el cuerpo; entonces Q2 será negativa. Por consiguiente, la desigualdad (82.1) se escribe en la forma: 1 2 1 1 2 1 T T T Q Q Q − < + 90 O bien, 0 2 2 1 1 < + T Q T Q (82.2) Evidentemente, [véase (80.11)] si el cuerpo sufre un proceso circular reversible, entonces, 0 2 2 1 1 · + T Q T Q (82.3) En lo sucesivo estas relaciones (82.2) y (82.3) serán generalizadas. De lo dicho anteriormente, está claro qué es necesario hacer para conseguir el rendimiento mayor posible de la máquina térmica. En primer lugar, es necesario tender en lo posible a que en la máquina no se realicen los procesos irreversibles, para que el ciclo de la máquina sea lo más próximo posible al reversible. En segundo lugar es necesario, en lo posible, elevar la temperatura del calentador y rebajar la temperatura del refrigerador [véase la fórmula (80.12)] En lo que se refiere a la elección del cuerpo de trabajo, está dictada por consideraciones de racionalidad técnicas y económicas. La circunstancia de que en las máquinas térmicas actuales se emplee fundamentalmente el vapor de agua, está condicionada a la gran accesibilidad del agua y el manejo sencillo de ella. El progreso en la técnica de las instalaciones de fuerza a vapor se consigue con la elevación de la temperatura del calentador (el refrigerador, corrientemente, es el aire que nos rodea). Sin embargo, con las instalaciones de fuerza a vapor concurren con éxito los motores de combustión interna, donde como cuerpo de trabajo sirve una mezcla de aire y el combustible correspondiente. La temperatura, conseguida en este caso, es mucho mayor y, por eso, el rendimiento de estas máquinas es mayor. Y además, en estos motores está excluido el proceso irreversible de conducción de calor desde el hogar, lo que también eleva el rendimiento. Sin embargo, es necesario tener en cuenta, que el proceso reversible es un proceso ideal y en la práctica no se puede asegurar la reversibilidad completa. Por eso, aquel valor del rendimiento de la máquina térmica que da la fórmula (80.12) de hecho es el limite superior inaccesible, al cual, sin embargo, nos podemos acercar lo más posible, por principio. 3.11.ENERGÍA LIBRE En el ciclo de Carnot, el cuerpo de trabajo realiza un trabajo en la primera mitad del ciclo, en los procesos de dilatación, al principio isotérmico, y luego adiabático. Durante el proceso adiabático se realiza un trabajo a cuenta de la energía interna, y este trabajo es igual al decrecimiento de energía interna: dA = - dU La cuestión es diferente en el caso del proceso isotérmico. Durante este proceso, la temperatura del cuerpo queda constante, y, por eso, aquella parte de energía interna que está ligada a la energía cinética de los movimientos moleculares no puede ser utilizada para su transformación en energía mecánica. Esta circunstancia nos obliga a distinguir la energía total que posee el cuerpo o sistema de cuerpos de aquella parte de energía que para las condiciones dadas se puede utilizar para obtener trabajo. 91 Imaginémonos un determinado cuerpo, por ejemplo, un gas en donde pueden ocurrir procesos isotérmicos reversibles de dilatación y compresión. Para esto es necesario colocar el gas en un termostato (véase § 28) o ponerlo en contacto con un cuerpo do gran capacidad calorífica, cuya temperatura es constante. Al dilatarse, el gas puede producir un trabajo mecánico, por consiguiente, nuestro sistema, compuesto del termostato y del gas, posee una energía determinada. Aquella parte de energía, que para las condiciones dadas puede ser utilizada para su transformación en trabajo mecánico, so llama energía libre. Es decir, el sistema no puede realizar un trabajo superior al valor de su energía libre. En este sentido, aquí tenemos una situación algo diferente a la del sistema mecánico. En Mecánica, como se sabe, la energía de un cuerpo, o sistema de cuerpos, es igual a la suma de las energías potencial y cinética. Ambas formas de energía de los cuerpos macroscópicos (y sólo estos cuerpos se examinan en la Mecánica) pueden ser transformadas por completo en trabajo mecánico. La energía interna de un sistema molecular no puede ser transformada por completo en trabajo, en el caso que nos interesa. Por eso, si nos interesamos por la magnitud del trabajo que el sistema puede realizar en el estado dado durante un proceso isotérmico, entonces, la energía interna no es la característica apropiada de este estado. La energía interna caracteriza al sistema si nos interesamos por el trabajo que es capaz de producir este sistema durante el proceso adiabático. Precisamente, el trabajo producido durante el proceso adiabático es igual al cambio (disminución) de la energía interna. La energía libre deberá caracterizar al sistema desde el punto de vista de su «capacidad de trabajo», durante su cambio isotérmico de estado (cambio de volumen). Para que a cada estado se le pueda yuxtaponer un determinado valor numérico de energía libre, es necesario tomar como origen de medidas un estado determinado, del mismo modo que se hizo al determinar la energía potencial en la Mecánica. Esta indeterminación del valor absoluto de la energía libre no crea ninguna dificultad ya que lo esencial no es el propio valor de la energía libre del sistema sino su cambio, lo que determina al trabajo. Recordamos, además, que el trabajo de dilatación o compresión de un cuerpo tiene un valor determinado si este proceso se desarrolla en forma equilibrada, es decir, cuasiestáticamente. De tal modo, la energía libre de un sistema se mide por el trabajo que puede producir el sistema (por ejemplo, un gas ideal), cambiando isotérmica y reversiblemente su estado desde aquel estado en que se encontraba anteriormente al estado inicial, en el cual se admite que la energía libre es igual a cero (origen de medidas). Si designamos por F la energía libre del sistema, entonces, el trabajo infinitamente pequeño dA, que realiza el sistema durante el, proceso isotérmico reversible, será dF dA − · (83.1) Si, por ejemplo, el cambio de estado del sistema se reduce a la dilatación isotérmica del gas (aumento de su volumen), durante el cual el trabajo es positivo, entonces, el signo menos significa que disminuye con esto la energía libre. Al contrario, durante la compresión del cuerpo (trabajo negativo) la energía libre crece a cuenta de las fuerzas externas, que comprimen al cuerpo (gas). En particular, para el gas ideal, durante su dilatación isotérmica desde el volumen V1 hasta el volumen V2 el trabajo se expresa, como es sabido, por la ecuación (para un mol) 92 1 2 ln V V RTM A · (83.2) El segundo miembro de la ecuación (83.2) representa en sí el decrecimiento de la energía libre de 1 mol de gas durante tal dilatación. Esto significa, que a la temperatura dada, la energía libre de una masa de gas dada, será tanto mayor cuanto menor sea el volumen ocupado por ella, es decir, mientras más comprimido esté. Recordemos, que la energía interna del gas ideal no depende del volumen que él ocupa; un mol de gas, comprimido en un balón, tiene la misma energía interna que el gas no comprimido para una misma temperatura. Pero el gas comprimido tiene una gran energía libre porque él durante la dilatación isotérmica puede realizar un trabajo mayor. Cuando este gas comprimido realiza en realidad un trabajo al dilatarse isotérmicamente (elevando, por ejemplo, un émbolo con carga), entonces, este trabajo se realiza a cuenta del calor, que es necesario comunicar al gas desde el termostato, o de otro cuerpo de gran capacidad calorífica (si no, el gas se enfría y el proceso no será isotérmico). Pero, a pesar de todo, nosotros hablamos sobre la energía libre de un gas con objeto de subrayar que el gas es, precisamente, el cuerpo, gracias al cual se crea la posibilidad de realizar un trabajo. Si el proceso de cambio isotérmico de volumen se desarrolla irreversiblemente, entonces, ya que el trabajo realizado con esto es menor que durante el proceso reversible, el cambio de energía libre será mayor que el trabajo realizado, de modo que la fórmula (83.1) se debe escribir en la forma: dF dA ≤ El signo de desigualdad se refiere al proceso irreversible, y el signo de igualdad, al reversible. También son posibles los casos cuando el cambio de energía libre, en general, no va acompañado con realización de trabajo. En particular, si se dilata el gas ideal en el vacío, con ello no se realiza ningún trabajo. La temperatura y, por lo tanto, la energía interna del gas también quedan invariables. Mientras tanto, la energía libre del gas disminuyó, ya que disminuyó el trabajo que puede realizar el gas. Esto está ligado a que el proceso de dilatación del gas en el vacío, a pesar de que es isotérmico, es completamente ireversible. Al principio del apartado subrayábamos que la energía libre caracteriza el estado del cuerpo. Ahora nos queda por demostrar que ella es realmente una función de estado, es decir, necesitamos demostrar que durante el paso de un cuerpo, isotérmica y reversiblemente de un estado a otro, el trabajo realizado, igual a la diferencia de las energías libres del cuerpo en estos estados, no depende del camino del paso. Esto se desprende directamente de que durante el proceso isotérmico circular reversible el trabajo es igual a cero. En efecto, supongamos que el cuerpo puede pasar del estado 1 al estado 2 por dos caminos distintos (isotérmicos), realizando en el primer camino un trabajo A1, y en el segundo, el trabajo A2. Pero en tal caso podemos trasladar nuestro cuerpo del estado 1 al estado 2 por un camino y volverlo de regreso por el otro camino, realizando un proceso circular. El trabajo total realizado con ello es 0 2 1 · − A A Y, por consiguiente, 93 2 1 A A · Es decir, el trabajo realizado por el cuerpo solamente depende del estado inicial y final del mismo. Por consiguiente, la energía libre es una función de estado. Más adelante será expuesta la fórmula general de la energía libre. 3.12.ENTROPÍA Volvamos al proceso circular de Garnot examinado, y prestemos una atención más minuciosa sobre los cambios que sufrió el cuerpo de trabajo en este proceso. Recordemos que el cuerpo de trabajo, desde el estado inicial A caracterizado por la presión p0 y la temperatura T0, pasó por medio de la realización sucesiva de dilataciones isotérmicas y adiabáticas al estado C, cuando tomó la temperatura del refrigerador. Este cambio de estado se realizó a cuenta del calor Q0 entregado por el calentador al cuerpo de trabajo. El paso inverso del cuerpo de trabajo desde el estado C al estado inicial A fue realizado con la ejecución de dos compresiones del cuerpo sucesivas, isotérmica y adiabática. El calor que se segrega con este retorno al estado inicial es igual a Q1, siendo como vimos Q1 < Q0. De tal modo, resulta que el paso reversible de un mismo cuerpo desde el estado A al C y el paso inverso desde C a A va acompañado de una cantidad de calor absorbido diferente al segregado. Evidentemente, esto está ligado a que ambos pasos fueron realizados por diferentes caminos: en un caso (de A a C) el proceso de dilatación se realizó a una presión más elevada que en el otro proceso de compresión (al pasar de C a A). Está claro, que si hubiésemos realizado el paso de C a A del mismo modo que el paso directo, es decir, por la curva CBA y no por la CDA (véase la fig. 93) entonces, la cantidad de calor gastado durante el paso directo sería exactamente igual a la cantidad de calor que se segregó durante el paso inverso. De aquí se deduce la conclusión importante sobre la que ya llamamos la atención del lector, de que la cantidad do calor, que se le debe entregar o quitar al cuerpo durante el paso de un estado a otro, no se determina de una sola forma por los estados inicial y final, sino que depende esencialmente del método de realización del paso. Hablando de otro modo, la cantidad Q de calor no es función de estado del cuerpo como, por ejemplo, la energía interna U (o la energía libre F). Esto, entre tanto, se deduce de la ecuación del primer principio de la Termodinámica dA dU dQ + · ya que el trabajo dA, realizado por el cuerpo (o sobre el cuerpo) depende de por qué camino ha sido realizado, mientras que el cambio de la energía interna dU no depende en qué forma se realizó el cambio de estado. Pero si las mismas cantidades de calor Q0, entregado al cuerpo por el calentador a la temperatura T0 y Q1, entregado por el cuerpo al refrigerador a la temperatura T1, no son iguales entre sí, entonces, como vimos [véase la fórmula (80.11)], las relaciones entre estos calores y las temperaturas, a las cuales fueron absorbidos o entregados, numéricamente son iguales entre sí (pero tienen signo contrario) 1 1 0 0 T Q T Q · 94 La relación T Q se llama algunas veces, según Lorentz, calor reducido, de modo que la última ecuación habla sobre la igualdad de los calores reducidos, recibidos o entregados por el cuerpo de trabajo durante el proceso circular. Esta particularidad del calor permite introducir una magnitud termodinámica peculiar, la entropía, que tiene un valor fundamental en la Física. La importancia de esta magnitud se determina, como ahora será mostrado, con que es una función de estado y por aquel papel que juega en todos los procesos de la naturaleza y, en particular en el proceso de transformación del calor en trabajo. Cualquier cambio de estado del cuerpo o del sistema de cuerpos se puede representar, en caso general, como resultado de un número infinito de cambios pequeños. Durante cada uno do los cambios infinitamente pequeños de estado del sistema o bien se absorbe, o bien se segrega una cantidad infinitamente pequeña de calor dQ (si el proceso no es adiabático). Pongámonos de acuerdo en considerar dQ positivo, cuando el sistema absorbe calor, y negativo, cuando lo segrega. Se puede mostrar que si el sistema a consecuencia de cualquier cambio de estado pasó reversiblemente del estado A al estado B, entonces, la suma de las cantidades do calor reducido, es decir, la magnitud ∫ B A T dQ no depende del camino, por el cual se realizó el paso de A a B. Para esto es suficiente mostrar que durante el proceso circular, cuando coinciden el estado inicial y final, esta integral es igual a cero ∫ · 0 T dQ Demostremos, al principio, que durante cualquier proceso circular ∫ T dQ (84.1) No puede ser una magnitud positiva. Supongamos que un cuerpo M, determinado como resultado de cualesquiera cambios, vuelve a su estado inicial, es decir, realiza un proceso circular. Durante el proceso el cuerpo entregó y absorbió calor. Supongámonos que el calor segregado por el cuerpo M se transmite a un determinado depósito térmico (cuerpo de gran capacidad calorífica) cuya temperatura es igual a T0. Esta transmisión se puede realizar de forma reversible, por ejemplo, con ayuda de un cuerpo intermedio, que realiza el proceso circular de Carnot, de modo que el cuerpo M servirá de calentador para el cuerpo intermedio y el depósito servirá de refrigerador. Como ya se vio al examinar el ciclo de Carnot, la cantidad de calor dQ, quitado del cuerpo M a la temperatura T y la cantidad dQ' de calor cedido al depósito que se encuentra a la temperatura T0 no son iguales entre sí, pero sí lo son las relaciones T dQ y T dQ´ . De aquí se deduce que dQ T T dQ 0 ´· (84.2) Si T0 < T, el depósito cumplirá el papel de refrigerador y el cuerpo M de calentador. Si, por el contrario, T0 > T el depósito y el cuerpo M cambian sus papeles. 95 Después de que ha sido realizado el proceso circular por el cuerpo M, la cantidad total de calor, perdido por el cuerpo, deberá ser igual, como esto se ve de (84.2), a ∫ T dQ T 0 , O bien, ya que la capacidad calorífica del depósito es muy grande y por eso su temperatura queda constante, esta magnitud será igual a: ∫ T dQ T 0 El proceso realizado por el cuerpo es circular. Por eso, él al fin y al cabo no sufrió ningún cambio. El cuerpo intermedio también realizó un proceso circular. Es decir, en él tampoco ocurrió ningún cambio. Si resultara ser positiva la integral (84.1), entonces esto significaría que la cantidad de calor perdida por el cuerpo igual a ∫ T dQ T 0 , se transformó completamente en trabajo, mientras que ni el cuerpo M ni el cuerpo intermedio no cambiaron sus estados. Pero esto, según el principio de Thompson, es imposible. Es decir, la suposición de que ∫ > 0 T dQ no es posible. Se puede ver fácilmente que la integral (84.1) tampoco puede ser negativa. En efecto, si realizamos en sentido inverso todos los cambios de estado, entonces, cada cantidad de calor cambia su signo y si durante el proceso directo ∫ < 0 T dQ , durante el proceso inverso esta integral se hará positiva, lo que es imposible como acabamos de ver. Es decir, esta integral tampoco puede ser negativa. Pero si ella no puede ser ni positiva, ni negativa, esto significa, que para los procesos circulares reversibles que examinamos aquí ∫ · 0 T dQ (84.3) [La ecuación (82.3) es un caso particular de esta ecuación]. Esto a su tiempo significa, que durante cualquier proceso reversible no circular el valor de ∫ T dQ no depende del camino por el cual ge realiza el proceso. Esto nos da derecho a afirmar que existe una determinada magnitud, que designaremos por S, que es función de estado del sistema, cuyo cambio SB — SA durante el paso reversible del sistema desde el estado A al estado B es igual a: ∫ · − B A A B T dQ S S (84.4) La igualdad (84.4) permite determinar no el valor absoluto de la función correspondiente al estado dado, sino solamente su cambio durante el paso de un estado a otro. Pero, como siempre se hace en estos casos, se puede elegir un estado determinado, al cual se lo adjudica el valor S igual a cero, y con él se comparan todos los demás estados. Por eso, en lo sucesivo consideraremos que la función S es precisamente igual a la integral (84,1): ∫ · T dQ S (84.5) La magnitud S determinada de este modo se llama entropía. En la práctica siempre es necesario conocer no la propia magnitud S, sino sólo su cambio durante el cambio 96 de estado del sistema. Por eso, es indiferente, a qué estado precisamente se le adjudica la entropía cero. Está admitido (y para ello existe el fundamento suficiente) en considerar, que para el cero absoluto de temperatura la entropía es igual a cero. Esto significa, que para hallar la entropía del sistema en el estado dado, es necesario trasladarlo (esto se puede hacer mentalmente) desde este estado al estado cero por cualquier camino reversible (indiferente por cuál, precisamente) y hallar el valor de ∫ T dQ a lo largo de este camino. Por supuesto, la propia entropía del sistema no depende de si será o no realizado en realidad este proceso reversible. Lo mismo se refiere al cambio de entropía. De acuerdo a (84.4), para determinar la diferencia entre los valores de la entropía del sistema en dos de sus estados (equilibrados) A y B, es necesario llevar el sistema por cualquier proceso reversible desde el estado A al estado B y calcular el valor de ∫ B A T dQ para tal proceso. El cambio de entropía del sistema, al cual se le comunicó una cantidad infinitamente pequeña de calor dQ evidentemente, se determina por la relación T dQ dS · (84.6) En sentido matemático esta igualdad es interesante porque la magnitud dQ, que no es un diferencial total, ya que Q no es función de estado, sin embargo, se hace una diferencial total después de la división por T. La magnitud 1/T, de tal modo, es el factor de integración para dQ. La temperatura se puede determinar, desde el punto de vista formal matemático, como una magnitud cuyo valor inverso es el factor de integración para dQ. Utilizando la ecuación (84.6) y recordando que dQ = dU + dA (primer principio de la Termodinámica) obtenemos: dA dU TdS + · (84.7) Esta igualdad lleva el nombre de identidad termodinámica. A esta la llaman frecuentemente segundo principio de la Termodinámica, para los procesos reversibles. Propiamente hablando, el segundo principio de la Termodinámica para los procesos reversibles consiste en que el sistema puede ser caracterizado por la función de estado, por la entropía, determinada por las ecuaciones (84.6) o (84.7). Más adelante será aclarado el sentido físico profundo de esta función. Si el proceso circular sufrido por el sistema es irreversible, entonces, ∫ < 0 T dQ (84.8) Esta desigualdad se llama desigualdad de Clausius. Para el caso particular del ciclo irreversible de Carnot, ya nos cercioramos [véase (82.2)] de que la suma de los calores reducidos es 0 2 2 1 1 < + T Q T Q 97 La desigualdad (84.8) es una generalización de esto para cualquier sistema. Para una demostración rigurosa de esta desigualdad invitamos al lector a dirigirse a los cursos especiales de la Termodinámica. En la misma medida, la ecuación (84.3) es una generalización de (82.3). 85. ALGUNAS RELACIONES TERMODINÁMICAS La entropía , siendo una función de estado del cuerpo o del sistema de cuerpos, puede servir de tal parámetro de estado del cuerpo (por ejemplo, del gas) como las magnitudes ya conocidas: la temperatura T, la presión p, y el volumen V. De modo semejante, como cualquiera de estas magnitudes es función de las otras dos, así la entropía puede ser expresada a través de dos cualesquiera de los parámetros p, V y T. mostraremos cómo se puede haces esto. Esto es tanto más importante, ya que la entropía no se puede medir directamente en la experiencia de modo semejante a al temperatura, el volumen o la presión. Volvamos a escribir la ecuación (84.7) teniendo en cuenta que dA=p dV, y obtenemos: T pdV dU dS + · o bien, pdV TdS dU − · (85.1) Dos cualesquiera de las cuatro magnitudes T, S, P, V que figuran en esta ecuación, pueden ser elegidas en calidad de variables independientes, a través de las cuales se expresan las restantes. Se sabe del curso de análisis matemático que, si x e y son las variables independientes de la función U (x, y), y dU su diferencial total, entonces, dy y U dx x U dU ∂ ∂ + ∂ ∂ · y x dy U y dx U ∂ ∂ · ∂ ∂ 2 2 Realizando una integración doble de (85.1) obtenenos: x V y p y V x p x S y T y S x T ∂ ∂ ∂ ∂ − ∂ ∂ ∂ ∂ · ∂ ∂ ∂ ∂ − ∂ ∂ ∂ ∂ (85.2) En lugar de x e y se puede poner en esta igualdad dos cualesquiera de las cuatro magnitudes T, S, P, V. supongamos, por ejemplo, que el estado del sistema cambia a causa del cambio de volumen en dV y de la temperatura en dT; calculemos el cambio de la entropía dS condicionado por este fenómeno. Esto significa que en la igualdad (85.2) en lugar de x e y debemos poner, correspondientemente, x = V e y = T, es decir, V V T p T V V p V S T T T S V T ∂ ∂ ∂ ∂ − ∂ ∂ ∂ ∂ · ∂ ∂ ∂ ∂ − ∂ ∂ ∂ ∂ , Pero si T y V son variables independientes, entonces, 0 · ∂ ∂ · ∂ ∂ T V V T y, por consiguiente, tenemos 98 V T T p V S , ` . | ∂ ∂ · , ` . | ∂ ∂ (85.3) Además de esto, tendremos en cuenta que dS es una diferencial total: dV V S dT T S dS T V , ` . | ∂ ∂ + , ` . | ∂ ∂ · (85.4) La última igualdad significa que el aumento toral de la entropía se compone del aumento de entropía, originado separadamente por el aumento de la temperatura y por el aumento del volumen. De (85.3) y (85.4) se deduce que dV T p dT T S dS V V , ` . | ∂ ∂ + , ` . | ∂ ∂ · (85.5) El primer término del segundo miembro de (85.5) representa en sí el cambio de entropía (dS)V, originado sólo por el cambio de temperatura para un volumen invariable (dV = 0). De acuerdo a la definición [véase (84.6)]. ( ) T dQ dS V V · ) ( Donde CV es la capacidad calorífica del cuerpo para volumen constante, por consiguiente, dT T C dT T S V V · , ` . | ∂ ∂ , y finalmente, dV T p dT T C dS V V , ` . | ∂ ∂ + · (85.6) De tal modo, nosotros expresamos dS a través de las magnitudes que se miden en la experiencia p, V, T y CV. Exactamente, del mismo modo, se puede expresar el cambio de la entropía dS a través del cambio de temperatura dT y de la presión dp, es decir, eligiendo a T y p como variables independientes. Para ello es necesario poner en la ecuación (85.2) a T y p en lugar de x e y. Obtenemos: T V p p p V T p T S p T p S T T ∂ ∂ ∂ ∂ − ∂ ∂ ∂ ∂ · ∂ ∂ ∂ ∂ − ∂ ∂ ∂ ∂ Pero 0 · ∂ ∂ · ∂ ∂ T p p T , ya que T y p son las variables independientes. Como resultado, se obtiene una ecuación análoga a (85.3) p T T V p S , ` . | ∂ ∂ − · , ` . | ∂ ∂ , (85.7) 99 y, correspondientemente, por analogía con (85.6) dp T V dT T C dS p p , ` . | ∂ ∂ − · (85.8) Integrando (85.6) y (85.8), se puede calcular la entropía S (V, T) de la masa dada (por ejemplo, de 1 mol) de substancia para los valores dados del volumen V y de temperatura T, o la entropía S (p, T) para los valores dados de presión p y de temperatura T si son conocidos los valores de la entropía S(V0, T0) y S(p0,T0) para cualesquiera otros valores de estos parámetros V0 y T0, o p0 y T0. Es evidente, que ∫ ∫ , ` . | ∂ ∂ − · − 0 0 , 0 0 , , , 0 0 ) , ( ) , ( V T V T V T V T V V dV T p T dT C T V S T V S y ∫ ∫ , ` . | ∂ ∂ − · − T p T p T p T p p p dp T V T dT C T p S T p S , , , , 0 0 0 , 0 0 0 ) , ( ) , ( En particular, para 1 mol de un gas ideal ∫ · T T V V T T C T dT C 0 0 ln , ∫ · , ` . | ∂ ∂ V V V V V R dV T p 0 0 ln , ya que V R T p V · , ` . | ∂ ∂ Obtenemos: 0 0 0 , 0 ln ln ) ( ) , ( V V R T T C T V S T V S S V + · − · ∆ De la última expresión, en particular, se ve que la entropía crece tanto con el aumento del volumen del gas, como también con el aumento de la temperatura. Así, pues, si el gas ideal se dilata isotérmicamente, es decir, T = T0, entonces, el cambio de entropía es 0 ln V V R S · ∆ (85.9) Dependencia de la energía interna del volumen. Ya hemos llamado la atención de que la energía interna de los gases ideales depende no sólo de la temperatura T, sino también del volumen V (densidad) del cuerpo: ) , ( V T f U · , También se indicó que el cambio de energía interna originado por el cambio de volumen a temperatura constante, se determina por la ecuación 100 p T p T V U V T − , ` . | ∂ ∂ · , ` . | ∂ ∂ Utilizando ahora la relación termodinámica obtenida podemos deducir esta ecuación importante. Para ello utilizamos de nuevo la identidad termodinámica (84.7) en la forma: pdV T dU T T pdV dU dS 1 1 + · + · Del hecho de que dU es una diferencial total, se deduce que dT T U dV V U dU V T , ` . | ∂ ∂ + , ` . | ∂ ∂ · , es decir, el cambio total de la energía interna del sistema se compone de su cambio originado separadamente, por el cambio de volumen T V U , ` . | dV y por la variación de la temperatura dT V U V , ` . | . De aquí a su vez se deduce que dT T U T dV p V U T dS V T , ` . | ∂ ∂ + ] ] ] + , ` . | ∂ ∂ · 1 1 Comparando con ésta la igualdad obtenida anteriormente, (85.5): dT T S dV T p dS V V , ` . | ∂ ∂ + , ` . | ∂ ∂ · De la comparación de los coeficientes de dV en ambas igualdades se hace evidente que V T T p p V U T , ` . | ∂ ∂ · ] ] ] + , ` . | ∂ ∂ 1 , De donde se obtiene la expresión que nos interesaba: p T p T V U V T − , ` . | ∂ ∂ · , ` . | ∂ ∂ (85.10) Es útil observar que la expresión V T p T , ` . | ∂ ∂ no es otra cosa que dV dQ , es decir, la cantidad de calor, que corresponde a la unidad del cambio de volumen, que es necesario al cuerpo para que crezca su volumen, pero con ello quede constante la temperatura. Para el gas ideal. 101 p T p T V · , ` . | ∂ ∂ y por eso, 0 · , ` . | ∂ ∂ T V U Empleemos (85.10) para calcular la energía interna del gas, cuyo estado se describe por la ecuación de Van der Waals 2 V a b V RT p − − · . En este caso, como se ve fácilmente b V RT T p T V − · , ` . | ∂ ∂ y 2 V a V U T · , ` . | ∂ ∂ , de donde dV V a dT C dV V U dT T U dU V T V 2 + · , ` . | ∂ ∂ + , ` . | ∂ ∂ · y, por consiguiente, ∫ ∫ + − · + · B V a T C dV V a dT C U V V 2 , Donde B es la constante de integración. Su valor se puede determinar de la condición que para ∞ → V , es decir, cuando el gas se enrarece infinitamente, él debe poseer las propiedades del gas ideal, para el cual RT i T C U V 2 · · , (i es el número de grados de libertad de la molécula del gas). Pero esto significa que B = 0 y la energía interna del gas de Van der Waals es V a T C U V − · . De aquí se deduce que la energía interna de tal gas se compone de la energía cinética de las moléculas (CVT), condicionada por las fuerzas de interacción de las moléculas. Es claro que la energía potencial disminuye en su valor numérico con el aumento de la distancia entre las moléculas (porque con ello disminuyen las fuerzas de interacción), es decir, con el aumento del volumen ocupado por el gas. 3.13. ENTROPIA DURANTE LOS PROCESOS REVERSIBLES EN UN SISTEMA CERRADO 102 Si en cualquier sistema ocurre un proceso adiabático, esto significa que nuestro sistema es cerrado. Es cerrado en el sentido de que está aislado de las fuentes externas de calor, tanto de las que le entregan calor, como de las que absorben calor. Evidentemente, que si el proceso de cambio de estado es reversible en tal sistema, entonces el cambio de entropía será igual a cero, ya que en la igualdad T dQ dS · la magnitud dQ es igual a cero. Durante el cambio adiabático del estado del sistema cerrado, su entropía queda invariable. Verdaderamente los cuerpos externos con relación al sistema pueden realizar un trabajo sobre tal sistema y el propio sistema puede realizar trabajo sobre los cuerpos externos. En este sentido el sistema no es cerrado. Pero si incluimos estos cuerpos en nuestro sistema, entonces la variación de entropía en tal sistema ya completamente cerrado queda igual a cero como antes, por que los cambios de estado de los cuerpos que realizan trabajo, o de los cuerpos, sobre los cuales son solo partes mecánicas de nuestro sistema. Pero se puede demostrar que para cualquier cambio reversible de estado del sistema cerrado, la entropía no varía. En efecto, supongamos que un cuerpo cualquiera, capaz de dilatarse o comprimirse, de intercambiar el calor con las fuentes de calor, recibe calor de unas fuentes y entrega calor a otras, Supongamos también que sobre el cuerpo se realiza un trabajo o el propio bajo o sobre los cuales se realiza un trabajo, fuentes de trabajo. Examinemos el sistema cerrado, incluyendo también los cuerpos y las fuentes de calor y las fuentes de trabajo. Supongamos que el estado del cuerpo cambia reversiblemente debido a que él intercambia calor con la fuente de calor y debido también a que él realiza trabajo o sobre él se realiza trabajo. La realización de trabajo (de cualquier signo) como acabamos de ver, no conduce a cualquier cambio de entropía. La entropía sólo cambia durante el intercambio de calor entre el cuerpo y la s fuentes de calor. Si el cuerpo, por ejemplo, recibió calor de la fuente, que designamos por dQcuer, entonces su entropía se cambia en la magnitud , T dQ cuer donde T es la temperatura del cuerpo. Pero con esto la fuente perdió la misma cantidad de calor, Si designamos por fuen dQ a la cantidad de calor perdido, entonces, es evidente que fuen cuer dQ dQ − · . Con esto, la entropía de la fuente de calor varía en la magnitud T dQ fuen − , donde T es la temperatura de la fuente. Ya que el proceso de intercambio de calor es reversible, entonces la temperatura del cuerpo deberá ser igual a la temperatura de la fuente. De otro modo ocurrirá el proceso irreversible de conductibilidad científica. Por eso, está claro que T dQ T dQ fuen cuer − · ó fuen cuer dS dS − · La variación total de la entropía dS de todo el sistema cerrado será igual a cero 0 · + · fuen cuer dS dS dS Por consiguiente, la entropía del sistema cerrado durante cualquier proceso reversible queda invariable en él. 3.14. SEGUNDO PRINCIPIO DE LA TERMODINÁMICA Y TRANSFORMACIÓN DEL CALOR EN TRABAJO 103 Cuando la energía mecánica se transforma en calor, este proceso se desarrolla muy sencillamente: toda la energía mecánica se transforma por completo en calor, y para saber cuántas caloráis se obtienen durante tal transformación, es suficiente multiplicar el número de Julios por 0,239 (equivalente térmico del trabajo mecánico). Entonces, el rendimiento siempre será igual a la unidad. El proceso inverso de obtención de trabajo mecánico a cuenta del calor, coma ya vimos en el 80(pag315), es mucho más complicado. Sobre la máquina térmica descrita en este apartado, que trabaja según el ciclo de Carnot, se dijo que era la mejor de las máquinas térmicas imaginables, y que ninguna otra máquina para tales condiciones de temperatura podía dar mayor cantidad de trabajo. A pesar de ello, incluso en esta mejor máquina, el rendimiento siempre será menos que la unidad y en muchos casos es sorprendentemente pequeño. Si la temperatura T0 del calentador, pro ejemplo, es igual a 373 K (temperatura de ebullición del agua), y la del refrigerador es 293 1 · T K (temperatura ambiente), entonces, el rendimiento de la máquina ideal de Carnot 0 1 1 T T − · η es igual en total a 22%. ¡Y este rendimiento es un límite (inaccesible) superior! En las máquinas reales, como, por ejemplo, en las locomotoras, los rendimientos establecidos raramente superan el 10%. De tal modo, la posibilidad de la obtención continua (cíclica) de trabajo a cuenta del calor está limitada de un modo determinado, en el sentido de que el calor, tomado de la fuente, no puede ser transformado completamente en trabajo. La posibilidad de obtener trabajo a cuenta del calor se paga, hablando en general, a un precio elevado, en forma de calor perdido, inútilmente entregado al refrigerador. Es fácil cerciorarse de que, precisamente, el segundo principio de la Termodinámica impone estas limitaciones. Supongamos que se tiene una vasija con un gas ideal. Admitamos, al principio, que no actúa el segundo principio de la Termodinámica. Esto significa que las moléculas del gas pueden distribuirse por todo el volumen de la vasija, pero también pueden reunirse en cualquier parte pequeña de él (esto no lo impiden ni las leyes de la Mecánica ni el primer principio de la Termodinámica). Aprovechando el momento cuando el gas se acumule por sí mismo en una parte del volumen de la vasija, y de tal modo resulta estar comprimido, lo podemos separa de la parte restante de la vasija con una pared en forma de émbolo. Luego, dejando dilatarse el gas, lo obligamos a realizar el trabajo de desplazamiento del émbolo. Para que el gas no se enfríe, aseguramos el contacto térmico con el medio ambiente, del cual puede extraerse calor (por consiguiente, será una dilatación isotérmica). Después de esto, cuando el gas realizó el trabajo por primera vez, se puede esperar hasta que se reúna de nuevo en aquella parte de la vasija (nuestra espera no debe ser inútil, si el segundo principio de la Termodinámica no actúa como suponíamos) y de nuevo le damos la posibilidad de dilatarse y producir trabajo. Tales ciclos se pueden repetir tantas veces como se quiera. Esto significa que sobre este principio se pueden construir máquinas de acción cíclica, cuyo único resultado de su acción es la producción de trabajo y el enfriamiento del depósito térmico, es decir, en esencia, es un <<perpetuum mobile>>. Pero este motor no contradice a la ley de conservación de la energía. El trabajo se realiza no de la <nada> sino a cuenta del calor que el gas toma del medio ambiente. Ya que las reservas de energía de la atmósfera, de las aguas de los mares y océanos de la 104 corteza terrestre se pueden considerar inagotables, tal máquina, prácticamente, no se distinguiría del motor eterno. La máquina térmica hipotética, descrita, cuya acción consiste sólo en que con ella se realiza el trabajo mecánico a cuenta del calor, se llama, perpetuum mobile de segundo género, a diferencia del perpetuum mobile de primer género; en el cual, en contradicción con la ley de conservación de la energía, se crea más trabajo que la energía gastada. El rendimiento de esta máquina sería igual a la unidad, puesto que durante el proceso de dilatación isotérmica del gas ideal . dQ dA · Sin embargo, en realidad, tal máquina no puede actuar, ya que inútilmente esperaremos que las moléculas de un gas se reúnan por sí mismas en una parte del volumen de la vasija: un tal auto concentración de las moléculas va acompañada de una disminución de la entropía y. por eso, es imposible. Observemos que aquí se trata de la imposibilidad de la máquina cíclica, que repite constantemente el proceso de transformación del calor en trabajo. Esto es muy importante porque es completamente posible la transformación unitaria, ella no contradice ni al primero, ni al segundo principio de la Termodinámica. Algunas veces también se formula el segundo principio de la Termodinámica en forma de afirmación sobre la imposibilidad del motor eterno de segundo género, semejante a como se puede expresar el primer principio en forma de afirmación sobre la imposibilidad del motor eterno de primer género. El segundo principio de la Termodinámica también da contestación a al pregunta sobre qué se necesita para que pueda actuar la máquina térmica cíclica. Nosotros no podemos quitar sencillamente calor de la fuente (calentador) con ayuda del cuerpo de trabajo y transformar este calor en trabajo, porque este proceso va acompañado con una disminución de la entropía del calentador (el cuerpo de trabajo realiza un proceso circular, y su entropía queda constante). Es decir, es necesario tener un sistema compuesto no de dos cuerpos, calentador y cuerpo de trabajo, sino de tres, y precisamente el papel del tercero deberá consistir en aumentar su entropía, por lo menos en aquella magnitud, en la que disminuye la entropía, por lo menos en aquella magnitud, en la que disminuye la entropía del calentador como resultado de haberle quitado calor , ` . | · T dQ dS . Para que aumente la entropía del tercer cuerpo, hay que entregarle parte del calor tomado del calentador, Este tercer cuerpo es el refrigerador. Ya que su temperatura es inferior, entonces, hay que entregarle menos calor que el quitado del calentador, de modo que parte de este calor se puede transformar en trabajo. En estas condiciones la entropía del sistema <<calentador cuerpo de trabajo – refrigerador>> queda constante, lo que ya es permisible por el segundo principio de la Termodinámica, que sólo prohíbe los procesos con disminución de entropía. De aquí se deduce que es imposible, por principio, transformar en trabajo todo el calor recibido del calentador por el cuerpo de trabajo con ayuda de una máquina de acción cíclica. Parte de calor irremisiblemente se debe entregar al refrigerador. Este es aquel precio que hay que pagar para que la otra parte de calor se transforme en trabajo. Aquí hemos examinado el caso, cuando al refrigerador se le comunica tal cantidad de calor que aumenta su entropía en tanto, que compensa la disminución de entropía del calentador. Está claro, que ésta es aquella cantidad mínima de calor perdido, sin la cual en general, la máquina no puede trabajar. Con ello, la entropía queda constante y se transforma en trabajo la máxima parte del calor recibido del calentador, de modo que el rendimiento será el máximo. Ya sabemos, que la constancia de la entropía corresponde al proceso reversible. He aquí el porqué la máquina ideal con el máximo rendimiento deberá ser reversible. Precisamente por 105 esto, durante la descripción del ciclo de Carnot dirigimos la atención a las circunstancia de que durante su realización no se realicen los procesos irreversible de conducción calorífica, y las dilataciones y compresiones se realicen por n camino reversible. En realidad, no es posible asegurar en la máquina real el proceso reversible completo en todos los estadios del ciclo. Por eso, la entropía no quedará constante sino crecerá. Esto a su vez significa que en la máquina real hay que entregar al refrigerador más calor que el determinado por la igualdad 1 1 0 0 T Q T Q · . Por consiguiente, en este caso una parte mayor de calor que en la máquina reversible recibido del calentador queda inaccesible para su transformación en trabajo, y el rendimiento de la máquina será menor que el rendimiento calculado para el ciclo reversible de Carnot. En general, el aumento de entropía significa que el calor se hace menos accesible para su transformación en trabajo mecánico. Esto se ve fácilmente en el siguiente cálculo. Imaginémonos a una fuente de calor con temperatura 1 T , que entrega una cantidad de calor Q al cuerpo de trabajo. Si la temperatura del refrigerador es 0 T , entonces, la cantidad de calor 0 Q entregado a él se determina de la igualdad: 0 0 1 T Q T Q · de donde 1 0 0 T T Q Q · La cantidad de calor que con ello se puede transformar en trabajo es igual a: , ` . | − · − 1 0 0 1 T T Q Q Q . Si tomamos otro calentador con temperatura 2 T y le cogemos la misma cantidad de calor Q, entonces, hay que entregar al refrigerador (con la temperatura anterior 0 T ) una cantidad e calor Q0 , determinada por la igualdad 0 0 2 ´ T Q T Q · , de donde , ` . | − · − 2 0 0 1 ´ T T Q Q Q , y en este caso se puede transformar en trabajo una cantidad de calor igual a: , ` . | − · − 2 0 0 1 ´ T T Q Q Q De aquí se deduce, que si la cantidad de calor Q, pasa del cuerpo con temperatura 1 T al cuerpo con temperatura 2 T entonces, la <capacidad de trabajo> del calor (es decir, la magnitud de aquella parte suya que puede ser transformada en trabajo) se cambia en la magnitud 106 0 2 1 1 0 2 0 1 1 1 1 T T T Q T T Q T T Q , ` . | − · , ` . | − − , ` . | − (88.1) De acuerdo con la fórmula 87.1, la expresión , ` . | − 2 1 1 1 T T Q es igual, al aumento de entropía tomado con signo contrario, durante el paso del calor del cuerpo con temperatura 1 T al cuerpo con temperatura ( ) 2 1 2 T T T > . Por consiguiente, el cambio de la <<capacidad de trabajo>> del calor durante su paso de un cuerpo a otro se determina por el cambio de entropía durante tal paso. De la fórmula (88.1) se ve que el crecimiento de entropía conduce a la disminución de la accesibilidad del calor para su transformación en trabajo. El crecimiento de la entropía nos conduce a la desvalorización de la energía térmica, a la reducción de la posibilidad de obtener trabajo a cuenta de él. Desde este punto de vista, se puede considerar al segundo principio de la Termodinámica como la afirmación de que, en cualquier sistema cerrado cualquier proceso (irreversible) se desarrolla de tal modo, que la cantidad de energía capaz de transformarse en trabajo disminuyen tendiendo a cero durante el equilibrio. Por eso, está claro que a la entropía también va ligada la energía libre que introducimos anteriormente, que representa en sí aquella parte de energía que, durante el proceso isotérmico (dT=0); puede ser transformada en trabajo mecánico. Escribamos la ecuación de la ley de conservación de la energía dA dU dQ + · Ya que , T dQ dS · entonces, , TdS dQ · y nuestra ecuación toma la forma: dU = T dS – dA (88.2) De la ecuación (88.2) se deduce que -dA = dU – T dS = d (U – TS), o bien, dA = - d (U – TS) (ya que T = const, entonces, S dT = 0) La última igualdad indica que el trabajo dA, durante el proceso isotérmico, es igual al cambio de una función determinada U – TS. Ella representa en sí, evidentemente la energía libre del sistema F: F = U – TS La energía libre, es decir, la energía capaz de dar un trabajo mecánico, por consiguiente, es igual a la energía interna U con descuento de la magnitud TS. Claro está que TS representa en sí aquella parte de energía que no puede ser transformada en trabajo, y es algunas veces la llaman por eso energía ligada. La magnitud situada en la parte derecha de la ecuación (88.1) precisamente representa Ens. El cambio de la energía ligada . 0 S T ∆ El es igual al cambio de la <capacidad de trabajo> de la energía térmica. 3.15. SENTIDO FISICO DE LA ENTROPIA. ENTROPIA Y PROBABILIDAD El segundo principio de la Termodinámica establece, que los procesos irreversibles (y tales procesos son, prácticamente, todos los procesos térmicos, y en 107 cualquier caso todos los procesos que se desarrollan naturalmente) marcha de tal forma, que crece la entropía del sistema de cuerpos participantes en el proceso, tendiendo a un valor máximo. El valor máximo de la entropía se consigue cuando el sistema pasa al estado de equilibrio. Entre tanto, vimos que la misma irreversibilidad de los procesos térmicos está ligada con que el paso al estado de equilibrio es, extremadamente, más probable en comparación con todos los demás pasos. Por eso, sólo se observan aquellos cambios de estado, durante los cuales el sistema pasa de un estado menos probable al más probable. Salta a la vista la semejanza en la conducta de ambas magnitudes, de la entropía y la probabilidad: ambas crecen durante el paso al equilibrio. Por eso. Es natural ligar la entropía del sistema en tal o cual estado con la probabilidad de ese estado. Esta ligazón fue descubierta por L. Boltzman. Ante todo, es necesario determinar más exactamente el concepto de probabilidad del estado. Esto se hace lo más fácilmente, si nos dirigimos de nuevo al ejemplo de la distribución de las partículas de gas en el volumen de la vasija. Imaginémonos una vasija dividida en dos partes y supongamos que en esta vasija se encuentran seis moléculas, por ejemplo, a cada una de las cuales le adjudicamos un número determinado, por el cual se pueden <distinguir> una de otra. Es fácil cerciorarse con un cálculo sencillo de que estas seis moléculas pueden mezclarse en ambas mitades de la vasija de 64 modos distintos. A cada uno de ellos le corresponde un determinado estado del sistema. Por ejemplo, el estado, durante el cual se encuentra 1 molécula en la parte izquierda de la vasija y 5 en la parte derecha, se diferencia del estado, durante el cual en la parte derecha se encontrarán dos moléculas y en la izquierda 4. Examinemos ¿de cuántos modos de distribución, entre el número total de ellos, se realiza cada estado de nuestro sistema? No es difícil calcular, por ejemplo, que sólo una distribución de tal estado, en el cual no hay ni una molécula en la parte izquierda de la vasija. El estado <a la izquierda 1 a la derecha 5> se realiza de seis modos, el estado <a la izquierda 2 a la derecha 4 > se realiza de quince modos. Con el mayor número de modos de distribución se realiza aquel estado, en el cual, a la derecha y a la izquierda, se encuentran tres moléculas, es decir, con una distribución uniforme de moléculas en ambas mitades de la vasija. Se puede mostrar, en general, que si en la vasija se encuentran N moléculas y están numeradas, entonces, entre las dos mitades de la vasija se les puede distribuir de N 2 modos. De este número total de distribuciones distintas, el número Z de distribuciones durante las cuales en una mitad se encuentran n moléculas y en la otra N - n moléculas, se determina por la igualdad )! ( ! ! n N n N Z − · (en este caso el número 0! Se considera igual a 1). Nos podemos fácilmente convencer de que para cualquier número N el valor de Z será el máximo, cuando 2 N n · , es decir, la distribución uniforme de las moléculas en el volumen de la vasija se realiza del mayor número de modos. Por supuesto, se obtiene el mismo resultado si dividimos la vasija no en dos, sino en un número arbitrario de partes. De aquí se puede pasar fácilmente a la probabilidad de esta o aquella distribución de las partículas entre ambas mitades de la vasija. Si en el ejemplo examinado por nosotros con 6 moléculas el número total de modos de distribución de las moléculas era igual a 64 y 6 de ellas no conducen al estado, en el cual en la parte izquierda de la vasija se encuentra una molécula, entonces, es evidente que la probabilidad de este estado es igual a 6/64. La probabilidad de la distribución 108 uniforme será igual a 20/64. En general, la probabilidad de W de que en la parte izquierda de la vasija se encuentren n de las N partículas será igual a: N n N n N W 2 )! ( ! ! − · Está claro que la probabilidad W tiene un máximo para 2 N n · . Para un gran número N de partículas, el número de modos, para los cuales se realiza la distribución uniforme de las partículas en el volumen de la vasija, será la mayoría aplastante, en comparación con cualquiera de las distribuciones no uniformes, En la marcha de los movimientos térmicos, ininterrumpidos, caóticos de las moléculas, el gas se puede hallar en cualquiera de los estados imaginables, pero, ciertamente, en la mayoría aplastante de los casos, lo hallamos en el estado en que se realiza por el mayor número de distribuciones, es decir, en el estado de la distribución uniforme. Este es el estado de equilibrio. Y si el gas por cualquier causa no se encuentra en equilibrio, entonces, dejándolo a su albedrío, indispensablemente pasará a este estado. De tal modo, se puede caracterizar cada estado del sistema no sólo por su probabilidad matemática W determinada por la igualdad , ` N V V W , ` . | · Que expusimos en el 76, sino también por el número de modos, en los cuales se realiza este estado. Esta última magnitud se llama probabilidad termodinámica. Está claro, que ambas probabilidades están ligadas una con otra. Pero a diferencia de W, que siempre es menor que la unidad, la probabilidad termodinámica que designaremos por w se expresa por números grandes. Con la magnitud de probabilidad termodinámica puede estar ligada la entropía, ya que una y otra tienen el valor máximo en el estado de equilibrio, y el paso de cualquier sistema al equilibrio va acompañado con el crecimiento y de la entropía y de la probabilidad termodinámica. Por causas que aquí no vamos a exponer, Boltzmann ligó la entropía S y la probabilidad termodinámica W con la relación: 0 ln w w k S · , Donde k es la constante de Boltzmann que ya conocemos. La fórmula anterior se puede escribir también así: S = k ln w – K ln w0 = k ln w – S0 La magnitud S0 = k ln w0 Se puede tomar como origen de medidas de la entropía. Entonces, la entropía contada desde este origen se expresan por la igualdad S = k ln w Algunas veces la probabilidad termodinámica de que un sistema se encuentre en el estado dado se determina de otro modo, cuya idea se puede aclarar con el siguiente ejemplo. 109 Vimos que la probabilidad del tal estado, durante el cual el gas, compuesto de N partículas, está concentrado en un una parte del volumen de la vasija m R V · ´ es igual a : N N N V V V V m W , ` . | · , ` . | · , ` . | · ´ ´ 1 1 Introduzcamos su magnitud inversa N V V W w , ` . | · · ´ 1 (89.3) Ella muestra en cuántas veces la probabilidad W es menor que la probabilidad de que el gas ocupe por completo todo el volumen de la vasija (esta probabilidad es igual a la unidad, ya que V´ compone una parte del volumen V). Si los valores W de la probabilidad matemática del estado del sistema molecular (para grandes valores de N) siempre son muy pequeños, los valores w de la probabilidad termodinámica, por el contrario, son muy grandes. El valor mínimo de w en nuestro ejemplo es igual a la unidad (cuando V´= V), mientras que para W la unidad es su valor máximo (también V´=V). La magnitud w determinada por la igualdad (89.3) se llama probabilidad termodinámica. Es evidente, que ambas definiciones de la probabilidad termodinámica expuestas no contradicen una a la otra. Escribamos la expresión 889.3) para un mol de sustancia w= No V V , ` . | ´ , donde No es el número de Avogadro. Ya que , 0 k R N · entonces, k R t V V w , ` . | · Tomando el logaritmo de esta igualdad, obtenemos: ln ´ ln V V k R w · , ó ´ ln ln V V R w k · . La magnitud situada a la izquierda de esta igualdad representa en sí la entropía, de acuerdo a la fórmula de Boltzmann. w k S ln · Supongamos que el mol de gas se dilata isotérmicamente, desde el volumen 1 ´ V V · hasta el volumen 2 ´ V V · . Escribamos la expresión de la entropía antes y después de la dilatación: ) ln (ln ln ), ln (ln ln 2 2 2 1 1 1 V V R w k S V V R w k S − · · − · · Restando una ecuación de la otra, obtenemos la magnitud del cambio de entropía como resultado de la dilatación: 110 . ln ln 1 2 2 1 1 2 V V R w w k S S S · · − · ∆ (89.4) Tal fórmula también la obtuvimos anteriormente (85.9). Se sabe que el trabajo de dilatación durante el proceso isotérmico es igual a: 1 2 ln V V RT A · Comparando esta expresión con (89.4) hallamos que . T A S · ∆ Por otra parte, según la ley de conservación de la energía, en el proceso isotérmico A= Q ∆ , de donde . T Q S ∆ · ∆ De tal modo obtenemos la misma expresión de S ∆ que obtuvimos del análisis del ciclo de Carnot. La ligazón entre la entropía y la probabilidad permite tratar de otro modo al segundo principio de la Termodinámica. El ahora significa que cualquier proceso de la naturaleza se desarrolla de tal modo que el sistema pasa al estado, cuya probabilidad es mayor. Junto con ello la afirmación contendida en el segundo principio pierde su carácter categórico. El hecho de que cada proceso que marcha por sí solo conducen al estado de mayor probabilidad, no significa que es imposible otra dirección del proceso. Como ya indicamos anteriormente, sólo significa que le paso al equilibrio es solamente más probable que la libre separación del estado de equilibrio. Por eso, de hecho el segundo principio es necesario comprenderlo de tal modo, que si el sistema se encuentra en cualquier estado con una entropía dada, será de esperar, con una probabilidad aplastante, que el sistema pasará a un estado de mayor entropía, es decir, que el cambio más probable de la entropía es su crecimiento. Por principio, son imaginables también los procesos que van acompañados de una disminución de entropía. Aquí es necesario recordar que las fluctuaciones, que hemos recordado más de una vez, representan en sí tales cambio de estado, que van acompañados de una disminución de entropía 8y, naturalmente, de probabilidad). Pero estas desviaciones pequeñas del estado de equilibrio no contradicen al segundo principio. Ellas son consecuencia inevitable, precisamente del carácter probable de la entropía. 3.16. ENTROPIA Y DESORDEN La energía calorífica del cuerpo es la energía del movimiento caótico desordenado de sus moléculas. Este caos del movimiento térmico de las moléculas se diferencia del movimiento mecánico macroscópico del cuerpo, en el cual sus moléculas componentes se mueven ordenadamente. Por ejemplo, durante el movimiento de traslación del cuerpo, todas sus moléculas se mueven con una misma velocidad, que se suma a la velocidad de s su movimiento térmico caótico. La transformación de la energía térmica en mecánica se reduce, por consiguiente, a la transformación del movimiento térmico caótico en movimiento ordenado. Por el contrario, transformar la energía mecánica en térmica, significa transformar la energía del orden en energía del desorden. No es difícil comprender que estos procesos, contrarios uno del otro no son equivalentes: es 111 incomparablemente más fácil transformar el movimiento ordenado en caótico, que producir la transformación contraria. Esto se aclara con el siguiente ejemplo. Imaginémonos una caja con bolas negra y blancas, dispuestas de tal modo que en cada mitad de la caja se encuentren las bolas de un color (fig 97.a). Ahora es suficiente sacudir unas cuantas veces la caja para que las bolas se mezclen en ella y se dispongan en completo desorden (fig. 97,b). La simple sacudida de la caja transformó el orden en la distribución de las bolas en desorden. Sin embargo, con estas sacudidas no se pueden llevar las bolas de nuevo al estado ordenado, para que en cada mitad de la caja de nuevo se encuentren las bolas de un color. Hablando en rigor, al repetir muchas veces las sacudidas, por principio, es posible que cualquier golpe de turno conduzca al establecimiento del orden. Pero este suceso casual, evidentemente, es extremadamente poco probable. Al desorden conducen, prácticamente, cada sacudida, al orden sólo una ente muchas. Esta irreversibilidad peculiar deberá manifestarse aún más fuertemente en cualquier sistema molecular, donde le número de moléculas es inmensurablemente mayor que el número de bolas en la caja. Los choques entre las moléculas <sacuden> al sistema y lo conducen a su desorden, incluso si en cualquier momento reinaba el orden en el sistema. Si dos partes de un cuerpo se encuentran, por ejemplo, con distintas temperaturas, entonces, tal estado es más ordenado, que el estado cuando su temperatura en todas partes se ha igualado como resultado de la conducción calorífica. Del mismo modo si en l vasija dividida por un tabique se encuentran dos gases distintos, tal estado del sistema es más ordenado que la mezcla de estos dos gases, etc. Cada proceso natural siempre se desarrolla de tal modo, que el sistema pasa a un estado con mayor desorden: las temperaturas de los cuerpos se igualan por sí mismas, los gases por sí mismos se mezclan, etc. La identidad ente el grado de desorden del sistema y su entropía es evidente. Por eso, es natural considerar a la entropía como medida de desorden del sistema. Teniendo presente la ligazón entre la entropía a la probabilidad del estado, se puede decir que el estado con mayor desorden se caracteriza por una probabilidad termodinámica mayor que el estado más ordenado. Con esto también está ligada la irreversibilidad de los procesos térmicos: ellos se desarrollan de modo que aumenta el desorden en el sistema. La irreversibilidad de los procesos térmicos es la irreversibilidad del orden y desorden. 112 Con ello también está ligado el hecho de que cualquier forma de energía pasa al fin y al cabo a calor, ya que la energía térmica es la energía de los movimientos desordenados, mientras que las demás formas de energía están ligadas con un movimiento más ordenado. Resumiendo todo lo dicho anteriormente sobre la entropía, formulemos una vez más sus propiedades fundamentales; La entropía es una función del estado del sistema. Para calcular la entropía del sistema en el estado dado con relación a cualquier estado tomado como cero, es necesario calcular el valor de ∫ T dQ para cualquier proceso reversible de su estado. La entropía crece en un sistema cerrado que cambia irreversiblemente del sistema. La entropía está ligada, directamente, con la probabilidad del estado. El crecimiento de la entropía del sistema pasa del estado menos probable al más probable. La entropía es la medida de desorden del sistema. El crecimiento de la entropía, durante el proceso irreversible, significa que la energía que poseía el sistema se hace menos accesible para su transformación en trabajo mecánico. En el estado de equilibrio, cuando la entropía ha alcanzado su valor máximo, en general, la energía del sistema no puede ser transformada en trabajo. 3.17. DIABLO DE MAXWELL A Maxwell le pertenece la idea del siguiente experimento mental que a primera vista está en contradicción con el segundo principio de la Termodinámica. Imaginémonos un determinado dispositivo capaz de sentir las moléculas por separado y lo colocamos en el orificio P de la que divide en dos partes a la vasija con gas (fig. 98). Supongamos que al comienzo la presión y la temperatura en ambas partes de la vasija son iguales. A pesar de esto, a consecuencia de sus movimientos térmicos caóticos, las moléculas pasan continuamente a través del orificio, tanto desde la derecha como de la izquierda, a través del orificio en la unidad de tiempo en ambas direcciones, no se cambian ni la presión, ni la temperatura en ambas partes de la vasija. Supongamos ahora, que el dispositivo recordado antes, que Maxwell lo llamó <diablo>, empieza a actuar de modo que deja pasar a un lado sólo las moléculas rápidas y al otro lado, sólo las lentas, Como resultado, después de un tiempo determinado en aquella mitad de la vasija donde el diablo dejaba pasar las partículas rápidas, la velocidad media de las moléculas resulta ser mayor que en la otra mitad. Esto significa que el gas se encuentra en un mitad de la vasija a una temperatura más alta. De tal modo, sin cualquier trabajo exterior se origina una diferencia de temperaturas, lo que se encuentra en contradicción inadmisible con el segundo principio de la Termodinámica, que sólo <<permite>> la igualación de la diferencia de temperaturas existente, pero <<prohíbe>> el origen por sí mismo de tal diferencia. En realidad, aquí no hay contradicción. El segundo principio de la Termodinámica sólo es aplicable a los cuerpos macroscópicos que contienen un gran número de partículas, Esto se ve de la ligazón que existe entre la entropía y la probabilidad, sobre la que no se puede hablar, si el número de partículas no es grande, Para el <<diablo>> de Maxwell, el gas no es un cuerpo macroscópico, una vez que es capaz de elegir las moléculas por separado, y a él no se refiere el segundo principio. 113 Desde el punto de vista del mecanismo del fenómeno, la paradoja de Maxwell se resuelve d la forma siguiente. Absteniéndose, por supuesto, de la idea sobre el <<diablo>> situado en el orificio, con la intención de alterar el segundo principio de la Termodinámica, deberemos tener presente, precisamente, un dispositivo determinado. Ya que este dispositivo se pone en acción por los golpes de las moléculas (aunque sean de las rápidas), entonces, él mismo debe tener medidas moleculares. Por eso, las piezas de este dispositivo tomarán parte en los movimientos moleculares (del tipo Browniano). Pero estos movimientos son completamente desordenados, estadísticos. A consecuencia de ello, el orificio se abrirá según la ley de la casualidad, de modo que a través de él pasarán no sólo las moléculas rápidas, sino también las lentas y no ocurrirá la diferencia de temperaturas esperada, en concordancia completa con el segundo principio de la Termodinámica. 4. FUNDAMENTOS BÁSICOS 4.1. De la necesidad de fundamentos básicos Los mayores obstáculos que un estudiante promedio encuentra al tratar de entender la dinámica de Lagrange, usualmente no se deben a las dificultades intrínsecas de la materia, si no más bien, a ciertas deficiencias en un campo más o menos amplio correspondiente a los fundamentos básicos. Con la esperanza de remover tales obstáculos, se han dedicado los dos primeros capítulos al estudio detallado de los pre- requisitos que con mayor frecuencia no son del dominio de los estudiantes y que no se encuentran fácilmente en los textos. 4.2. Leyes básicas de la mecánica básica de Newton y varias maneras de expresarlas Las tres leyes de Newton (naturalmente incluyendo los conceptos básicos de masa, longitud, tiempo, fuerza, las leyes de la geometría, el álgebra y el cálculo) junto con el concepto del trabajo virtual, pueden considerarse como los fundamentos sobre los cuales se basa toda la mecánica clásica (el campo para el cual se cumplen las condiciones C,D y E del numeral 1.6). Sin embargo conviene señalar desde el comienzo que las leyes básicas de la dinámica pueden ser expresadas (matemáticamente) de varias maneras diferentes a la forma dada por Newton. Las más importantes de estas formas (que serán tratadas más adelante) son: (a) el principio de D”Alembert (b) las ecuaciones de Lagrange (c) las ecuaciones de Hamilton (d) el principio de Hamilton Todas ellas son básicamente equivalentes. Por ejemplo, si se parte de las leyes de Newton y del principio del trabajo virtual (ver el numeral 2.13 del capítulo 2) se puede deducir cualquiera de las formas anteriores. Así pues, una cualquiera de las cinco formulaciones puede tomarse como base de los desarrollos teóricos y de la solución de los problemas. 4.3. Selección de la formulación 114 La escogencia de una de las cinco formas depende del trabajo que se ha de realizar. Por ejemplo, las ecuaciones de Newton son adecuadas para la solución de muchos problemas sencillos, el principio de Hamilton es importante en varias consideraciones teóricas; y las ecuaciones de Hamilton han sido útiles en ciertas aplicaciones, asi como en el desarrollo de la mecánica cuántica. Sin embargo, el método de Lagrange es de manera especial potente y notablemente sencillo como instrumento de solución de una gama muy amplia de problemas (tanto teóricos como prácticos) relacionados con sistemas mecánicos, eléctricos, electromecánicos, etc. 4.4. Origen de las leyes básicas Las “leyes básicas” de la dinámica son sencillamente expresiones de un gran conjunto de hechos experimentales: No es posible deducirlas por medio de manejos lógicos o matemáticos, exclusivamente. En último término, las reglas del juego se basan en experimentos delicados. Estas reglas deben ser aceptadas bajo la creencia de que si la naturaleza las ha obedecido en el pasado, continuará haciéndolo en el futuro. Por ejemplo, no es posible “explicar” porque son válidas la leyes de Newton. Lo único que es posible afirmar es que ellas representan un enunciado compacto de experiencia anterior, relacionada con el comportamiento de una gran variedad de sistemas mecánicos: Las formulaciones de D”Alembert, Lagrange y Hamilton expresan esto mismo, cada una de cierta manera en particular. 4.5. De los conceptos y magnitudes básicas empleadas. Las magnitudes de longitud, masa, tiempo, fuerza, etc., se presentan continuamente en mecánica, su interpretación y uso tiende a hacerse con sensación de tranquilidad y de comprensión. Sin embargo, en diferentes épocas han surgido interrogantes con relación a dos conceptos básicos que ellas conllevan y con relación a la naturaleza fundamental de las magnitudes mismas. Un estudio de estos tópicos estaría fuera de lugar aquí, pero los estudiantes interesados encontrarán de gran beneficio los análisis de Bridgman, y otros, sobre estas materias. 4.6. Condiciones de validez de las leyes de Newton La segunda ley de Newton aplicada a una partícula 1 de masa constante, m, puede escribirse como dt dv m F · (1.1) en donde la fuerza F y la velocidad v, son magnitudes vectoriales, y la masa m y el tiempo t, son escalares. Escrito (1.1) en componentes queda x m F x · y m F x · z m F x · 115 (En el presente texto se utilizará la conveniente notación: x dt x d x dt dx · · 2 2 , , etc) (1.2) Las relaciones (1.2) en la forma sencilla en la que están expresadas, no son correctas para cualquiera, ni para todas las condiciones. A continuación se analizan las condiciones con las cuales si son válidas. Condición A La ecuación (1.1) implica algún “marco de referencia” con respecto al cual se mide dt dv . Las ecuaciones (1.2) indican que el movimiento se ha referido a un sistema de ejes rectangulares X, Y, Z. Es un hecho experimental que la segunda ley de Newton, expresada en la forma sencilla de (1.2) conduce a resultados que concuerdan con la experiencia cuando los ejes coordenados están inmóviles con respecto a la posición media de las estrellas “fijas” o si se mueven con velocidad lineal uniforme, sin rotación, con relación a las estrellas. En cualquiera de los dos casos, el marco de referencia (los ejes X, Y, Z) se denomina MARCO INERCIAL 2 y las coordenadas correspondientes, COORDENADAS INERCIALES. Dicho de otra manera, un marco que posee aceleración lineal, o que esta girando en cualquier forma, es NO-INERCIAL 3 . 5 La condición enunciada debe considerarse como una de las bases de sustentación más importantes, sobre las que descansa la superestructura de la dinámica. El reconocimiento de este hecho debe hacerse automáticamente en todo razonamiento ya que básicamente, la solución de todo problema comienza con la consideración de un marco inicial. Se debe la habilidad de reconocer por simple inspección los marcos inerciales y no-inerciales. 5 El término “partícula”, un concepto imaginario, puede representarse como una pequeña porción de materia, tan diminuta que su posición en el espacio se determina por las tres coordenadas de su “centro” . En este caso su energía cinética de rotación con respecto a cualquier eje que la atraviese, puede depreciarse. 2 El término “marco inercial” puede definirse en abstracto, sencillamente como aquel, con respecto al cual, las ecuaciones de Newton en su forma sencilla (1.2) son válidas. Pero esta definición no le indica al ingeniero o científico aplicado, donde hallar tal marco, o si ciertas coordenadas específicas son inerciales. Por otra parte, la definición de las estrellas fijas, si suministra esta información. Desde luego, debe observarse que mediciones hechas con gran precisión podrían demostrar que el marco de las “estrellas fijas” fuera ligeramente no-inercial. 3 Un marco de referencia adherido a la superficie de la Tierra es claramente no-inercial debido a las rotaciones anuales y diarias, y a los demás movimientos del globo. A pesar de esto, la aceleración de este marco es tan pequeña que para muchos efectos (pero en ningún caso para todos los efectos) puede considerarse como inercial. Un marco que no gire (con sus ejes dirigidos siempre hacia las mismas estrellas fijas) con su origen adherido al centro de la Tierra es una mejor aproximación de un marco inercial. Un sistema de ejes que no giren, con su origen en el centro del Sol, constituye un marco inercial excelente (aunque posiblemente no es aún “perfecto”) 116 Lo anterior no implica, sin embargo, que no se puedan utilizar coordenadas no- inerciales. Por el contrario, como podrá notarse en forma evidente, los marcos no- inerciales se emplean quizá con la misma frecuencia que los marcos inerciales. En los ejemplos que siguen se observará como debe escribirse la segunda ley de Newton en el caso de coordenadas no-inerciales. En los capítulos 3 y 4 se demuestra que las ecuaciones de Lagrange (una vez expresada la energía cinética en la forma apropiada) conducen a las ecuaciones del movimiento correctas en coordenadas inerciales, no inerciales o mixtas. Ejemplo 1.1 Como ilustración de la condición A, considérese el comportamiento de los objetos (a), (b) y (c) de la figura 1-1, dentro de un vagón de ferrocarril que se mueve con aceleración constante: az , sobre una vía recta y horizontal. En la figura 1-1, (a) representa una esfera de masa m, bajo la acción de una esfera exterior F (con componentes Fx y Fy) sometida a la gravedad. Si se supone que el marco X1, Y1 es inercial, considerando el movimiento solamente en un plano y tomando la esfera como una partícula, las ecuaciones del movimiento con respecto a la Tierra, son (1) x F x m · 1 (2) mg F y m y − · 1 Por otra parte, las relaciones entre la “coordenadas del vagón” y las “coordenadas de la Tierra” , para m, serían 117 (3) 2 1 2 1 2 1 t a t v x x z + + · (4) h y y + · 2 1 Al derivar (3) y (4) con respecto al tiempo, y al sustituirlas en (1) y (2), (5) x x ma F x m − · 2 (6) mg F y m y − · 2 Que son las ecuaciones del movimiento con relación al vagón. Es claro que la ordenada y2 es inercial puesto que (2) y (6) tienen la misma forma. Sin embargo, la abscisa x2 es no-inercial, ya que (1) y (5) son diferentes. La ecuación (5) es un ejemplo sencillo de la segunda ley de Newton escrita para un marco no- inercial. (Nótese la magnitud del error que se cometería si se escribiera, en cambio, x F x m · 2 ) Debe observarse que el efecto de la condición no-inercial, sobre cualquier sistema mecánico, o sobre una persona en el vagón, es como si g se incrementara a ( 2 2 g a x + ) 1/2 , en una dirección que forma un ángulo g a x / tan 1 − · θ con la vertical, hacia abajo, y que todas las coordenadas fuesen consideradas como inerciales. Si el hombre lanza una bola (Fig. 1-1 (b)) hacia arriba con una velocidad v0, su trayectoria en el vagón sería parabólica y debe calcularse como si la gravedad tuviera la magnitud y dirección indicadas antes. Si el hombre tiene una masa M, ¿Cuál será su “peso” en el vagón? Como una extensión de este ejemplo, supóngase que el coche se hace oscilar sobre la vía, alrededor de un punto fijo, según t Asenω δ δ + · 0 en donde 0 δ , A y ω son constantes. La ecuación (6) continua sin modificación, pero al derivar x1=x2+ 0 δ +Asen ω t y al insertarla en (1), se obtiene x F t sen mA x m + · ω ω 2 2 Una vez más, se observa que x2 es no-inercial 4 Fácilmente se nota que la bola en (b) en su movimiento con respecto al vagón, describirá ahora una trayectoria bastante complicada, que esta determinada por la aceleración hacia abajo g , y por una aclaración horizontal A ω 2 sen ω t. Para el hombre será difícil colocarse sobre una báscula, no importa donde este ésta, puesto que su “peso” total cambio con el tiempo en magnitud y en dirección. Ejemplo1.2: 118 Considérese el movimiento de una partícula de masa m (Fig. 1.2) con respecto a los ejes X2 y Y2 que giran con velocidad angular constante w con relación al marco inercial de X1 y Y1. Las ecuaciones de movimiento en las coordenadas inerciales, son 1 1 x F x m · 1 1 y F y m · En donde 1 x F y 1 y F son componentes de la fuerza aplicada en la dirección de los ejes fijos. Se obtendrán ahora las ecuaciones correspondientes para las coordenadas rotatorias ( y como se verá, no-inerciales) Al observar la figura, redemuestra que t sen y t x x ω ω 2 2 1 cos − · t y t sen x y ω ω cos 2 2 1 + · Derivando estas relaciones dos veces y sustituyéndolas en las primeras ecuaciones del movimiento, se obtiene [ ] t sen y t sen y t x t y t sen x t x m Fx ω ω ω ω ω ϖ ϖ ω ω ω 2 2 2 2 2 2 2 2 1 cos cos 2 2 cos − + − − − · (9) [ ] t y t y t sen x t sen y t x t sen x m Fy ω ω ω ω ω ϖ ϖ ω ω cos cos 2 cos 2 2 2 2 2 2 2 2 2 1 + − − − + · (10) De nuevo, al referirse a la figura, se ve que las componentes de F en la dirección de X2 y en la de Y2, están dadas por t sen F t F F y x x ω ω 1 1 2 cos + · y por t sen F t F F y x x ω ω 1 1 2 cos − · . Así, al multiplicar (9) y (10) por t ω cos y t senω , respectivamente y al sumar el resultado es 2 2 2 2 2 2 y m mx x m F x ω ω − − · (11) En forma semejante, multiplicando (9) y (10) por t senω y por t ω cos respectivamente y restando, tenemos 2 2 2 2 2 2 x m my y m F y ω ω + − · (12) 119 Estas son las ecuaciones del movimiento con respecto a los ejes no-inerciales X2 y Y2. Nótese que sería un error escribir 2 2 x m F x · y 2 2 y m F y · . Este ejemplo pone en evidencia que cualquier marco giratorio es no-inercial. Condición B. Las ecuaciones (1.2) son válidas únicamente cuando m es constante. En caso de que m sea variable, la ecuación (1.1) debe reemplazarse por ) (mv dt d F · Pueden citarse varios ejemplos en los que la masa de un objeto varía con su posición (una bola de nieve que rueda por una pendiente cubierta de nieve), que varía con el tiempo (un carro tanque con un orificio en un extremo por el cual sale un líquido, o un cohete durante la etapa en que se quema el combustible), o que varía con la velocidad (un objeto que se mueve con una velocidad cercana a la de la luz). Sin embargo, en este texto no se considerarán problemas de masa variable. Condición C. En general, las masas del sistema deben ser grandes en comparación con las de los átomos y las de las partículas atómicas. La dinámica de las partículas atómicas pertenece al campo de la mecánica cuántica. A pesar de esto, hay algunas situaciones “fronterizas”; por ejemplo, la deflexión de un haz de electrones en un tubo de rayos catódicos usualmente se calcula con suficiente precisión por medio de la mecánica clásica. Condición D. Sea grande o pequeña la masa, su velocidad debe ser muy inferior a la de la luz. Como se sabe, por la teoría especial de la relatividad, la masa de cualquier objeta aumenta con la velocidad. En el caso de velocidades “ordinarias” este cambio de masa es muy pequeño, pero a medida que la velocidad se aproxima a la de la luz, la proporción de este aumento se vuelve muy importante. Por consiguiente, la relación (1.2) no describirá con precisión el movimiento de un electrón, un protón, o una pelota, si éstos se mueven con una velocidad aproximada de 2 x 10 10 cm/seg. (Naturalmente, esta condición podría incluirse en B) Condición E. En el caso de que ciertas masas del sistema sean muy grandes, o si se consideran intervalos de tiempo muy largos ( un siglo o más), o en problemas que abarquen estas dos condiciones, la teoría general de la relatividad concuerda mejor con la experiencia que la dinámica de Newton. Por ejemplo, la dinámica relativística, predice que el perihelio de la órbita del planeta Mercurio debe avanzar un ángulo de 43” por siglo, lo cual coincide muy bien con los resultados de mediciones astronómicas. En conclusión, se observa que al tratar de masas, velocidades o tiempos “ordinarios”, siempre se cumplen las condiciones C, D y E. Por tanto, en la “dinámica clásica” el mayor interés tiene que ver con A y con B. 120 De las condiciones anteriores resulta evidente que existen tres campos de dinámica, más o menos bien definidos: Clásica, cuántica y relativística. Desafortunadamente hasta ahora no se ha desarrollado una teoría “unificada” que puedas ser aplicada en cualquiera o en todas las condiciones. 4.7. Dos tipos generales de problemas de dinámica. Prácticamente cualquier problema de dinámica clásica es un caso especial de uno de los dos tipos generales siguientes: (a) Partiendo de unas fuerzas dadas que actúan sobre un sistema de masas, y conocidas las restricciones, la posición y la velocidad de cada una de las masas en un instante determinado, se requiere hallar el “movimiento” del sistema, es decir, la posición, la velocidad y la aclaración de4 cada una de las masas, en función del tiempo. (b) Partiendo de unos movimientos dados para un sistema, se requiere hallar un posible conjunto de fuerzas que produciría tales movimientos. En general, algunas o todas las fuerzas pueden variar con el tiempo. Desde luego, consideraciones sobre el trabajo, la energía, la potencia, la cantidad de movimiento y el momentum angular pueden ser importantes, bien en el tipo (a) o en el (b). 4.8. Métodos generales para solucionar problemas de dinámica. La mayor parte de los problemas de la dinámica aplicada son del tipo (a). El procedimiento general es el mismo en todos aquellos que pertenecen a este tipo. Por conveniencia el procedimiento puede dividirse en cuatro etapas. (1) Selección de un sistema de coordenadas apropiada La facilidad con la que puede resolverse un problema específico depende en una buena medida de las coordenadas utilizadas. El sistema más ventajoso depende del problema entre manos; desafortunadamente no es posible dar reglas generales de selección. Principalmente es un problema de experiencia y criterio. (2) Planteamiento de las ecuaciones diferenciales del movimiento. Ya se han dado algunos ejemplos sencillos de ecuaciones de movimiento. No obstante, para ilustrar aún más el significado del término “ecuaciones del movimiento” , considérese el problema de una pequeña masa m, suspendida de un resorte espiral de mas despreciable, como aparece en la figura 1-3. Supóngase que m puede moverse en un plano vertical bajo la acción de la gravedad y del resorte. Las ecuaciones del movimiento, expresadas en coordenadas polares son 0 ) ( cos 0 2 · − + − − τ τ θ τθ τ m k g 0 2 · − + θ τθ θ τ gsen 121 en donde 0 τ es la longitud del resorte sin estirarse y k es la constante elástica usual del resorte. La integración de estas ecuaciones diferenciales de segundo orden dan τ y θ en función del tiempo. Es importante recalcar dos observaciones: (a) Estas ecuaciones diferenciales pueden plantearse de varias maneras (véase el numeral 1.2). Sin embargo, como en la mayoría de los casos el método de Lagrange es el más ventajoso. (b) Las ecuaciones anteriores no representan la única forma de expresar las ecuaciones del movimiento de este péndulo. Podrían escribirse en coordenadas rectangulares, o en cualquier otro sistema de coordenadas (véanse los capítulos 3 y 4). En cada uno de estos casos las ecuaciones tendrán aspectos bien diferentes y algunas serán más complicadas que otras. Las afirmaciones (a) y (b) son válidas en general para todo sistema dinámico. (3) Solución de las ecuaciones diferenciales del movimiento Excepto en la formulación de Hamilton, las ecuaciones del movimiento son de segundo orden. El grado de complejidad de las ecuaciones depende principalmente del problema particular entre manos y del tipo de coordenadas que se usen. Con frecuencia las ecuaciones no son lineales. Únicamente en ciertos casos, relativamente escasos, en que por ejemplo todos los términos diferenciales tienen coeficientes constantes, puede darse un método general de solución. Es importante mencionar que aunque prácticamente para cualquier sistema dinámico pueden escribirse las ecuaciones diferenciales del movimiento correctamente, en la mayoría de los caos éstas resultan tan complejas que no es posible integrarlas. Afortunadamente, a pesar de lo anterior, los varios tipos de computadores vienen a salvar la situación y ahora es posible obtener soluciones útiles a ecuaciones bastante difíciles, con rapidez y relativamente con pequeño esfuerzo. Naturalmente, esto quiere decir que ecuaciones diferenciales que anteriormente se consideraban “sin solución” ocupan la atención principal de científicos e ingenieros. Además, las técnicas generales más avanzadas para plantear tales ecuaciones adquieren cada vez más importancia en todos los campos de la investigación y del desarrollo. (4) Determinación de las constantes de integración El método de determinación de las constantes de integración es básicamente sencillo. Se reduce a la sustitución de los valores conocidos de posición y velocidad en un instante determinado, en las ecuaciones integradas. Como el método será aclarado con toda amplitud en los ejemplos específicos de los capítulos siguientes, no se incluyen aquí detalles adicionales. 4.9. Ejemplo ilustrativo de los numerales 1.7 y 1.8 Con el fin de ilustrar las observaciones de los numerales anteriores y para obtener una visión general de la dinámica, antes de iniciar el estudio detallado del método de Lagrange, considérese el ejemplo siguiente. 122 Las masas m1 y m2 están conectadas a los resortes (cuyas constantes elásticas son k1 y k2 ) y al bloque B, como se muestra en la figura 1-4, abajo. Se hace mover el bloque según s=A senwt, por medio de la fuerza F. Los puntos fijos p0, p1 y p2 se han localizado de modo que p0p1 y p1p2 son las longitudes de los resortes, primero y segundo respectivamente, sin estirar. Todos los movimientos se efectúan sobre una línea horizontal lisa. Se desprecian las masas de los resortes. Se describe a continuación el trabajo relacionado con el análisis dinámico del sistema. El problema es del tipo (a) del numeral 1.7. El método0 de solución es del numeral 1.8. Un amplio análisis del sistema incluiría la determinación de: a. La posición de cada una de las masas, en función del tiempo b. La velocidad de cada una de las masas en cualquier instante c. La energía (cinética y potencial) del sistema, en función del tiempo d. La aceleración y la fuerza que actúa sobre cada una de las masas en función del tiempo. e. Las frecuencias del movimiento de cada una de las masas. f. La fuerza que debe aplicarse a B g. La potencia entregada por B al sistema, en cualquier instante. Debe entenderse que las soluciones que se dan a continuación no tienen por objeto mostrar los detalles en su totalidad, sino que tratan solamente de ilustrar las etapas fundamentales. Por esto, los manejos matemáticos que no parecen esenciales en una visión general, se omiten. Se determina primero (a) y de aquí se siguen sin dificultad (b), (c),… y (g). Siguiendo las etapas descritas en el numeral 1.8, primero se soluciona un sistema de coordenadas apropiado. Como el movimiento está restringido a una recta horizontal, resulta evidente que solo dos coordenadas se requieren; una para determinar la posición de cada una de las masas. De las distancias indicadas en la figura 1-4, cualquiera de los pares (x1,x2),(x3,x5),(x3,x4),(x4,x5), etc. , puede utilizarse. Por conveniencia se escoge (x1,x2) Las ecuaciones del movimiento, obtenidas por aplicación directa de las leyes de Newton o e las ecuaciones de Lagrange, son t Asen k x k x k k x m ϖ 1 2 2 1 2 1 1 ) ( · − + + (1) 0 1 2 2 2 1 · − + x k x k x m (2) Con el fin de hacer el problema más específico, se fijan las siguientes cantidades: 123 m1= 400g., m2=300g. A=5cm k1=6 x 10 4 dinas/cm, k2=5 x 10 4 dinas/cm, ω =12 rad/seg Por medio de métodos conocidos de integración se encuentran las soluciones aproximadas de (1) y (2) X1= 6.25A1sen(19.37t+ 1 τ )-3A2sen(8.16t+ 2 τ )-0.95sen 12t (3) X2= -5A1sen(19.37t+ 1 τ )-5A2sen(8.16t+ 2 τ )-7sen 12t (4) Con lo cual se han completado las tres primeras etapas del numeral 1.8 Las constantes arbitrarias de de integración A1, A2, 1 τ y 2 τ pueden determinarse mediante la asignación de condiciones iniciales específicas. Se puede suponer, por ejemplo, una forma de iniciar el movimiento; cuando t=o se tiene X1= 3 cm, X2=4 cm (5) X1= 0, X2= 0 (6) Al reemplazar en (3) y (4) los valores de (5), y en las derivadas con respecto al tiempo de (3) y (4), los valores de (6), resultan cuatro ecuaciones algebraicas de las cuales pueden obtenerse los valores específicos de las constantes, en forma inmediata. Así se obtienen los desplazamientos x1 y x2 como funciones específicas del tiempo. Por simple inspección se nota que cada una de las soluciones a las partes (b), (c),…y (g) pueden determinarse directamente partiendo de las formas finales de (3) y (4). Así pues, todos los detalles adicionales se le dejan al lector. El sencillo ejemplo anterior presenta una visión bastante completa del procedimiento general que se sigue en la solución de la basta clase de problemas mencionados en el numeral 1.7 (a). Una advertencia: Las ecuaciones del movimiento (1) y (2) son bien sencillas y por tanto todas las etapas pudieron realizarse sin dificultad. Desafortunadamente este no es el caso general (véase el numeral 1.8, (3)). Por otra parte, sucede con frecuencia que muchos de los detalles que se ennumeraron en la lista del numeral 1.9, no se necesitan. El segundo tipo general de problemas mencionado en 1.7 (b) será estudiado en el capítulo 13. 4.10.Resumen y observaciones 1. La “dinámica clásica” es la rama de la dinámica para la cual se cumple las leyes de Newton, bajo las restricciones C, D y E del numeral 1.6 2. Las “leyes básicas” de la dinámica son sencillamente expresiones compactas de resultados experimentales. Pueden expresarse matemáticamente de varias maneras diferentes, pero todas ellas son básicamente equivalentes. Cualquiera de las formas puede ser deducida a partir de cualquier otra. 3. Es de gran importancia conocer y entender las condiciones de validez de las leyes de la dinámica clásica. Resulta imprescindible, en la 124 solución de todo problema de dinámica, la definición de un “marco inercial” y la verificación del papel que desempeña éste. 4. Hay dos tipos principales de problemas en la dinámica clásica (como se vio en el numeral 1.7) de los cuales 1.7 (a) es el más común. Es importante el reconocimiento de este hecho, así como del orden general de la solución. 5. Actualmente existen tres campos distintos de la dinámica (desde el punto de vista de la solución) bastante bien definidos (físicamente): Clásica, cuántica y relativística. Hasta ahora no se ha desarrollado un conjunto unificado de leyes que sea aplicable a cualquier problema o a todos ellos. 4.11.Problemas y preguntas de repaso 1.1 Expresar el significado del término “dinámica clásica”. Mencionar ejemplos específicos que ilustren los otros dos campos. 1.2 ¿Qué puede decirse con respecto al “origen” y a las maneras de expresar las leyes de la dinámica? 1.3 Indicar con claridad el significado del término “marco inercial de referencia” 1.4 Demostrar que cualquier marco de referencia que se mueve con velocidad lineal constante (sin rotación) con respecto a un marco inercial, es así mismo inercial. 1.5 ¿Es posible reconocer por simple inspección, si un sistema de coordenadas es inercial, o no inercial? ¿Es admisible, en la solución de algunos problemas; utilizar una combinación de coordenadas inerciales con no-inerciales? (Estas son consideraciones de importancia) 1.6 El cable que sostiene un ascensor se rompe haciendo que éste caiga libremente (despréciese la resistencia del aire). Demostrar que para cualquier sistema mecánico cuyos movimientos se refieran al ascensor, el campo gravitatorio de la Tierra, se anula efectivamente. 1.7 Un sistema de coordenadas esta adherido al interior de un automóvil que se mueve de la manera usual, por una avenida con curvas, baches, semáforos y policías de tráfico. ¿Será inercial tal marco? ¿Los ocupantes del vehículo experimentan alguna fuerza diferente de la gravitacional? Explicar. 1.8 Si el coche de la figura 1-1 se mueve con velocidad constante sobre una vía circular horizontal, ¿cuáles de las coordenadas x2, y2 o z2 de m1 (o de cualquier otro punto referido al marco X2, Y2 y Z2) serán no inerciales? Explicar. (Supóngase que Z1 tiene la dirección del radio de curvatura de la vía) 1.9 Supóngase que el marco X2, Y2 de la figura 1-2 tiene un tipo definido de rotación (comoθ = constante, θ = constante o t senω θ θ 0 · ). Demostrar que las coordenadas x2, y2 son no-inerciales. Véase el ejemplo 1-2. 1.10 Supóngase que el dispositivo de la figura 1-4 se coloca en vagón de ferrocarril de la figura 1-1, paralelo al eje x2, y que el vagón se mueve con aceleración 125 constante ax . Demostrar que las ecuaciones del movimiento (1) y (2) del numeral 1.9, deben reemplazarse por x a m t Asen k x k x k k x m 1 1 2 2 1 2 1 1 1 ) ( − · − + + ϖ x a m x k x k x m 2 1 2 2 2 2 2 − · − + 1.11 Supóngase que el origen del sistema X2, Y2 de la figura 1-2 tiene una aceleración constante ax, en la dirección del eje X1, y que simultáneamente x2, y2 giran con velocidad angular constante ω . Demostrar que las ecuaciones (11) y (12) del ejemplo 1.2, deben reemplazarse por. t ma y m mx x m F x x ω ω ω cos 2 2 2 2 2 2 + − − · t sen ma x m my y m F x y ω ω ω − + − · 2 2 2 2 2 2 1.12Supóngase que el marco X, Y al cual está sujeto el péndulo de la figura 1-5; se mueve con velocidad constante vx en la dirección X y vy en la dirección Y (sin rotación del marco). Demostrar que la ecuación del movimiento del péndulo, en el sentido de θ , es θ θ gsen r − · ¿El periodo de oscilación se altera por el movimiento del marco del cual pende? 1.13Si el marco X, Y de la figura 1-5, tiene una aceleración constante ax, en la dirección de X, y una velocidad constante, vy en la dirección Y, demostrar que θ θ θ gsen a r x − − · cos y por tanto, que θ no es inercial. ¿El péndulo tiene ahora un periodo igual al del problema 1.12? 1.14 Enunciar y dar ejemplos de las dos principales clases de problemas que se encuentran en la dinámica clásica. Describir el procedimiento general que se siguen en la solución de los problemas del primer tipo. 126 5. FUNDAMENTOS BÁSICOS II Sistemas de coordenadas, ecuaciones de transformación, coordenadas generalizadas. Grados de libertad, grados de restricción, ecuaciones de restricción, Velocidad, energía cinética y aceleración de coordenadas generalizadas. Desplazamientos virtuales y trabajo virtual. 5.1. Observaciones introductorias Los desarrollos teóricos, así como la solución de los problemas de aplicación en el campo de la dinámica analítica incluyen, además de los importantes tópicos estudiados en el capítulo primero, una consideración inmediata de las coordenadas generalizadas, ecuaciones de transformación, grados de libertad, grados de restricción, ecuaciones de restricción, velocidad y energía cinética expresadas en coordenadas generalizadas, expresiones generales de la aceleración y el significado y uso de los desplazamientos virtuales y del trabajo virtual. Ningún estudiante está en capacidad de comprender el desarrollo de la materia sin haber entendido claramente cada uno de estos tópicos. 5.2. Sistemas de coordenadas y ecuaciones de transformación. Los diferentes tópicos bajo este capítulo se estudiarán, principalmente, por medio de ejemplos específicos. (1) Sistemas rectangulares. Considérense primero los sistemas rectangulares en dos dimensiones de la figura 2.1. Las distancias x1, y1 localizan el punto p con respecto al marco de referencia X1, Y1. En forma similar, x1, y1 localizan el mismo punto con respecto a X2, Y2. Por observación se ve que las coordenadas x1, y1 de cualquier punto en el plano, se relacionan con las coordenadas x2, y2 del mismo punto por medio de las siguientes “ecuaciones de transformación”: 127 Fig. 2-1 θ θ sen y x x x 2 2 0 1 cos − + · (2.1) θ θ sen y x y y 2 2 0 1 cos + + · Nótese que tanto x1 como y1 son ambas funciones de x2 y y2 simultáneamente. Puede verse que las relaciones (2.1) pueden escribirse en una forma más conveniente, como sigue 2 2 2 1 0 1 y l x l x x − + · (2.2) 2 2 2 1 0 1 y m x m y y + + · En donde l1, m1 y l2 son los cosenos directores de los ejes X2, Y2 respectivamente, con relación al marco X1, Y1. Extendiendo el razonamiento, supóngase que el origen de X2, Y2 se mueve con una velocidad que puede ser constante (con componentes vz y vy) con respecto al marco X1, Y1; y simultáneamente, que los ejes X2, Y2 giran con gran velocidad angular constante w, de tal manera que wt · θ . Las ecuaciones (2.1) y (2.2) pueden escribirse: t sen y t x t v x w w z 2 2 1 cos − + · t y t sen x t v y w w y cos 2 2 1 + + · Nótese que son ahora funciones tanto de como del tiempo. Naturalmente, pueden escribirse ecuaciones adecuadas para cualquier tipo de movimiento que se suponga. Frecuentemente se encuentran ecuaciones de transformación semejantes a las anteriores, las cuales se designan simbólicamente por ). , , ( 2 2 1 1 t y x x x · ). , , ( 2 2 1 1 t y x y y · Puede demostrarse que si se consideran dos sistemas rectangulares tridimensionales, como en la figura 2-2, las ecuaciones de transformación que relacionan las coordenadas x1, y1 y z1 de un punto, con las designadas por x2, y2 y z2 para el mismo punto, serán 128 Fig. 2-2 2 3 2 2 2 1 0 1 z l y l x l x x + + + · 2 3 2 2 2 1 0 1 z m y m x m y y + + + · (2.4) 2 3 2 2 2 1 0 1 z n y n x n z z + + + · En donde l1, m1 y n1, son los cosenos directores del eje X2, etc. Desde luego, el marco X2, Y2, Z2 podría estarse moviendo, en cuyo cado (conocido el movimiento) x0, y0, z0 y los cosenos directores podrían expresarse en función del tiempo, o sea x1 = x1(x2, y2, z2, t), etc. (2) Sistema cilíndrico. Este sistema, bastante conocido, se muestra en la figura 2-3. Se observa que las ecuaciones que relacionan las coordenadas (x, y, z) con ) , , ( z r θ son φ ρ cos · x φ ρsen y · z z · (2.5) Fig. 2-3 Fig. 2-4 (3) Sistema esférico. 129 Las coordenadas esféricas, consistentes en dos ángulos, φ y θ , y una distancia r , usualmente se designan como en la figura 2-4. Observando la figura se demuestra que , cosφ θ rsen x · , φ θsen rsen y · θ cos r z · (2.6) Nótese que x y y son ambas, funciones de r , φ y θ . Sin embargo z es función únicamente de r y de θ . (4) Otros sistemas de coordenadas. Considérense los dos conjuntos de ejes, X, Y y Q1, Q2 de la figura 2-5 en donde se suponen conocidos α y β . Por inspección se nota que el punto p puede localizarse por medio de varios pares de distancias diferentes, tales como, (x, y), (q1, q2), (q´1, q´2), (s1, s2), (s1, x), etc. Las ecuaciones de transformación que relacionan algunos de estos pares son Fig. 2-5 β α cos cos 2 1 q q x + · β α sen q sen q y 2 1 + · (2.7) ) cos( 2 1 1 , α β − + · q q q ) cos( 1 2 2 , α β − + · q q q (2.8) β β cos 2 y xsen s − · α α xsen y s − · cos 1 (2.9) En la figura 2-6 se muestran otras posibilidades interesantes, Las distancias r1 y r2 medidas desde los puntos fijos a y b determinan la posición de p en cualquier lugar encima del eje X (no son únicas para todo plano XY). Asimismo, (θ , α ) o (r1, senθ ), son coordenadas apropiadas. Si se escribe x = r1cosθ y y = r1senθ y se designa q = senθ , se concluye que , ) 1 ( 2 1 2 1 q r x − · q r y 1 · (2.10) Lo cual relaciona las coordenadas (x, y) con (r1, q). 130 Fig. 2-6 Es interesante notar que el área sombreada A, y senθ , constituyen coordenadas perfectamente aceptables. Dos relaciones entre ellas x y y son A xy 2 · x q q y ) 1 ( 2 − · (2.11) Fig. 2-7 En la figura 2-7 se muestran las gráficas de las coordenadas A y q. Las “curvas de q” se obtienen dejando A constante y haciendo gráficas de la primera relación de (2.11). En la misma forma, las “curvas de A” resultan de la segunda relación, con q constante. Es evidente, por los ejemplos mencionados, que puede emplearse una gran variedad de coordenadas (longitudes, ángulos, funciones trigonométricas, áreas, etc.). (5) Coordenadas para el sistema mecánico de la figura 2-8. Supóngase que las masas m1 y m2 están conectadas por medio de un resorte y pueden moverse únicamente a lo largo de la vertical. Como el movimiento está así limitado, la posición de las masas se determina mediante la especificación de sólo dos coordenadas, como y1 y y2. Asimismo, (y1, y3), (y2, y3), (q1, y1), (q2, y1), (q1, y2), etc., son adecuadas. Se dice que se ha determinado la configuración del sistema cuando se conoce uno cualquiera de estos conjuntos. Entre estos conjuntos de coordenadas existen relaciones obvias (ecuaciones de transformación). Nótese que como m1q1=m2q2, q1 y q2, r1 no son independientes. ¿Serán entonces independientes q1 y y3? 131 Fig. 2-8 Fig. 2-9 (6) Coordenadas para un sistema de masas pendientes de poleas. Si se supone que las cuatro masas de la figura 2-9, se mueven verticalmente, se ve que cuando se especifica la posición de m1, por y1 o por s1, la posición de m3 queda determinada. Asimismo, al especificar la posición de m2 mediante y2 o s2, se conocerá la de m4. (Estas afirmaciones suponen, naturalmente, que todas las dimensiones fijas de los cables y las poleas se conocen.) Así pues, solamente se necesitan dos coordenadas para determinar la configuración de las cuatro masas. Al principio es posible inclinarse por decir que se necesitan cuatro coordenadas, tales como y1, y2, y3 y y4. Pero en la figura puede observarse que y1 + y3=C1 y que y2 + y4 - 2y3 = C2 en donde C1 y C2 son constantes. Pero tanto si se conocen los valores de las coordenadas de cualquiera de los pares (y1, y2), (y1, y4), (y2, y3), los valores de las otras dos pueden obtenerse por medio de las ecuaciones mencionadas. Para ser usadas más tarde, el lector podría demostrar las siguientes igualdades , 2 2 1 1 4 1 C l l q s h y − − − + + · 1 1 4 3 l q s h y + − − · , 2 1 1 4 2 l q s h y + − − · 4 4 s h y − · (2.12) en donde l1y l2 son las longitudes de los cables. Nótese que las posiciones verticales de todas las cuatro masas con conocidas, si se han dado los valores de dos coordenadas únicamente (s4, q1). (7) Coordenadas posibles para un péndulo doble. Las dos masas, m1 y m2, de la figura 2-10, están suspendidas de un soporte rígido y pueden moverse libremente en el plano X, Y. (a) Suponiendo que r1 y r2 son hilos de longitud fija, se requieren dos coordenadas tales como (θ , φ ), (x1, x2), (y1, y2), etc. 132 Fig. 2-10 (b) Suponiendo que las masas se hallan suspendidas de bandas de caucho, o de soportes espirales, se necesitan cuatro coordenadas, tales como q1, q2 (x1, y1, x2, y2), etc. Las ecuaciones de transformación que relacionan los anteriores conjuntos de coordenadas son θ sen r x x 1 0 1 + · θ cos 1 0 1 r y y − · φ θ sen r sen r x x 2 1 0 2 + + · (2.13) φ θ cos cos 2 1 0 2 r r y y − − · (8) Marcos de referencias móviles y “coordenadas móviles”. En la práctica se encuentran muchos problemas para los que es conveniente utilizar marcos de referencia móviles. (Por conveniencia, en ocasiones, las coordenadas medidas con respecto a tales marcos pueden denominarse “coordenadas móviles”.) Algunos ejemplos generales son: Un marco de referencia sujeto a un ascensor, a un tren en movimiento o a una plataforma que gira; ejes de referencia adheridos a la Tierra con el fin de determinar movimientos de relación a ésta; un marco fijo al interior de un satélite artificial; etc. Se ha mencionado ya un ejemplo específico (véase la ecuación (2.3)), pero quizá puede ser útil citar los siguientes (a) Supóngase que en la figura 2-1, el origen O posee una velocidad inicial (vx, vy) y una aceleración constante (ax, ay), mientras los ejes giran con velocidad angular constante w. Lógicamente las ecuaciones (2.2) toman la forma t sen y t x t a t v x x x ω ω 2 2 2 2 1 1 cos − + + · (2.14) t y t sen x t a t v y y y ω ω cos 2 2 2 2 1 1 − + + · Una vez más se ve que x1 = x1(x2, y2, t), etc. (b) Si se hace oscilar a lo largo de una recta inclinada, al soporte de la figura 2-10, según t Asen A x ω + · 0 0 y t Bsen B y ω + · 0 0 , las relaciones (2.13) tendrán la forma φ θ ω sen r sen r t Asen A x 2 1 0 2 + + + · (2.15) φ θ ω cos cos 2 1 0 2 r r t Bsen B y − − + · etc., lo cual puede indicarse como x2 = x2(r1, r2, θ , φ , t), etc. Es importante entender y desarrollar un sentido del significado físico y geométrico asociado con relaciones simbólicas de este tipo. 133 (c) Si en la figura 2-9 se le da al soporte una aceleración vertical constante con velocidad inicial v1, entonces 2 2 1 1 at t v h + · y las relaciones (2.12) deben escribirse + + + + · 1 4 2 2 1 1 1 q s at t v y constante, etc. (d) Supóngase que los ejes Q1 y Q2 de la figura 2-5 giran alrededor del origen con velocidades angulares constantes, w1 y w2, de modo que t 1 ω α · y t 2 ω β · . Aún así es posible usarlos como “marco de referencia” (aunque para la mayoría de los problemas no resulta muy deseable). Las relaciones (2.7) se convierten en t q t q x 2 2 1 1 cos cos ω ω + · (2.16) t sen q t sen q y 2 2 1 1 ω ω + · o bien, x = x(qi , q2, t), etc. Es importante observar que los marcos de referencia de los ejemplos anteriores son no-inerciales. Finalmente, con respecto a las ecuaciones de transformación, en general se tiene (i) Como regla general, todas las coordenadas de un sistema son funciones de todas las demás y del tiempo (si los marcos son móviles), como puede verse en las ecuaciones (2.14), (2.15) y (2.16). (ii) En los ejemplos anteriores, la mayoría de las ecuaciones de transformación relacionan las coordenadas rectangulares con algunas otras. Pero si se desea, normalmente pueden escribirse ecuaciones que relacionen varios tipos de coordenadas. 5.3. Coordenadas generalizadas. Grados de libertad. (1) Coordenadas generalizadas. Como se ha visto en los ejemplos precedentes, puede emplearse una gran variedad de coordenadas. Así, por conveniencia, se usa la letra q como símbolo general para representar coordenadas, no importa cuál sea su naturaleza. Por tanto, q se denomina coordenada generalizada. Por ejemplo las ecuaciones (2.15) pueden escribirse como 4 3 2 1 0 2 q q q q t Asen A x + + + + · ϖ y 2 4 3 2 2 1 0 2 1 1 q q q q t Bsen B y − − − − + · ϖ , en donde r1 se ha remplazado por q1, sen θ por q2 , etc. Según el uso común, frecuentemente indicaremos las n coordenadas que se requieren para especificar la configuración de un sistema, como q1, q2, ….,qn. (2) Grados de liberad, definición e ilustración. Una de las primeras consideraciones en la solución de un problema es la determinación del número de “grados de libertad” del sistema. Estos se definen como: El número de coordenadas independientes (sin incluir el tiempo) que se requieren para especificar completamente la posición de todas y cada una de las partículas o partes componentes del sistema. El término “parte componente” se refiere aquí a cualquier parte de un sistema, tal como una palanca, un disco, un piñón, una plataforma, etc., que debe ser tratado como un cuerpo rígido y no como una partícula. 134 A continuación se incluyen ejemplos que tienen desde uno, hasta muchos grados de libertad. (a) Sistemas con un grado de libertad. Una partícula restringida a moverse en una línea recta (una cuenta ensartada en un hilo rígido) cuya ecuación es y = a + bx. Si se conoce x o y, la otra queda determinada. Una cuenta con posibilidad de moverse libremente en un hilo rígido de cualquier forma conocida: Parabólica, helicoidal, etc. En péndulo simple con su movimiento confinado a un plano. O un hilo cuyo hilo se tira hacia arriba por un pequeño orificio en un tablero fijo, a una rata constante. (La longitud del péndulo es una función conocida del tiempo.) Nótese que el tiempo nunca se incluye como un grado de libertad. La cuenta que se muestra en la figura 2-11, que puede deslizarse libremente a lo largo de la varilla que gira alrededor de p, de alguna manera determinada. Fig. 2-11 Fig. 2-12 (b) Dos grados de libertad. Una partícula con libertad para moverse en contacto con un plano o con una superficie conocida cualquiera: Esférica, cilíndrica, etc. La palanqueta de la figura 2-12, que puede deslizarse libremente a lo largo del eje Y y al mismo tiempo girar alrededor del mismo eje. El sistema de masas y poleas de la figura 2-9. En la ecuación (2.12) se observa queso se han dado los valores de s4 y q1, se conoce la configuración completa. Si el soporte AB se está moviendo, se requieren dos coordenadas y t; sin embargo, aún así se considera que existen dos grados de libertad. El péndulo doble de la figura 2-10, siendo r1 y r2 los hilos de longitud constante. Fig. 2-13 (c) Tres grados de libertad. 135 Una partícula libre de moverse en el espacio. Coordenadas posibles: (x, y, z), (r ,φ , θ ), etc. Un tablero o una lámina que puede deslizarse libremente sobre un plano. Se requieren dos coordenadas para traslación y una para rotación. El péndulo doble de la figura 2-10, si se supone que r1 es una banda de caucho y r2 tiene longitud fija. Un cuerpo rígido que puede girar libremente alrededor de cualquier punto fijo. O, como se muestra en la figura 2-13. La orientación queda completamente determinada por α φ θ , , . (m es una partícula cualquiera del cuerpo.) El sistema de la figura 2-8 con un resorte adicional y una masa conectado a m2. Fig. 2-14 Fig. 2-15 (d) Cuatro grados de libertad. El péndulo doble de la figura 2-10 con longitudes variables de y (bandas de caucho o resortes en espiral). La disposición de la figura 2-14, en donde puede moverse únicamente en sentido vertical. La partícula puede moverse libremente en cualquier forma bajo la acción de la gravedad, sostenida por una banda de caucho. El sistema de poleas de la figura 2-15, suponiendo únicamente movimiento vertical. El cuerpo rígido que se muestra en la figura 2-13, con la posibilidad de que la unión esférica se deslice sobre el eje X. (e) Cinco grados de libertad. El cuerpo rígido de la figura 2-13 con la posibilidad que la unión esférica se mueva siempre en contacto con el plano XY. Un sistema de cinco poleas montadas como se indica en la figura 2-16. Fig. 2-16 El sistema de poleas de la figura 2-15 con un resorte intercalado en el cable que conecta con . Cinco partículas unidas linealmente con resortes como se muestra en la figura 2-18, con movimiento horizontal únicamente (o sólo vertical). ¿Se tendría un número igual 136 de grados de libertad si no existieran los resortes, es decir, sin ninguna conexión entre las masas? (f) Seis grados de libertad. El péndulo doble de la figura 2-10, con las partículas y suspendidas por bandas de caucho y con posibilidad de moverse libremente en el espacio. Un cuerpo rígido que puede moverse libremente en el espacio, aunque se encuentre sujeto a resortes de cualquier forma. El cuerpo rígido de la figura 2-13 con otro cuerpo rígido ligado a él por medio de una unión esférica, por ejemplo en P. El sistema de poleas de la figura 2-15 con resortes intercalados de cada uno de los cables que sostienen a y a . (g) Muchos grados de libertad. Dos tableros articulados entre sí, de modo que el ángulo entre ellos puede variar y además pudiendo moverse el conjunto de cualquier manera aparte de la restricción de la articulación. Tal sistema tiene siete grados de libertad. Una sucesión de siete poleas como las de la figura 2-16 tiene siete grados de libertad. Un sistema consistente en tres partículas suspendidas una de la otra, como formando un péndulo triple posee ocho grados de libertad siempre y cuando dos de los hilos sean elásticos y el movimiento no esté restringido a un plano. Si las tres cuerdas son elásticas el sistema tiene nueve grados de libertad. Dos cuerpos rígidos ligados por medio de una unión esférica y con posibilidad de moverse en el espacio con libertad, tiene nueve grados de libertad. Dos cuerpos rígidos ligados por medio de una unión esférica y con posibilidad de moverse en el espacio con libertad, tienen nueve grados de libertad. Fig. 2-17 El sistema que se muestra en la figura 2-17 posee diez grados de libertad. Se necesitan tres coordenadas para localizar el punto p, dos más para determinar la configuración de la barra (suponiendo que la barra no gira sobre su propio eje), tres más para fijar la posición de , y finalmente, dos más para localizar a (suponiendo que el hilo que la sujeta tiene una longitud fija). La disposición de resortes y “partículas” de la figura 2-18 puede tener diferentes números de grados de libertad según como se les permita moverse. Si el movimiento se limita al eje Y, El sistema tiene cuatro grados de libertad; Si se restringe al plano XY, habrá ocho grados de libertad. Si y pueden moverse sobre el eje Y únicamente, mientras que pueden moverse en el plano XY, el conjunto poseerá seis grados de libertad; y si todas las masas se consideran como cuerpos rígidos, serán veinticuatro. 137 Fig. 2-18 Se ve entonces, que los sistemas mecánicos pueden tener cualquier número finito de grados de libertad. El número depende en cada caso del número de masas que se consideren y de las restricciones geométricas que se impongan a sus movimientos Inclusive, muchos sistemas pueden considerarse como un número ilimitado de grados de libertad. Un resorte espiral, una cuerda en vibración, la cara de un tambor, etc., son ejemplos de este caso, si se supone que están compuestos de un número ilimitado de partículas. En muchos problemas, aunque no en todos ellos, las masas de los resortes, de los hilos, etc., pueden despreciarse. Así se hará en este texto. Los sistemas que poseen un “número infinito de grados de libertad” se tratan por otros métodos bien distintos. (3) Selección de coordenadas independientes. En el procedimiento matemático de la solución de un sistema, usualmente existes muy amplias posibilidades para seleccionar las coordenadas que han de considerarse como independientes. En el caso de un péndulo simple, usualmente se toma el desplazamiento angular, del hilo. Sin embargo podrían emplearse las coordenadas x y y de la pesa, o muchas otras. En la figura 2-9 se observa que al conocerse las coordenadas de cualquiera de los pares, (y1, y2), (s3, q2), (y2, y4), (s1, q1), (s4, q1), etc., se habrán determinado las posiciones de todas las masas. Por tanto, cualquiera de tales pares puede tomarse como el sistema de coordenadas independientes, para la solución correspondiente. Es bien sabido que ciertas coordenadas pueden ser más convenientes que otras. De tal manera que las coordenadas escogidas en cada caso particular, deben ser las que parezcan más convenientes para el problema entre manos. La selección final dependerá, en buena parte, de la comprensión y de la experiencia. 5.4. Grados de restricción, ecuaciones de restricción. Coordenadas superfluas. Por lo visto en el numeral anterior, es evidente que el número de grados de libertad depende no solamente del número de masas consideradas, sino también de cómo se halle restringido físicamente el movimiento de cada una de ellas. Una partícula que puede ocupar cualquier posición en el espacio, tiene tres grados de libertad. Para determinar su posición se requerirán tres coordenadas independientes como, (x, y, z), ) , , ( θ φ r , etc. Pero si el movimiento se restringe a una línea (una cuenta ensartada en un alambre rígido), con una sola coordenada será suficiente. Se dice entonces, que la cuenta tiene dos grados de restricción y dos de las tres coordenadas que se necesitan para una partícula libre, son ahora “superfluas”. Es entonces evidente que un sistema de p partículas puede tener un máximo de 3p grados de libertad, y el número n, estará dado finalmente por n = 3p – (grados de restricción). Las restricciones de un sistema pueden representarse por ecuaciones de restricción. Si la cuenta está restringida a moverse a lo largo de una recta en el plano XY, la ecuación de tal recta, y = a + bx, junto con z = 0, son las ecuaciones de 138 restricción. Si el alambre está en forma parabólica, y = bx 2 y z = 0 son las ecuaciones de restricción. Considere una vez más la figura 2-19. Se ve que para movimiento vertical únicamente x1 = C1, z1 =b1 ; x2 = C2, z2 =b2 ; etc. y1 +y3 = constante; te cons y y y tan ) ( 2 1 3 4 2 · − + (2.18) en donde x1 y z1 son las coordenadas de m1 ; c1 y b1 son constantes, etc. Así, en definitiva, hay diez ecuaciones de restricción y los grados de libertad se han reducido de un máximo de doce, a dos. Puede decirse entonces, que diez coordenadas son superfluas. 5.5. Restricciones móviles. Con frecuencia se da el caso de que algunas, o todas las restricciones de un sistema estén en movimiento. Un ejemplo sencillo se muestra en la figura 2 -11 en donde la barra está girando en el plano XY alrededor del eje indicado, con velocidad angular constante, ω1. La cuenta m puede deslizarse libremente a lo largo de la barra y como α = ω1 t, la ecuación de restricción puede escribirse entonces, y = s + (tan ω1 t) x. Nótese que t aparece explícitamente en esta relación. Como extensión de este ejemplo, supóngase que los ejes X y Y del ejemplo en consideración son los mismos X2 y Y2 que se trasladan y giran en la figura 2-1; entonces, y2 = s + (tan ω1 t) x2. Por consiguiente, las ecuaciones de trasformación (2.14), en función de x2 y t (igualmente podrían haberse expresado en función de y2 y t) tienen la forma t sen t x s t x t a t v x z x ϖ ϖ ϖ ) tan ( cos 2 1 1 2 2 2 1 + − + + · (2.19) t t x s t sen x t a t v y y y ϖ ϖ ϖ cos ) tan ( 2 1 1 2 2 2 1 + + + + · en donde, tanto x1 como y1 son ahora funciones de x2 y t solamente. Observación general: Desde un punto de vista puramente matemático, las ecuaciones de restricción son sencillamente relaciones existentes entre las 3p posibles coordenadas que salvo por esto, son independientes. De una manera general, pueden indicarse como 0 ) , ,..., , ( 3 2 1 1 · t q q q p φ , en donde i = 1,2,…,3p-n (2.20) 5.6. Ecuaciones de transformación “reducidas”. Si se supone que no existen restricciones, sino posiblemente marcos de referencia móviles, las ecuaciones de trasformación que relacionan las coordenadas 139 rectangulares de las p partículas con las 3p coordenadas generalizadas, pueden indicarse como xi = ) , ,..., , ( 3 2 1 t q q q p , etc. Sin embargo, si hay restricciones fijas o móviles, las coordenadas superfluas pueden eliminarse de las relaciones anteriores mediante el uso de las ecuaciones de restricción, quedando xi = xi ) , ,..., , ( 2 1 t q q q n ; yi = yi ) , ,..., , ( 2 1 t q q q n ; zi = zi ) , ,..., , ( 2 1 t q q q n ; (2.21) las cuales contienen ahora únicamente las coordenadas que son independientes, en un número igual al de los grados de libertad del sistema. Nos referimos a estas ecuaciones llamándolas ecuaciones de trasformación “reducidas”. Debe aclararse que en (2.21) puede aparecer t explícitamente como resultado de tener coordenadas móviles, restricciones móviles, o ambos. Ejemplos sencillos de (2.21) lo constituyen las ecuaciones (2.12) en las que no aparece t, o también (2.19) en las que si aparece t, explícitamente. En breve se verá claramente la gran importancia que tienen relaciones como (2.21) para obtener expresiones de velocidad, energía cinética, energía potencial, etc., en función únicamente de las coordenadas independientes. Notas. (a) En algunos casos, el álgebra que se utilizaría para eliminar las coordenadas superfluas puede resultar complicada. (b) Los casos, relativamente escasos, de sistemas “noholonómicos”, permiten solamente que sus ecuaciones de restricción se escriban en forma diferencial, no integrable. Véase el numeral 9.12. 5.7. Velocidad expresada en coordenadas generalizadas. Las expresiones para la velocidad de un punto o de una partícula pueden obtenerse por cualquiera de los dos procedimientos siguientes. El primero pone de relieve la definición fundamental de velocidad y las ideas básicas físicas y geométricas pertinentes. El segundo procedimiento es más conveniente. (1) La velocidad para un elemento de trayectoria. ∆s. (∆s considerado como vector.) Supóngase que el punto p de la figura 2-19 se mueve una distancia ∆s desde a hasta b, en un tiempo ∆t. La velocidad promedio en el intervalo será ∆s/∆t. Cuando ∆t se aproxima a cero, se escribe Velocidad = . 0 lim s t s t · ∆ ∆ → ∆ (2.22) en donde . s es una cantidad vectorial de magnitud, dt ds , dirigida según la tangente a la trayectoria en a. Para apreciar mejor las ideas físicas y geométricas implicadas, puede pensarse que la partícula tiene una velocidad “en la dirección de la trayectoria” en todos los puntos de su recorrido. La anterior definición de velocidad no hace referencia a ningún sistema de coordenadas en particular. Pero naturalmente ∆s puede expresarse en cualquier 140 sistema que se desee de tal manera que al pasar al límite . , 0 s t → ∆ queda expresada en ese mismo sistema. Ejemplos: En coordenadas rectangulares, . ) ( ) ( ) ( ) ( 2 2 2 2 z y x s ∆ + ∆ + ∆ · ∆ Dividido por 2 ) ( t ∆ y pasando al límite, puede escribirse 2 2 2 2 z y x s     + + · (2.23) Fig. 2-19 Fig. 2-20 En las coordenadas esféricas (véase la figura 2-20), 2 2 2 2 2 2 2 ) ( ) ( ) ( ) ( φ θ θ ∆ + ∆ + ∆ · ∆ sen r r r s Por tanto 2 2 2 2 2 2 φ θ θ    sen r r r s + + · (2.24) En el sistema oblicuo bidimensional de la figura 2-5, supóngase que p representa una pequeña distancia cualquiera ∆s. Se observa que ) cos( ) )( ( 2 ) ( ) ( 2 1 2 1 2 α β − ∆ ∆ + ∆ · ∆ q q q s ; y por tanto ( ) α β− + + · cos 2 2 1 2 2 4 1 2 q q q q s      (2.25) ( ) ( ) ( ) ( ) θ φ φ θ φ θ φ φ θ θ θ − − + + + − + + + · + · sen r r r r r r r r r r r r s r r s                   1 2 2 1 2 2 2 2 2 2 1 2 1 2 2 1 2 1 2 2 2 2 1 2 1 2 1 2 cos 2 (2.26) Debe notarse que aunque la expresión de 2 s  resulta complicada, básicamente no es más que un elemento de longitud 2 s ∆ , dividido por el correspondiente elemento de tiempo t ∆ . Nótese también que tal como se ha expresado arriba, 2 s es función de todas las coordenadas, así como de sus derivadas con respecto al tiempo, es decir, (2) la velocidad, usando las ecuaciones de transformación. Si se tiene una expresión para en cierto sistema de coordenadas, podemos expresarla en otro sistema por medio del uso de ecuaciones de transformación (o de ecuaciones de transformación reducidas) que los relacionen entre si. Ejemplos: Derivando con respecto al tiempo las ecuaciones (2.6), y sustituyéndolas en (2.23), se obtiene (2.24). Derivando las relaciones (2.13) e insertándolas en (2.23) se obtienen, con poco trabajo, las ecuaciones (2.26). 141 De las relaciones (2.12) se concluye en forma inmediata, que las velocidades de las masa individuales vienen dadas por 4 4 1 4 3 1 4 2 1 4 1 , , 2 , s y q s y q s y q s y            − · − − · − − · + · (2.27) Naturalmente, esto supone que h sea constante. Nótese que todas las velocidades se expresan en función de 4 s y 1 q  , únicamente. Para utilizar en un ejemplo posterior, considérense las velocidades verticales, 1 y y 2 y de 1 m y 2 m , de la figura 2-8, con respecto al eje X, inmóvil. Se trata de expresarlas en términos de 1 y y 1 q . Como puede verse en el diagrama, 2 2 1 1 , q y y q y y − · + · y 2 2 1 1 q m q m · (relación del centro de masa). Por tanto, (2.28) (3) La velocidad expresada en función de las coordenadas móviles. Debe entenderse que en el método de Lagrange para solución de problemas, una de las primeras consideraciones consiste en determinar la velocidad de todas las partículas, con respecto a un marco inercial. Se utiliza un marco de referencia en el que algunas o todas las coordenadas seleccionadas sean no-inerciales, (lo cual implica que eventualmente se trate de hallar el movimiento del sistema con relación al marco móvil) la velocidad que se requiere no es la relativa al marco móvil, sino la relativa a los ejes inerciales, aunqu4e exp4esada en función de las coordenadas móviles. (La razón de lo anterior se vera con claridad en el capítulo 3.) Algunos ejemplos aclararán esto y mostrarán como obtener los resultados deseados. Como un caso sencillo, supóngase que los ejes X2, Y2 y Z2 de la figura 2-2 se mueven paralelamente al marco fijo X1, Y1, Z1 con aceleración constante (ax, ay, az). Las ecuaciones de transformación serán, , 2 2 2 1 1 x t a t v x x x + + · etc. Las componentes de la velocidad de p con relación a los ejes fijos 1 1 1 , , z y x     , y con respecto a los ejes móviles 2 2 2 , , z y x     . Utilizando las ecuaciones de transformación, 2 1 x t a v x x x   + + · , etc. (2.29) Lo cuál expresa la velocidad de p con relación a los ejes estacionarios pero en relación a las velocidades relativas de los ejes móviles, y del tiempo. Si se considera que el marco X2, Y2 y Z2 se mueve de cualquier manera, (con rotación y traslación) las ecuaciones correspondientes serían. , 2 3 2 2 2 1 2 3 2 2 2 1 0 1 z l y l x l z l y l x l x x         + + + + + + · etc. (2.30) En este caso x0, y0, z0 y todos los cosenos directores estarán cambiando con el tiempo. Las ecuaciones (2.30) desempeñan un papel muy importante en el estudio de la dinámica de los cuerpos rígidos, capítulo 9. Como último ejemplo, considérese el siguiente. D1 y D2 de la figura 2-21, son dos plataformas giratorias. D1 se mueve impulsada por un motor con una velocidad angular 1 θ  con respecto a la Tierra. D2 que está montada sobre D1 es movida por un segundo motor por una velocidad angular 2 θ  con relación a D1. Los ejes X1 y Y1 están fijos con 142 1 2 1 2 1 1 , q m m y y q y y       − · + · respecto a la Tierra. La línea ab está adherida a la superficie de D1. Los ejes X2 y Y2 están fijos a la superficie de D2. Una partícula de masa m puede moverse libremente, pero en contacto con D2. Se trata de hallar una expresión para su velocidad con respecto a la Tierra, pero en función de las coordenadas polares móviles, r,α, y otras magnitudes. Puede observarse finalmente que , 1 1 cos cos β θ r s x + · β θ rsen ssen y + · 1 1 en donde α θ θ β + + · 2 1 . Derivando y sustituyéndola en 2 1 2 1 2 y x v   + · , se obtiene, ) cos( 2 ) ( 2 2 1 2 2 2 2 1 2 1 2 2 α θ β θ β α θ θ θ + + + + + + · r s r r sen r s s v        (2.31) lo cual es correcto, sin importar en que forma los motores hagan variar con el tiempo a 1 θ  o 2 θ  .Si, como un caso especial, se supone que 1 θ  = ω1 = constante y que , tan 2 te cons c · · θ   entonces v será una función de r, α, α , r y t únicamente. Si se desea, b puede expresarse fácilmente en términos de las coordenadas rectangulares x2 y y2, derivando ) ( ) cos( cos 2 1 2 2 1 2 1 1 θ θ θ θ θ + − + + · sen y x s x ) cos( ) ( 2 1 2 2 1 2 1 1 θ θ θ θ θ + + + + · y sen x ssen x (2.31) y sustituyéndolas en. . 2 1 2 1 2 y x v   + · 5.8. Trabajo y energía cinética. (1) Proyección de un vector sobre una recta. A manera de repaso, considérese la forma siguiente de expresar la proyección de f de un vector cualquiera F, sobre la recta ob con cosenos directores l y m, como se muestra en la figura 2-22. Resulta claro que ) cos( cos β α θ − · · F F f = ) cos cos β α β α sen Fsen F + 143 Fig. 2-22 Pero como Fcos α = Fx y cosβ =1, etc., se tiene que f = Fxl + Fym . Extendiendo esto a las tres dimensiones f = Fxl + Fym + Fzn (2.33) En la figura 2-23, es un elemento ab de la linea AB r es la tangente en a cuyos cosenos directores son dx/ds, dy/ds y dz/ds. Por tanto, la proyección f de un vector cualquira F sobre r estará dada por. ds dz F ds dy F ds dx F F f z y x + + · · θ cos (2.34) Fig. 2-23 (2) Definición de trabajo Supóngase que F es una fuerza que actúa sobre un cuerpo en el punto a, y que este punto de aplicación se mueve sobre la trayectoria de a hasta b. Entonces (aunque el desplazamiento no se deba por compleo a F , sino también a otras fuerzas que estén actuando sobre el cuerpo) el elemento de trabajo dW hecho por F estará dado por dW= F ds cos θ, una cantidad escalar. Teniendo en cuenta (2.34) esto puede escribirse, dW= Fx dx+ Fy dy+ Fz dz (2.35) Así, el trabajo hecho a lo largo de una trayectoria A a B, será ∫ + + · B A z y x dz F dy F dx F W ) ( (2.36) 144 Esta expresión general es correcta, inclusive en el caso en que F varíe en magnitud y en dirección a medida que cambia de posición (puede ser una función de x, y y z) (3) Definición de energía cinética Supóngase que ahora F es la fuerza neta que acelera la partícula m mientras esta se mueve sobre la trayectoria AB. El trabajo realizado sobre la partícula está dado por (2.36) y si X, Y, Z son ejes inerciales, x m f x   · , etc. Si se escribe, x d x dx x     · , la ecuación (2.36) queda, ) ( ) ( ) ( 2 2 2 2 2 2 2 A B m B A m B A v v z y x z d z y d y x d x m W − · + + · + + · ∫       lo cual es una expresión del trabajo necesario para cambiar la velocidad de la partícula desde A v hasta B v , una magnitud escalar que depende únicamente de m y de los valores de A v y B v . Si la velocidad inicial A v =0, se tiene que 2 2 1 B mv W · lo cual conduce a la siguiente definición de energía cinética. La energía cinética de una partícula es el trabajo requerido para incrementar su velocidad desde el reposo hasta un cierto valor v, con respecto a un marco de referencia inercial. Como se ha demostrado, esto es igual a 2 2 1 mv ; y como es una magnitud escalar, la energía cinética T, de un sistema de p partículas, será ∑ · · p t t t v m T 1 2 2 1 (2.37) En donde naturalmente, las velocidades t v , pueden expresarse en cualquier sistema inercial de coordenadas y sus derivadas con respecto al tiempo, o en función de estas cantidades expresadas en coordenadas no –inerciales. Se la ecuación (2.37), se sigue la expresión para la energía cinética de un cuerpo rígido que gira con velocidad angular θ  . La velocidad de una cualquiera de las partículas θ  r es en donde r es la distancia normal que va desde el eje hasta la partícula. Si se considera que la masa de la partícula es dm y se reemplaza la suma por un integral la ecuación (2.37) podrá escribirse ∫ · · 2 ) ( 2 2 2 2 θ θ   I dm r T (2.38) En donde se ha definido el “momento de inercia” I por medio de la integral. Suponemos que el estudiante está familiarizado con el uso de la relación anterior en problemas sencillos y por tanto el estudio general de los momentos de inercia y la energía cinética de los cuerpos rígidos se aplaza para los capítulos 7 y 8. 5.9. Ejemplos ilustrativos de la energía cinética (1) Energía cinética de una partícula ) ( 2 . 2 . 2 . 2 z y x m T + + · véase la ecuación (2.23) 145 ) ( 2 . 2 2 2 . 2 2 . 2 φ θ θ sen r r r m T + + · véase la ecuación (2.24) (2.39) [ ] ) cos( 2 2 2 . 1 . . 2 2 . 2 1 α β − + + · q q q q m T véase la ecuación (2.25) Utilizando las ecuaciones (2.11) y la primera de las anteriores (con . z = 0) puede expresarse T en función de las coordenadas Ay q, y sus derivadas con respecto al tiempo. (2) Energía cinética del péndulo doble (fig 2.10). En coordenadas rectangulares ) ( 2 ) ( 2 . 2 2 . 2 2 2 . 2 1 . 2 1 1 y x m y x m T + + + · (2.40) Si las masas se hallan suspendidas por resortes o bandas de caucho, el sistema tiene cuatro grados de libertad y en la ecuación (2.40) no habrá coordenadas superfluas. Si en cambio, se supone que r1 es un hilo de longitud constante, se tendrá que te cons r y x tan 2 1 2 1 2 1 · · · . (una ecuación de restricción). Con esto puede eliminarse . y de (2.40), quedando ) ( 2 ) ( 2 . 2 2 . 2 2 2 2 1 2 1 2 1 . 2 1 1 y x m x r r x m T + + − · (2.41) En función de las coordenadas r1, r2, θ y φ (suponiendo que todas son variables, y con referencia a las ecuaciones (2.26)). ) ( 2 ( 2 ) ( 2 . . . 2 1 2 2 . 2 1 . 2 2 2 . 2 2 . 2 2 1 . 2 1 2 . 2 2 1 . 2 1 1 r r r r r r r r m r r m T + + + + + + + · φ θ θ (3) Energía cinética del sistema de la figura 2-9. Despreciando las masas de las poleas y suponiendo únicamente movimiento vertical . 2 4 4 . 2 3 3 . 2 2 2 . 2 1 1 2 2 2 2 y m y m y m y m T + + + · Aunque esta expresión es correcta, contiene dos coordenadas superfluas ya que el sistema tiene sólo dos grados de libertad. Por medio de las ecuaciones de restricción, y1 + y3 = C1 y (y3 – y4) + (y3 – y2) = C2 pueden eliminarse las velocidades . 3 y y . 4 y , quedando entonces 2 . . 1 4 2 2 . 4 2 2 1 . 4 3 1 2 ) ( 2 1 ) ( 2 1 y y m y m m y m m m T + + + + + · (2.43) 146 Aplicando acá las relaciones (2.27), en forma inmediata puede expresarse T en función de . 4 s y de . 1 q , si se desea. Como se ha observado, las coordenadas superfluas pueden ser eliminadas de T por medio de las ecuaciones de restricción. Esta posibilidad reviste importancia en desarrollos posteriores. (3) Energía cinética expresada en coordenadas no-inerciales Básicamente, la energía cinética se toma siempre con respecto a un marco inercial puesto que las velocidades v4 en la ecuación (2.37) deben ser medidas en coordenadas inerciales. Sin embargo, como ya se explicó, las expresiones de v1 en coordenadas inerciales pueden escribirse en función de coordenadas no-inerciales por medio de las ecuaciones de transformación adecuadas. (a) Considérese el sistema de la figura 2-8. Para movimiento vertical únicamente 2 2 . 2 2 1 . 1 2 1 2 1 y m y m T + · puesto que y1 y y2 son inerciales. Nótese que T no es igual a 2 3 . 2 2 1 . 1 2 1 2 1 y m y m + , ya que y3 es no-inercial. Sin embargo, T puede expresarse en función de . 1 y y . 3 y , como sigue. Como y3 = y1 – y2, . 3 y = . 1 y - . 2 y , entonces, 2 3 . 1 . 2 2 1 . 1 ) ( 2 1 2 1 y y m y m T − + · Si, por otra parte, se eliminan . 1 y y . 2 y de la expresión original, T, en función de . y y . 1 q (y es inercial pero q1 es no-inercial) queda, 1 . 2 2 1 1 2 . 2 1 ) ( 2 ) 2 ( q m m m m y m m T + + + · (2.44) Y en función de . y y . 3 y , 2 3 . 2 1 2 1 2 . 2 1 ) ( 2 1 ) 2 ( y m m m m y m m T + + + · (b) Considérese el primero de los ejemplos estudiados en el numeral 2.7(3). Aplicando las ecuaciones (2.29) vemos que si p representa una partícula, su energía cinética es ] ] ] ] , ` . | + + + , ` . | + + + , ` . | + + · 2 . 2 2 . 2 2 . 2 2 1 z t v y t v x t v m T z z y y x x α α α (2.45) en donde vx, αx, etc… son constantes. Nótese que la expresión incluye explícitamente el tiempo. (c) Si el origen 0, de la figura 2.1, posee una velocidad inicial (vx, vy) y una aceleración constante (αx, αy) al mismo tiempo que los ejes giran con una velocidad angular constante w, de las ecuaciones (2.14) tenemos 147 wt w y senwt y wsenwt x wt x t v x x x cos cos 2 . 2 2 . 2 1 . − − − + + · α Al tomar esta ecuación junto con la expresión de . 1 y y remplazarlas en , ` . | + · 2 1 . 2 1 . 2 1 y x m T tendremos a T en función de x2, y2 , 2 . x , 2 . y , t. (d) Con referencia a la figura 2-21 y a al ecuación (2.31) reobserva que la energía cinética de la partícula que puede deslizarse libremente en contacto con la segunda superficie giratoria, está dada por ( ) ( ) ] ] ] ] + + + + + + · α θ β θ β α θ θ θ 2 . 1 . . 2 . 2 2 2 . . 1 2 1 . 2 cos 2 2 2 1 r s r r sen r s s m T (2.46) Debe notarse que (2.46) es correcta, no importa la suposición que se haga respecto de las variaciones con el tiempo de θ1 y de θ2. En el caso de velocidades angulares constantes, sencillamente se remplazan . 1 θ y . 2 θ por las constantes w1 y w2. Pero si se supone que D1 y D2 oscilan según θ1 = A senαt y θ2 = Bsenbt, entonces se deben remplazar . 1 θ y . 2 θ por Aacosαt y Bbcosbt, respectivamente. En tal caso T incluirá a t, explícitamente. En tal caso T incluirá a t, explícitamente. 5.10.Teorema de “centro de masa” para la energía cinética Considérese un sistema de p partículas que se mueven con respecto a un marco inercial X, Y, Z. Supóngase un segundo marco X´, Y´, Z´ cuyo origen está situado en el centro de masa de partículas y se mueve sólidamente con este, al mismo tiempo que sus ejes X´, Y´ Z´ se conservan paralelos a X, Y, Z respectivamente. Las ecuaciones de transformación que relacionan las coordenadas de una partícula de un sistema con las del otro, serán x = . x +x´, y = . y +y´ y z = . z +z´ en donde . x , . y y . z son coordenadas del origen del marco móvil. Así pues ∑ ∑ · · ] ] ] ] , ` . | + + , ` . | + + , ` . | + · , ` . | + + · p i i i i i p i i i i i z z y y x x m z y x m T 1 2 . ´ . 2 . ´ . 2 . ´ . 1 . 2 . 2 . 2 2 1 2 1 Al hacer la expansión escribiendo M = ∑m, y teniendo en cuenta que por la definición del centro de masa, ∑m1x1 = 0, que ∑m1 . x 1 = 0, etc…, la expresión anterior se reduce a ∑ · ] ] ] ] , ` . | + , ` . | + , ` . | + , ` . | + + · p i i i i i i i i z y x m z y x M T 1 2 . ´ 2 . ´ 2 . ´ . 2 . 2 . 2 2 1 2 (2.47) Con relación a (2.47) deben hacerse cuatro observaciones importantes: 148 (a) Tal expresión demuestra que la energía cinética de un sistema de partículas es igual a la de una “partícula” única de masa M = ∑m, (masa total del sistema) localizada en el centro de masa y moviéndose solidariamente con él, sumada a las energías cinéticas de todas las partícula calculadas con respecto al marco X´, Y´, Z ´, como si éste último fuera inercial. (b) Lo anterior es igualmente cierto, sin importar si las partículas son libres o si tienen cualquier tipo de restricción. En realidad esto puede aplicarse inclusive a los cuerpos rígidos, en cuyo caso el movimiento con relación al marco móvil sólo puede tomar la forma de una rotación. (c) Si el sistema se supone dividido en dos o más grupos de partículas, es evidente que el teorema puede aplicarse a cada uno de estos grupos en forma individual. (d) A pesar de que (2.47) se ha escrito en coordenadas rectangulares, es lógico pensar que esta forma de T puede expresarse en cualquier otro sistema conveniente de coordenadas por medio de las ecuaciones de transformación adecuadas. 5.11. Una expresión general para la energía cinética de p partículas A continuación se obtendrá una expresión muy general para la energía cinética de un sistema de p partículas que poseen n grados de libertad y 3p-n grados de restricción. Se supone que algunas o todas las restricciones pueden moverse y que algunas o todas las coordenadas generalizadas son no-inerciales. Esta expresión será muy útil en los capítulos siguientes. (1) Como etapa introductoria considérese la energía cinética de una partícula única que tenga tres grados de libertad (sin restricciones). Suponiendo que alguna o todas las coordenadas generalizadas se mueven (q1, q2 ,q3 ), las ecuaciones de transformación pueden indicarse como ( ) ( ) ( ) t q q q z z t q q q y y t q q q x x , , , ; , , , ; , , , 3 2 1 3 2 1 3 2 1 · · · Derivando etc t x q q x q q x q q x x , . 3 3 . 2 2 . 1 1 . ∂ ∂ + ∂ ∂ + ∂ ∂ + ∂ ∂ · Por conveniencia escribimos α + + + · 3 . 3 2 . 2 1 . 1 . q a q a q a x Y similarmente, λ β + + + · + + + · 3 . 3 2 . 2 1 . 1 . 3 . 3 2 . 2 1 . 1 . , q c q c q c z q b q b q b y En donde, por ejemplo, etc q y b , 3 3 ∂ ∂ · Elevando al cuadrado estas expresiones y remplazando 2 . x , 2 . y y 2 . z en ) ( 2 . 2 . 2 . 2 z y x m T + + · , se obtiene finalmente, ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ] ] ] ] ] ] ] ] + + + + + + + + + + + + + + + + + + + + + + + + + + + + + · 2 2 2 3 . 3 3 3 2 . 2 2 2 1 . 1 1 1 3 . 2 . 3 2 3 2 3 2 3 . 1 . 3 1 3 1 3 1 2 . 1 . 2 1 2 1 2 1 2 3 . 2 3 2 3 2 3 2 2 . 2 2 2 2 2 2 2 1 . 2 1 2 1 2 1 2 2 2 2 2 2 2 1 γ β α γ β α γ β α γ β α q c b a q c b a q c b a q q c c b b a a q q c c b b a a q q c c b b a a q c b a q c b a q c b a m T (2.48) 149 Nótese que T contiene cuatro clases de términos: los que contienen 2 . r q , los que tienen s r q q . . , los que llevan r q . únicamente y por último, los que no incluyen ninguna velocidad de las coordenadas. Sin embargo todos los términos son dimensionalmente equivalentes a 2 Mv El ejemplo que se da a continuación aportará un mayor sentido a la expresión siguiente. Haciendo referencia a la figura 2-5 y suponiendo que el origen de los ejes Q1 y Q2 tiene una aceleración lineal constante α (sin rotación), se ve que β α α cos cos 2 1 2 1 2 0 q q t t v x x x z + + + + · (2.49) β α α sen q sen q t t v y y y y 2 1 2 0 2 1 + + + + · Derivando y remplazando 2 . x y 2 . y en , ` . | + 2 . 2 . 2 1 y x m , tenemos ( ) ( ) ( ) [ ] ( ) ( ) [ ] ( ) ( ) ] ] ] ] ] ] ] ] + + + + + + + + + + + + + + − + + · 2 2 2 2 2 2 . 1 . 2 . 1 . 2 2 . 2 1 . 2 cos 2 cos 2 cos 2 2 1 y x y x y y x x y y x x y y x x v v t a a t a v a v q sen t a v t a v q sen t a v t a v q q q q m T β β α α α β (2.50) Por simple inspección puede concluirse que (2.50) tiene exactamente la forma de (2.48). En efecto, cada uno de los términos de (2.50) puede ser obtenido del correspondiente de (2.48) al evaluar los factores a, b, c, etc., por medio de las relaciones (2.49). La relación (2.50) presenta una buena oportunidad para destacar un punto básico. A pesar de su complejidad, el miembro derecho de la ecuación es sencillamente 2 2 , ` . | ∆ ∆ t s m , en donde ∆s es un desplazamiento de p con relación al marco inercial X, Y. (2) Para considerar ahora el caso más general mencionado al principio de este numeral, las ecuaciones de transformación pueden escribirse como etc t q q q x x n ), , ,..., , ( 2 1 1 1 · (2.51) En donde i va desde 1 hasta p y además se ha supuesto que las coordenadas superfluas se han eliminado por medio de las ecuaciones de restricción. Derivando estas relaciones, tenemos ∑ · + · n k i k ik i q a x 1 . . α ∑ · + · n k i k ik i q b y 1 . . β ∑ · + · n k i k ik i q c z 1 . . γ (2.52) Aquí, por ejemplo, t x q x a i k ik ∂ ∂ · ∂ ∂ · α , , etc. Nótese que aik ≠ aki, etc. Por un proceso directo de elevación al cuadrado, puede demostrarse que 150 ∑∑ ∑ · · · + + · n k n i n k i k ik i t k il ik i q a q q a a x 1 1 1 2 . . . 2 . 2 α α (2.53) Ecuaciones semejantes se pueden obtener para 2 . i y y 2 . i z . Eliminando 2 . 2 . 2 . , i i i z y y x de ∑ · , ` . | + + · p i i i i i z y x m T 1 2 . 2 . 2 . 2 1 Y agrupando los términos, ( ) ( ) ( ) ∑ ∑ ∑ ∑∑ ∑ · · · · · · + + + ] ] ] + + + ] ] ] + + · p i i i i i n k k p i ik i ik i ik i i n k n i p i l k il ik il ik il ik i m q c b a m q q c c b b a a m T 1 2 2 2 1 . 1 1 1 1 . . 2 1 2 1 γ β α γ β α (2.54) Lo anterior puede escribirse en forma más breve, así: c q B q q A T n k k k n k t k kl ∑ ∑ · · + + · 1 . 1 . . (2.55) En donde el significado de Akl, de Bk y de C resulta evidente. Nótese que si t no aparece explícitamente en las ecuaciones (2.51) (si no hay restricciones o marcos de referencia móviles), αi = βi = γi = 0. Por tanto (2.55) se reduce a ∑ · · n k t k kl q q A T 1 . . (2.56) Debe entenderse que (2.51), (2.55) y (2.56) no son simplemente relaciones académicas que habrán de permanecer siempre en forma simbólica. Como se demostró en el ejemplo anterior, las relaciones (2.51) (relaciones de transformación con las coordenadas superfluas eliminadas) pueden escribirse normalmente en forma explícita para cualquier problema en particular. Para esto pueden obtenerse en forma inmediata por medio dediferenciación parcial, valores para Akl Bk y C y finalmente para T. Debe observarse que Akl Bk y C, en general no son constantes, sino funciones de q1, q2, …, qn y t pero no de las q. Nótese además que Akl = Alk En el capítulo 8 se deduce una expresión para la energía cinética de un cuerpo rígido, más útil que (2.55).Véase la ecuación (8.10). 5.12.Definición de aceleración y ejemplos Las ecuaciones de Lagrange tienen en cuenta automáticamente todas las aceleraciones sin necesidad de darle a esto ninguna consideración especial. Sin embargo, teniendo en cuenta la importancia de esta magnitud en los principios básicos y en el desarrollo de la dinámica, se incluye aquí un breve repaso de la definición y de los procedimientos para plantear las expresiones generales. (1) Consideraciones generales Imagínese un punto (o una partícula) que se mueve en el espacio según la trayectoria AB, como se muestra en la figura 2-24. en el punto p1 su velocidad es v1 y luego de un lapso ∆t, en el punto p2 su velocidad será v2. En general v2 no tiene ni la misma dirección ni la misma magnitud de v1. Así pues, el cambio ∆v representa un 151 cambio no solamente en magnitud, sino también en dirección. Teniendo esto en cuenta, se define la aceleración del punto móvil en p1, como t v a ∆ ∆ · 1 para ∆t→0, o sea, dt dv a · (2.57) Fig 2-24 Es claro que a es un magnitud vectorial que tiene la dirección de ∆v1 cuando ∆t→0. Esta definición trae consigo el hecho importante de que el vector aceleración, en general no lleva la dirección del movimiento. (Nótese que el vector velocidad v = ds/dt, definido en el numeral 2.7 lleva siempre la “dirección de la trayectoria”.) La definición de aceleración de (2.57) no incluye referencia a ningún sistema de coordenadas en particular. Pero como las componentes rectangulares de ∆v son . . . , z y y x ∆ ∆ ∆ su magnitud está dada por 2 . . 2 . 2 2 ) ( ) ( ) ( ) ( z y x v ∆ + ∆ + ∆ · ∆ dividiendo por (∆t) 2 y pasando al límite, la magnitud de a estará dada por 2 .. 2 .. 2 .. 2 z y x a + + · (2.58) Naturalmente su dirección está determinada por los cosenos directores a z a y a x / , / , / .. .. .. (2) La aceleración expresada en coordenadas generalizadas La magnitud de a, dada por (2.58) así como sus cosenos directores, pueden expresarse en cualquier otro sistema de coordenadas por medio de las ecuaciones de transformación adecuadas. Ejemplos: (a) Aplicando las ecuaciones (2.6) .. .. .. , , z y x y luego (2.58), pueden expresarse en coordenadas esféricas. (b) Usando las dos últimas ecuaciones de (2.13) y (2.58) puede expresarse la aceleración de m2 en función de r1, r2, θ y φ y de sus derivadas con respecto al tiempo. (c) Por medio de (2.32) y (2.58) puede obtenerse fácilmente una relación para la aceleración de la partícla que se muestra en la figura 2-21, con respecto a los ejes estacionarios X1 y Y1 pero expresada en función de las coordenadas móviles x2 y y2, sus derivadas con respecto al tiempo, y el tiempo mismo. (el tiempo aparece explícitamente cuando se supone que θ1 y θ2 varían de alguna manera en particular con respecto al tiempo.) (3) Componentes de la aceleración total según una dirección cualquiera La componente a´ de la aceleración a lo largo de una recta con cosenos directores l, m y n está dada por (véase la ecuación 2.33) 152 .. .. .. ´ z n y m x l a + + · (2.59) Lo cual puede, naturalmente, expresarse en otras coordenadas. (a) Considérese las expresiones de las componentes de a a lo largo de las coordenadas en el sistema esférico (ar, aθ y aφ); es decir, en las direcciones de los elementos de restas indicados por ∆r, r∆θ y rsenθ∆θ y de la fig 2-20. Examinaremos a aφ en detalle. Los cosenos de los ángulos que rsenθ∆θ forma con los ejes X, Y y Z son: - senφ, cosφ y 0, respectivamente. Por tanto, aφ = - φ φ cos .. .. y sen x + . Eliminando .. .. y y x por medio de (2.6) después de una cantidad considerables de operaciones monótonas, finalmente se obtiene la siguiente expresión. θ θ φ θ θ φ cos 2 2 . .. .. sen r r r a − + · (2.60) (b) Haciendo referencia a la fig 2-21, se trata de determinar la componente en la dirección del radio r, de la aceleración de m. Se tiene que 1 .. 1 .. y m x l a r + · en donde l y m son los cosenos directores de r con relación a los ejes estacionarios; es decir, l=cosβ y m = senβ. Aplicando , 1 1 1 , 1 1 1 cos cos β θ β θ rsen ssen y r s x + · + · Se obtiene ) cos( ) ( ) ( 2 .. 2 1 2 .. 1 2 2 . 1 . .. α θ θ α θ θ α θ θ + − + + + + − · s sen s r r a r (2.61) Cuando se especifica la manera comos e hacer girarlas plataformas, ar contiene a t explícitamente. Como se demuestra en el numeral 3.9 del cap , éstas y otras expresiones para la aceleración pueden determinarse fácil y rápidamente a partir de las ecuaciones e Lagrange. 5.13.“Desplazamientos reales y virtuales; trabajo virtual. Los desplazamientos virtuales y el trabajo virtual desempeñan un papel muy importante, como los medios para llegar a un fin, en los desarrollos básicos de al dinámica analítica. Pero una vez que has servido se útil objetivo, desaparecen del cuadro. 1) Desplazamientos reales y virtuales; trabajo virtual Para simplificar , considérese una partícula de masa m que se restringe a moverse en contacto con una superficie rugosa, la cual a su vez está en movimiento. Al sufrir la acción de una fuerza F, m se mueve según una tryectoria determinada (dad por las leyes de Nexton) en el espacio y al mismo traza una curva sobre la superficie. Durante un intervalo de tiempo dt, m experiementa un desplazamiento específico ds (dx, dy, dz) medido conrespecto a unos ejes estacionarios, por ejemplo. Al referirse a ds aquí se llama desplazamiento “real” o “verdadero”. Considérese ahora un desplazamiento arbitrario infinitesimal cualquiera δ s (δ x, δ y, δ z) o necesariamente según la trayectoria mencionada. En este caso δ s es llamado desplazamiento virtual. Por conveniencia, a continuación se mencionan tres clases de tales desplazamientos: a) δs en cualquier dirección en el espacio, ignorando por 153 completo la superficie; b) δs en cualquier dirección sobre la superficie móvil, y c) en cualquier dirección sobre la superficie, considerada ahora como estacionaria. ( ) ∑ · + + · p i i i i i i i z Fz y Fy x Fx W 1 δ δ δ δ (2.62) (2) Forma en que las expresiones de δW se hacen útiles La sorprendente importancia de (2.62) radica eventualmente en las siguientes consideraciones. (a) Utilizando xi = xi (q1, q2, …, q3, t), etc (en donde aparece un máximo de 3p coordenadas) se tiene etc t t x q q x q q x q q x x i p p i i i i i , ... 3 3 2 2 1 δ δ δ δ δ ∂ ∂ + ∂ ∂ + + ∂ ∂ + ∂ ∂ · para δy y δz. Para estos desplazamientos, que no tinene en cuenta necesariamente las restricciones, es claro que δW contiene el trabajo hecho por las fuerzas de restricción. (b) Empleando las relaciones (2.21) véase 2.6 etc t t x q q x q q x q q x x i n n i i i i i , ... 2 2 1 δ δ δ δ δ ∂ ∂ + ∂ ∂ + + ∂ ∂ + ∂ ∂ · Estos desplazamiento no violan las restricciones, pero durante el tiempo trascurrido δt los marcos móviles y las restricciones móviles habrán cambiado de posición ligeramente. Entonces, como se demostrará en los ejemplos, δW todavía contiene el trabajo hecho por las fuerzas de restricción. (c) Determinando los desplazamientos por medio de (2.21) pero conservando el tiempo constante , etc q q x q q x q q x x n n i i i i i , ... 2 2 1 δ δ δ δ ∂ ∂ + + ∂ ∂ + ∂ ∂ · (2.63) Estos desplazamientos tiene en cuenta las restricciones y por consiguiente, el trabajo hecho por las fuerzas de restricción suma cero. En efecto, las fuerzas de restricción se han eliminado de (2.62) En tanto que la velocidad de esta afirmación puede ser comprobada con ejemplos sencillos, usualmente no se intenta una demostración general sino que puede considerarse como un postulado básico. Este sistema para eliminar las fuerzas de restricción es una de las grandes realizaciones del método de Lagrange Las consideraciones anteriores son de vital importancia en el principiop de DÁlembert. En los cap 3 y 4 se verá con claridad su trascendencia en un método concreto de planteamiento de las ecuaciones del movimiento, prácticamente todo sistema dinámico. 5.14.RESUMEN Y OBSERVACIONES 1. Sistemas de coordenadas y ecuaciones de transformación (numeral 2.2) 154 Una de las primeras etapas en la solución de cualquier problema es la selección de las coordenadas adecuadas. Las ecuaciones de transformación desempeñan un papel muy importante al expresar la energía cinética, la aceleración y muchas otras magnitudes importantes, en unción de las coordenadas seleccionadas. Varios desarrollos teóricos dependen del uso de las ecuaciones de transformación. 2. Coordenadas generalizadas y grados de libertad (2.3) “Coordenada generalizada” es un término conveniente para una coordenada cualquiera. La utilización de q1, q2, …,qn para designar las coordenadas generalizadas es prácticamente universal y tiene ventajas definitivas. Antes de poder comenzar a trabajar en un problema, debe conocerse el numero de grados de libertas del sistema, lo cual puede determinarse por simple inspección. 3. Grados de restricción, ecuaciones de restricción y coordenadas superfluas (2.4,2.5 y 2.6) Es indispensable un entendimiento del sentido físico y geométrico de las restricciones y de la manera como cada uno de los grados de restricción puede expresarse por medio de una “ecuación de restricción” correspondiente. Utilizando estas ecuaciones, las coordenadas superfluas pueden ser eliminadas de las ecuaciones de transformación, de la energía cinética, de la energía potencial y demás magnitudes. 4. Velocidad en coordenadas generalizadas (2.7) La velocidad de una partícula puede expresarse en términos de cualquier sistema de coordenadas generalizadas y de sus derivadas con respecto al tiempo. Con frecuencia aparece t. las etapas posteriores no pueden emprenderse sin un conocimiento de cómo se hace esto. De aquí la importancia del numeral2.7. 5. Trabajo y energía cinética (2.8, 2.9, 2.10 y 2.11) Es imprescindible un entendimiento de las definiciones correctas de trabajo y energía cinética. Es de una importancia extrema el tener en cuenta que la energía cinética debe considerarse con respecto al espacio inercial. Siempre se empieza escribiendo T en coordenadas inerciales. Puede entonces, si se desea, expresarse en función de otras coordenadas (inerciale, no-inerciales o mixtas) por medio de las ecuaciones de transformación apropiadas. 6. Aceleración (2.12) El análisis hecho por objeto aclarar la definición básica de aceleración y demostrar que sus componentes en cualquier dirección pueden expresarse en coordenadas generalizadas. Sin embargo, a pesar de que la aceleración desempeña un papel básico en todas alas ecuaciones del movimiento, la técnica anterior no tiene una importancia vital ya que, como se demuestra en el numeral 3,10 las ecuaciones de Lagrange tiene en cuenta automáticamente las componentes de la aceleración. 7. Desplazamientos virtuales y trabajo virtual (2.13 y 2.14) Los métodos generales empleados en este libro dependen de los conceptos de los desplazamientos virtuales, del trabajo virtual y de su utilización. Muchos de los desarrollos posteriores emplean el estudio hecho. Una última palabra: como se verá en los capítulos 3 y 4 los puntos 1 a 7 anteriores (exceptuando el 6) constituyen la materia básica fundamental para poder entender las 155 ecuaciones de Lagrange y son, en realidad, las etapas preliminares que deben seguirse al aplicar estas ecuaciones. 6. ECUACIONES DEL MOVIMIENTO DE LAGRANGE PARA UNA PARTICULA 6.1. Consideraciones preliminares. Cualquiera de las varias maneras de formular leyes fundamentales de la dinámica puede tomarse como base para la deducción de las ecuaciones de Lagrange. En el presente texto se parte de las leyes del movimiento de Newton, se establece la ecuación de DÁlembert y de aquí, finalmente, se deducen las relaciones de Lagrange. Se sigue este proceso porque partiendo de territorio conocido conduce a campos desconocidos por un camino, en el cual, es fácil entender el significado físico y matemático de cada paso. Con el fin de eliminar algunos detalles que distraen nos limitaremos a la deducción y análisis de las ecuaciones de Lagrange para una partícula. El tratamiento más general aplicable a un sistema de muchas partículas, se deja para el capítulo 4. 6.2. Deducción de las ecuaciones de Lagrange para una partícula, sin coordenadas ni restricciones móviles. En aras de una mayor claridad se tendrá en cuenta una situación específica suponiendo que el movimiento de la partícula en consideración está reducido a una superficie lisa, tal como un plano o una esfera. En tal caso habrá dos grados de libertad, una ecuación de restricción, y no habrá fuerzas de fricción. Sea F, con componentes Fx, Fy y Fz, la suma vectorial de todas las fuerzas (aplicadas externamente, debidas a resortes, gravedad, restricción, etc.) que pueden estar actuando sobre la partícula. Entonces, suponiendo que la masa m es constante y que las coordenadas x, y y z son inerciales, las ecuaciones del movimiento de Newton para una “partícula libre” se escriben (3.1) Estas ecuaciones son correctas aunque el movimiento esté restringido, porque se supone que Fx, Fy y Fz incluyen cualquier fuerza de restricción que pueda estar actuando. Considérese ahora el trabajo δ W hecho por F al suponer que la partícula sufre un desplazamiento δs, completamente arbitrario e infinitesimal, con componentes δx, δy y δz (posiblemente bajo la acción de otra fuerza no incluidas en F). (Este se llama “trabajo virtual” de acuerdo con el numeral 2.13 del capítulo 2). Así pues, z F y F x F s F s F W x δ δ δ δ δ δ + + · · ) , cos( Nótese que como F incluye la fuerza de restricción, (.2) es correcto aunque δs puede no estar de acuerdo con las restricciones. (Es decir que δs puede tener una dirección tal, que la superficie sobre la cual se mueve m, se “distorsione” ligeramente.) Debe recordarse también, que el lado derecho de (3.2), como se demuestre en el numeral 2.8, tiene en cuenta el posible hecho que F y δs no tengan la misma dirección. Multiplicando ahora las ecuaciones (3.1) por δx, δy y δz respectivamente y sumando* se obtiene (3.3) 156 , ´´ x m F x · , ´´ y m F y · , ´´ z m F z · z F y F x F z z y y x x m z y x δ δ δ δ δ δ + + · + + ) ( ¨ ¨ ¨ El miembro derecho de esta expresión es igual al trabajo δW hecho por F y el miembro izquierdo puede interpretarse como el pequeño cambio correspondiente en la energía cinética de m. (Véase de nuevo el numeral 2.8) Esta ecuación será llamada “ecuación de DÁlembert “. Al introducir las coordenadas generalizadas en (3.3) y al realizar algunos manejos matemáticos, se obtiene las ecuaciones de Lagrange (3.15) y (3.16). Como se ha supuesto que el movimiento se halla restringido a una superficie, se requiere dos coordenadas generalizadas q1 y q2. Entonces, utilizando las ecuaciones de transformación apropiadas y una ecuación de restricción, es posible expresar las coordenadas de m: x, y y z en función de q1 y q2, lo cual se indica como sigue (véase el numeral 2.6) ), , ( 2 1 q q y y · ), , ( 2 1 q q z z · (3.4) _____________________________________________________________________ *Nota sobre la ecuación (3.3). Multiplicando las relaciones (3.1) por a, b y c respectivamente y sumando se obtiene M (xa + yb + zc) = Fxa+Fyb+Fzc Lo cual es una relación verdadera, independiente de la naturaleza de a, b y c. Pueden representarse constantes de cualquier valor, desplazamientos, velocidades o aún funciones de variables. Así, en cuanto concierne a (3.3) δx, δy, δz son magnitudes completamente arbitrarias. Sin embargo, para nuestro objetivo, las consideraremos como componentes de δs, el desplazamiento virtual infinitesimal de m. Además, en lo que sigue, se supondrán de acuerdo con la restricción. Al considerarlo así 3.3 se denomina con frecuencia “principio de DÁlembert”). Ejemplo específico para demostrar el significado de (3.4): Supóngase que la superficie restrictiva es una esfera de radio constante, r = C. En coordenadas esféricas, las relaciones específicas correspondientes a (3.4) serán entonces, (3.5) El tiempo no aparece en (3.4) puesto que se han tomado los ejes X, Y y Z, estacionarios, y una restricción fija. Los desplazamientos virtuales δx, δy y δz, por razones que se darán más adelante, se determinan a partir de (3.4). Es decir, (3.6) 157 ), , ( 2 1 q q x x · , cosφ θ Csen x · , φ θsen Csen y · , cosφ θ Csen x · φ cos C z · , 2 2 1 1 q q x q q x x δ δ δ δ δ δ δ + · , 2 2 1 1 q q y q q y y δ δ δ δ δ δ δ + · , 2 2 1 1 q q z q q z z δ δ δ δ δ δ δ + · Sustituyendo (3.6) en la ecuación de DÁlembert, (3.3), y agrupando términos. (3.7) En este punto el estudiante debe tener plena conciencia de ciertos hechos básicos. a. Como (3.4) representa las ecuaciones de la superficie restrictiva (3.6) representa un desplazamiento de acuerdo con la restricción. Por tanto δW de (3.7) corresponde a un desplazamiento de conformidad con la restricción (sobre la superficie). Considerando una vez más la esfera como caso especial δx, δy, δz determinados a partir de (3.5) son δx = C cos θ cos φδθ – senθδφ, etc. Lo cual representa claramente, un desplazamiento sobre la esfera. b. Las coordenadas q1 y q2 (θ y φ en (3.5)) son variables independientes; es decir, pueden dársele a ambas pequeños valores arbitrarios sin violar la restricción. Como resultado de a y b la suposición que la restricción es lisa, el trabajo ejecutado por la fuerza de restricción cuando una cualquiera de las coordenadas varía, o varían ambas simultáneamente, es igual a cero. (Véase el numeral 2.13). Por esta razón, en adelante no se necesita considerar la fuerza de restricción como parte de Fx, Fy, Fz. En otras palabras, se ha eliminado del cuadro la fuerza de restricción. Este un punto muy importante. Como q1 y q2 son variables independientes, fijaremos la atención en Wq1, es el trabajo hecho cuando solamente q1 puede variar (δq2 = 0). La ecuación 3.7 se reduce entonces a (3.8) Se utilizarán ahora las relaciones siguientes cuyas pruebas se incluyen abajo*, el momento el lector no necesita ocuparse de tales demostraciones. (3.9) (3.10) (3.11) 158 2 2 2 ¨ 2 2 ¨ 2 2 ¨ 1 1 1 ¨ 1 1 ¨ 1 1 ¨ q q q z z q q y y q q x x m q q q z z q q y y q q x x m W δ δ δ δ δ δ δ δ δ δ δ δ δ δ δ δ δ δ δ δ δ , ` . | + + + , ` . | + + · 2 2 2 2 2 1 1 1 1 q q z Fz q y Fy q q x x F q q z z F q y Fy q x x F W δ δ δ δ δ δ δ δ δ δ δ δ δ δ δ δ , ` . | + + + , ` . | + + · 1 1 ¨ 1 ¨ 1 ¨ 1 1 ¨ 1 ¨ 1 ¨ 1 q q z Fz q y Fy q x F q q z z q y y q x x m W x q δ δ δ δ δ δ δ δ δ δ δ δ δ δ δ , ` . | + + · , ` . | + + · . . 1 ¨ 1 1 , ` . | − , ` . | · q x dt d x q x x dt d q x x δ δ δ δ δ δ 1 . 1 dq x d q x · δ δ 1 1 . q x q x dt d δ δ δ δ · , ` . | Remplazando 3.10 en 3.9 se tiene (3.12) con un pequeño análisis se demuestra que esto puede escribirse como (3.13) Sustituyendo 3.13 y las relaciones semejantes para y y z en 3.8, se concluye que (3.14) Pero 1/2m (x 2 + y 2 + z 2 ) es la energía cinética T de la partícula por tanto, finalmente se escribe (3.15) *Para probar las relaciones (3.9), (3.10) y (3.11), se procede de la siguiente manera. Considérese la identidad Que es iguala 3.9. Para obtener 3.10 se observa que la derivada de la primera ecuación en 3.4, con respecto al tiempo es 159 . . . . . . 1 ¨ 1 dt x d x q x x dt d q x x − , ` . | · δ δ δ δ 1 2 1 2 . 2 . . 2 1 ¨ q x q x dt d q x x δ δ δ δ δ δ , ` . | − , ` . | , ` . | · 1 2 1 2 1 . 2 . 2 . 2 . . 2 . 2 . 2 . 1 q z y x m q z y x m q dt d W q δ δ δ δ δ δ ] ] ] ] ] ] ] , ` . | + + − , ` . | , ` . | + + · 1 1 1 1 q q z z F q y y F q x x F δ δ δ δ δ δ δ , ` . | + + · 1 1 1 1 . 1 q z Fz q y Fy q x Fx q T y q T dt d δ δ δ δ δ δ δ δ δ δ + + · − , ` . | 2 2 . . 1 q q x q dq dx x δ δ + · , ` . | + · , ` . | 1 1 1 . ¨ . 1 q x dt d x q x x q x x q x δ δ δ δ δ δ δ δ Derivando ahora ésta, parcialmente con respecto a q1, se nota que Para probar 3.11 se ve primero que como x = x(q1,q2), la derivada parcial, dx/dq1 es, en general, función de q1 y de q2, es decir dx/dq1 =φ(q1,q2). Derivando esto con respecto al tiempo, se obtiene Pero por la expresión de x, se sigue que Comparando las dos últimas ecuaciones se ve que 3.11 es correcta. Partiendo de 3.7 y considerando el trabajo δWq2 asociado con una variación de q2 únicamente, de una manera idéntica a la anterior, se llega a (3.16) Las expresiones 3.15 y 3.16 son las ecuaciones de Lagrange que se trataban de deducir. Por conveniencia se escribe, (3.17) En donde qr es una cualquiera de las coordenadas que aparecen en Tr y Fr se denomina “fuerza generalizada”. De tal manera, las ecuaciones de Lagrange toman la forma compacta (3.18) Como se verá en el capítulo siguiente, las ecuaciones de Lagrange tienen exactamente la misma forma para un sistema de muchas partículas. 160 1 1 . . q x q d x d δ δ · . ¨ . 2 1 2 1 1 1 1 q q x dq d q q x q q x dt d , ` . | + , ` . | · , ` . | δ δ δ δ δ δ δ δ . . 2 2 1 1 1 1 1 q q x dq d q q x q dq x d , ` . | + , ` . | · δ δ δ δ δ δ 2 2 2 2 . 2 q z Fz q y Fy q x Fx q T q T dt d δ δ δ δ δ δ δ δ δ δ + + · − , ` . | qr r r r F q z Fz q y Fy q x Fx · + + δ δ δ δ δ δ qr r r F q T q T dt d · − , ` . | . . δ δ δ δ Para el caso que se acaba de considerar (una partícula con dos grados de libertad), existen dos ecuaciones de Lagrange. Si se supusieran tres grados de libertad (una partícula sin restricciones), las relaciones (3.4) contendrían todas a q1, q2 y q3, y finalmente se obtendrían tres ecuaciones de Lagrange. En general, hay tantas ecuaciones del movimiento de Lagrange, cuantos grados de libertad se tengan. Sin embargo (y esto es importante tanto desde el punto de vista de las ideas básicas, como para ciertas aplicaciones) aunque en realidad la partícula tenga únicamente dos grados de libertad, todavía es posible escribir tres ecuaciones de Lagrange. Ignorando la restricción, se escribe x = x(q1,q2, q3), etc. Suponiendo que q1,q2 y q3 son variables independientes y siguiendo exactamente el procedimiento anterior, se obtiene una ecuación de Lagrange correspondiente a cada una de las tres coordenadas. Existe, sin embargo, la siguiente consideración importante: El desplazamiento δs, correspondiente a δq1, δq2 y δq3, obviamente no está de acuerdo con la restricción. (En el ejemplo especial en consideración, La cual no esta sobre la superficie de la esfera ya que δr n se ha igual a cero.) Por tanto δW incluye el trabajo hecho por la fuerza de restricción(reacción entre la partícula y la superficie) y las componentes de esta fuerza deben incluirse en Fx, Fy Fz. No se ha eliminado la fuerza de restricción. Con esto en mente, las tres ecuaciones son absolutamente correctas. Por razones obvias, entonces, todas las coordenadas superfluas son normalmente eliminadas de las ecuaciones de transformación y de T. Sin embargo, el procedimiento anterior de introducir deliberadamente coordenadas superfluas puede ser la base de un poderoso método para hallar las fuerzas de restricción. Véase el capítulo 12. 6.3. Compendio de detalles importantes relacionados con las ecuaciones de Lagrange. a.) Ecuaciones diferenciales del movimiento Las ecuaciones diferenciales del movimiento para cualquier problema específico se obtienen, naturalmente, por medio de las operaciones indicadas en 3.18. Para sistemas de n grados de libertad, solamente n coordenada (y sus derivadas con respecto al tiempo) deben aparecer en T]. Las coordenadas superfluas deben ser eliminadas como en el numeral 2.6. b) Significado de las fuerzas generalizadas. No sobra insistir sobre la importancia de obtener un claro entendimiento del simple significado físico de las fuerzas generalizadas (relación (3.17)) tanto para fines de las ideas básicas, como para sus aplicaciones. La expresión z F y F x F W x δ δ δ δ + + · es una ecuación general que determina el elemento de trabajo hecho por una fuerza (de componentes Fx, Fy y Fz) en un desplazamiento general δs (de componentes δx, δy y δz). Considérese ahora δW cuando δs está de acuerdo con la restricción y sólo q, varia (δq2 = 0). Tal desplazamiento se obtiene si las componentes δx, δy y δz provienen de (3.4), haciendo q2 constante; es decir 161 , cos cos cos φ θ δφ φ θ δθ φ θ δ δ sen sen r r rsen x − + · 1 1 q q x x δ δ δ δ · 1 1 q q y y δ δ δ δ · 1 1 q q z z δ δ δ δ · Sustituyendo en la ecuación anterior para δW, se tiene Que es, claramente, Fq1δq1. Entonces una fuerza generalizada es una magnitud de tal naturaleza que el producto Fqrδqr es el trabajo hecho por fuerzas impulsoras (sin incluir fuerzas "inerciales", ni de restricción) cuando q1 sólo varía en una cantidad igual a + δqr. Las fuerzas generalizadas no son siempre fuerzas en el sentido corriente de la palabra. Por ejemplo, si qr es un ángulo θ, Fo debe ser un momento (o torque) a fin de que Foδ θ sea un trabajo. Si qr es el área A. de la figura 2-6, FA δA=δW y naturalmente, FA debe tener las dimensiones de una fuerza dividida por una longitud. (e) Técnica para obtener expresiones Puede seguirse uno de los tres métodos siguientes. Sustituyendo expresiones conocidas de Fx, Fy, Fz junto con (Obtenidas tomando derivadas de (3.4) en (3.17) se obtienen Fqr . Usualmente Fx, Fy, Fz no son constantes sino funciones de las coordenadas, del tiempo, de la velocidad, etc. En cualquier caso, las expresiones de estas fuerzas deben conocerse por la naturaleza del problema en consideración. Este método es directo pero puede resultar largo y monótono. Un segundo método, que en muchos casos es más fácil y más atractivo desde el punto de vista de lo que sucede físicamente, es el siguiente: Imagínese una de las coordenadas que aparecen en T, mantenidas constantes. Determínese ahora, por cualquier sistema adecuado, el trabajo δWqr hecho por todas las fuerzas impulsoras (sin incluir las de restricción). Acontinuación se resuelve la ecuación (3.19) Para obtener Fqr. Al determinar , r Wq δ el trabajo se toma como positivo o como negativo según si la fuerza o fuerzas tienden a hacer aumentar o disminuir la coordenada qr. Si la partícula tiene dos o tres grados de libertad, en ocasiones es más convenientes suponer desplazamientos simultáneos δq1, δq2 y δq3 y escribir el trabajo total correspondiente δW total, el cual tomará la forma δWtotal = [….]δq1+[….]δq2+[….]δq3 (3.20) En donde los paréntesis cuadrados aparecen en el lugar correspondiente a Fq. Los ejemplos siguientes aclaran esta técnica. c. De las fuerzas inerciales en las ecuaciones de Lagrange La expresión “fuerza inercial” como se utiliza aquí, se refiere a (masa) x (aceleración). Términos como 162 1 1 1 1 1 q q z Fz q y F q x F W y x q δ δ δ δ δ δ δ δ , ` . | + + · qr z qr y qr x δ δ δ δ δ δ + + r r r q Fq Wq δ δ · Sirven como ejemplos. Una mirada al miembro izquierdo de 3.3 y a las ecuaciones siguientes hasta 3.18 muestra que las fuerzas inerciales aparecen exclusivamente Así mismo, es claro que en Fqr aparecen únicamente fuerzas aplicadas. En otras palabras, al escribir las ecuaciones de movimiento de Lagrange, para cualquier sistema, debe recordarse que el miembro izquierdo de 3.18 automáticamente tiene en cuenta todas las fuerzas inerciales y que al tratar de hallar expresiones para Fqr, solamente deben considerarse fuerzas impulsoras. (Nunca se incluyen en Fqr fuerzas tales como la centrífuga, la de Coriolis, etc.) 6.4. Integración de las ecuaciones diferenciales del movimiento. Un hecho desafortunado que todo científico aplicado debe afrontar, es que en la gran mayoría de los problemas las ecuaciones del movimiento son tan complicadas que no se encuentran métodos disponibles para su integración. En ciertos casos puede hacerse aproximaciones justificables o suposiciones que tiendan a simplificar las ecuaciones y a reducirlas a formas integrables. Afortunadamente, sin embargo, aparecen como salvación los computadores, los cuales permiten obtener ahora soluciones gráficas o numéricas para ecuaciones que por otra parte resultaban “insolubles”. En este texto se presentan parcial o totalmente las integraciones cuando esto es posible y conveniente. Pero primordialmente la atención se concentra en plantear correctamente las ecuaciones del movimiento. 6.5. Ejemplos ilustrativos El valor pedagógico de unos pocos ejemplos es muy superior al de varias páginas de observaciones. Este es el mejor método para “explicar las explicaciones”. Ejemplo 3.1: Considérese el movimiento de un proyectil con respecto a un sistema de ejes rectangulares adherido a la Tierra. Considerando estos ejes como inerciales y tratando el proyectil como una partícula de masa m, se escribe, De donde 163 r r q T q T dt d δ δ δ δ − , ` . | . , ` . | + + · 2 . 2 . 2 . 2 z y x m T ¨ . . . 0 , , · · , ` . | · x T x m x T dt d x m x d dT δ δ δ δ Para tanto mx = Fx. En forma similar my = Fy y mz = Fz . Despreciando la resistencia del aire, la única fuerza es la atracción de la gravedad en la dirección negativa de z. Así pues δWt = -mgδz y Fz = -mg. Obviamente, Fx = Fy = 0. Entonces, finalmente, Este ejemplo no demuestra el potencial del método de Lagrange, pero sí muestra que para el caso de una partícula tratada en función de coordenadas rectangulares, las ecuaciones de Lagrange se reducen a la misma forma que las de Newton. Ejemplo 3.2: Movimiento de una cuenta ensartada en un alambre rígido. Una cuenta de masa m puede deslizarse libremente a lo largo de un alambre parabólico cuya forma esta dada por y = bx 2 . Como el movimiento está confinado a una línea, la cuenta tiene solamente un grado de libertad. Las dos ecuaciones de restricción serán: y = bx 2 y z = C. De la expresión Puede eliminarse la velocidad z y bien y o x. Eliminando Aplicando la ecuación de Lagrange, Finalmente, Para hallar Fz se aplica 3.19 y como se observará, no resulta sencillamente igual a la componente x de una fuerza. Se puede suponer que el eje Y es vertical y que la única fuerza que actúa es la atracción de la gravedad (no es necesario considerar la fuerza de restricción). Si a la cuenta se le da un desplazamiento + δx, necesariamente se moverá una distancia correspondiente sobre el alambre + δy, y el trabajo hecho entonces por la gravedad será δW=-mgδy. Pero según la ecuación de la restricción, δy = 2bxδx. Por tanto δW = -2mgbxδx = Fxδx, Fx = -2mgbx, y la ecuación del movimiento, completa, queda A manera de extensión de lo anterior, imagínese que por medio de un hilo sujeto a la cuenta, se tira de ella con una fuerza f. Supóngase que el hilo está en el plano de la 164 . , 0 , 0 ¨ ¨ ¨ mg z m y m x m − · · · , ` . | + + · 2 . 2 . 2 . 2 1 z y x m T ( ) 2 2 ¨ 4 1 2 1 x b x m T + · ( ) ( ) 2 2 . 2 2 . 2 2 ¨ . 2 2 . . 4 , 8 4 1 , 4 1 xb x m x T xb x m x b x m x T dt d x b x m x T · + + · , ` . | + · δ δ δ δ δ δ ( ) z F xb x m x b x m · + + 2 2 . 2 2 ¨ 4 4 1 ( ) mgbx xb x m x b x m 2 4 4 1 2 2 . 2 2 ¨ − · + + parábola y que su dirección, dada por los cosenos directores alfa y beta, se mantiene constante. Se tiene que para un pequeño desplazamiento, Véase la ecuación 2.35 El miembro izquierdo de la ecuación del movimiento continúa inmodificado. Nótese que todos los resultados anteriores pueden igualmente expresarse en función de y y y ´, en cambio de x y x´, eliminando desde el principio x´de T, etc. Ejemplo 3.3: Movimiento de una partícula sobre un tablero horizontal liso, bajo la acción de un resorte. Un hilo sujeto a la partícula pasa por un orificio en una mesa horizontal lisa y está atado a un resorte débil, como se muestra en la figura 3-1. El extremo inferior del resorte está rígidamente unido a un punto tal que cuando m esta en el orificio, el resorte no está estirado. El sistema tiene dos grados de libertad y usando coordenadas polares, T = ½ m (r´ 2 + r 2 θ´ 2 ). La única fuerza que actúa sobre la masa es la del resorte. Así, para un desplazamiento arbitrario de la partícula, δW = -krδr en donde k es la constante usual de la ley de Hooke, del resorte. No existe ninguna fuerza actuando perpendicularmente a r. Por tanto, las ecuaciones de Lagrange conducen a Utilizando 2 se observa que mr 2 θ´=Po= momentum angular = constante. Eliminando θ¨de 1, resulta una ecuación que incluye a r¨ y r únicamente y que puede ser integrado por los métodos corrientes. La solución de este problema en coordenadas rectangulares demuestra cómo en ocasiones, las ecuaciones del movimiento pueden ser considerablemente simplificadas, al hacer una adecuada selección de coordenadas. Escribiendo Se concluye que mx¨=-kx y my¨=-ky. O sea que el movimiento está compuesto de dos movimientos armónicos simples que forman ángulo recto y ambos poseen el mismo período. Por tanto, la trayectoria, en general será la de una elipse con el origen en su centro. Ejemplo 3.4: Un péndulo sostenido por una banda de caucho, (fig.3-2) Si el movimiento es en un plano, la pesa del péndulo, considerada como una partícula, tiene dos grados de libertad. Usando r y θ como coordenadas, 165 y f x f y mg W δ β δ α δ δ + + · 0 ) 2 ( , ) 1 ( . 2 ¨ 2 . · , ` . | − · − θ θ mr dt d kr mr r m ) ( , 2 1 2 . 2 . y y x x k r kr W y x m T δ δ δ δ + − · − · , ` . | + · ) ( 2 1 2 ¨ 2 2 θ r r m T + · de donde se sigue que mr-mrθ 2 =Fr y mr 2 θ+2mrr´θ=Fθ. A continuación se ilustran dos métodos para obtener las fuerzas generalizadas. Imagínese que se le da a la pesa un desplazamiento δs arbitrario, en el que tanto θ como r sufren cambios positivos. El trabajo hecho por la gravedad y la banda de caucho está dado por en donde ro y k se refieren a la longitud, sin extenderse, de la banda de caucho y a su constante de la ley de Hooke, respectivamente. Los dos términos de la derecha se han escrito con signo negativo, porque el trabajo debe ser hecho contra la gravedad y contra la banda, a fin de obtener desplazamientos positivos de r y θ. Pero como puede verse en la figura δh=r δ θsen θ- δr cos θ y por consiguiente, Así el trabajo correspondiente a un cambio de r únicamente, es δW= -[k(r-ro) – mg cos θ] δr =F, δr de donde En forma similar, Fo = -mgr sen θ Ahora se hallaran Fo y F por aplicación directa de Teniendo en cuenta la gravedad y la tensión de la banda, se observa que las componentes x y y de la fuerza sobre la pesa, son Por las relaciones x = r sen θ y y = r cos θ, se obtienen dx/dr =senθ y dy/dr=cosθ. Por tanto, que es idéntica a la expresión obtenida anteriormente. En la misma forma puede obtenerse Fθ. 6.6. Ecuaciones de Lagrange para una partícula, suponiendo u marco de referencia móvil, restricciones móviles, o ambas condiciones simultáneamente. Hasta ahora se ha evitado nel estudio de sistemas que impliquen marcos de referencia móviles, restricciones móviles o una combinación de ambas condiciones simultáneamente. Sin embargo, como en la práctica se presentan numerosos 166 r mg r r k sen mg W total δ θ θ δθ δ θ ) cos ) ( ( − − − − · r r r k h mg W total δ δ δ θ ) ( − − − · θ θ θ cos ) ( , ) ( ro r k mg Fy sen r r k Fx − − · − − · qr z Fz qr y Fy qr x Fx F qr δ δ δ δ δ δ + + · θ θ cos ) ( mg r r k Fr + − − · [ ] θ θ θ θ δ δ δ δ cos ) ( cos cos ) ( ) ( 2 mg ro r k r r k mg sen ro r k qr y Fy qr x Fx F o r + − − · − − + − − · + · problemas de este tipo, es importante considerar cuidadosamente la deducción y aplicación de las ecuaciones de Lagrange a tales sistemas. Supóngase una vez más, que se trata de una partícula que puede moverse libremente sobre una superficie lisa. Además, se presume que la superficie, el marco de referencia que sirve para medir las coordenadas generalizadas q1 y q2, o ambos, se mueven de alguna manera determinada. Siguiendo exactamente el mismo procedimiento del numeral 3.2 escribimos nuevamente, En donde δx. Δy y δz representan un desplazamiento completamente arbitrario y Fx, Fy, Fz son las componentes de la fuerza total que actúa sobre la partícula, incluyendo la fuerza de restricción. (El marco XYZ se supone inercia.) Se indican las ecuaciones de transformación que relacionan a x, y y z con q1, q2 y t, de la siguiente manera x = f1(q1,q2,t), y = f2(q1,q2,t), z = f3(q1,q2,t) (3.21) En estas ecuaciones aparecen sólo dos coordenadas generalizadas, y el tiempo entra explícitamente debido a los movimientos asumidos. De aquí en adelante, las ecuaciones 3.21 consideran en forma completa la restricción y el movimiento supuesto. Como δx, δy y δz son todos arbitrarios, se puede, si se desea, determinarlos a partir de las ecuaciones 3.21 dejando que tanto t como q1 y q2 varíen. En esta forma, Sustituyendo en la primera ecuación de este numeral, y agrupando términos, se tiene (3.22) Y teniendo en cuenta que δq1 y δq2 y δt son arbitrarios, puede hacerse δq2=0 y δt=0. Entonces 3.22 se reduce a 167 z F y F x F z z y y x x m z y x δ δ δ δ δ δ + + · , ` . | + + ^ ^ ^ qt qt x q q x q q x x δ δ δ δ δ δ δ δ δ δ + + · 2 2 1 1 · , ` . | + + + , ` . | + + + , ` . | + + qt qt z z qt y y qt x x m q q z z q y y q x x m q q z z q y y q x x m δ δ δ δ δ δ δ δ δ δ δ δ δ δ δ δ δ δ δ δ δ ¨ ¨ ¨ ¨ ¨ ¨ ¨ ¨ ¨ ¨ ¨ ¨ 2 2 2 2 1 1 1 1 qt qt z Fz qt y Fy qt x Fx q q z Fz q y Fy q x Fx q q z Fz q y Fy q x Fx δ δ δ δ δ δ δ δ δ δ δ δ δ δ δ δ δ δ δ δ δ , ` . | + + + , ` . | + + + , ` . | + + ¨ ¨ ¨ 2 2 2 2 1 1 1 1 1 1 1 1 1 1 1 1 ¨ ¨ ¨ ¨ ¨ q q z Fz q y Fy q x Fx q q z z q y y q x x m δ δ δ δ δ δ δ δ δ δ δ δ δ δ , ` . | + + · , ` . | + + Finalmente, aplicando las relaciones 3.9, 3.10 y 3.11 como en el numeral 3.2 (que son válidas aunque 3.21 contenga explícitamente el tiempo), se obtiene una ecuación de Lagrange que tiene exactamente la misma forma de 3.15 . De la misma manera, haciendo δq1 y δt=0 se llega a 3.16. Por consiguiente, los marcos de referencia móviles, las restricciones móviles, o la combinación de ambas condiciones, no producen ningún cambio en las ecuaciones de Lagrange; (3.18) continúa siendo la forma general. 6.7. De la energía cinética, las fuerzas generalizadas y otros tópicos, cuando el marco de regencia, las restricciones, o ambos se mueven. a. Básicamente, la energía cinética, como se ha dicho con insistencia anteriormente, debe referirse a un marco inercial (véanse los numerales 2.8 y 2.9). Sin embargo, siguiendo el procedimiento descrito e ilustrado en esta referencia, es posible expresar a T en función de las coordenadas móviles, cuando éstas han de usarse. Por otra parte, deben eliminarse las coordenadas superfluas. b. La observación siguiente sobre las fuerzas generalizadas es muy importante. Nótese que en la relación Las derivadas de x, y y z se toman con respecto a qr únicamente dejando fijo t y todas las demás coordenadas. Así, es muy claro que δWqr es el trabajo ejecutado por la fuerza actuante, cuando, con las condiciones mencionadas se determinan suponiendo el marco de referencia y las restricciones en reposo y luego procediendo exactamente como se explicó en el numeral 3.3(b) y (c); y como se ilustró en el numeral 3.5. Si sucede que algunas, o todas las fuerzas, son funciones del tiempo, como ocurre con frecuencia, debe seguirse aún el procedimiento anterior. Como todo desplazamiento, determinado por las ecuaciones 3.21 con t constate, está de acuerdo con las restricciones, el trabajo hecho por la fuerza de restricción es igual a cero. Por tanto, como es usual, esta fuerza debe ser ignorada. c. Se observará que considerando δq1=0, δq2=0 y δt no es igual 0, obtenemos, a partir de 3.22, la relación (3.23) Como el lector puede demostrar fácilmente, el lado derecho de 3.23 es, sencillamente el trabajo hecho sobre la partícula por la fuerza total (incluyendo la fuerza de restricción) cuando el marco d referencia, las restricciones o ambos, desplazaran su posición ligeramente en el tiempo δt. Sin embargo, como 3.23 es redundante en cuanto se refiere al planteamiento de las ecuaciones del movimiento, no recibirá por ahora ninguna consideración adicional. 3.8 Ejemplos ilustrativos 168 Wqr qr Fqr qr qr z Fz qr y Fy qr x Fx δ δ δ δ δ δ δ δ δ · · , ` . | + + ¨ t t z Fz t y Fy t x Fx t t z z t y y t x x m δ δ δ δ δ δ δ δ δ δ δ δ δ δ , ` . | + + · , ` . | + + ¨ ¨ ¨ ¨ ¨ El siguiente ejemplo sencillo debe servir para clarificar algunas ideas básicas. Una varilla rígida lisa, como se muestra en la figura 3.3, se hace girar con velocidad angular constante, en un plano alrededor del origen de los ejes X y Y. Una cuenta de masa m puede deslizarse libremente sobre la varilla, bajo la acción de una fuerza F, que incluye la fuerza de restricción. Por medio de la aplicación directa de la ecuación de D Álembert 3.3 se plantea la ecuación del movimiento, que para este caso, es sencillamente, m(x¨δx+y¨δy)=Fxδx+Fyδy (1) La cuenta tiene solo un grado de libertad. Tomando a r como coordenada, se puede escribir x = r cos wt, y = r sen wt (2) δx = δr cos wt – re sen wt, δy = δr sen wt + rw δt cos wt (3) En donde tanto r como t pueden variar. Igualmente pueden hallarse en forma inmediata las expresiones para xÿ yä partir de 2. Eliminando δx, δy, x¨ y y¨ de 1 se tiene (4) Pero como δr y δt son arbitrarios, resulta claro que (5) Al examinar la figura se observa que el miembro derecho de 5 es justamente el trabajo hecho por la fuerza total a lo largo de un desplazamiento δr sobre la varilla (no un desplazamiento δs). Pero como el desplazamiento tiene en cuanta la restricción, el trabajo hecho por la fuerza de reacción de la varilla sobre la cuenta es igual a cero. La ecuación 5 es la ecuación del movimiento y es exactamente igual a la que se obtiene al aplicar adecuadamente la ecuación de Lagrange. La ecuación 6 corresponde a 3.23. Por inspección en la figura 3.3 se demuestra que el lado derecho de 6 es el trabajo hecho por F (incluyendo la fuerza de restricción) para un desplazamiento rwδt. Ejemplo 3.6: 169 t rw Fysenwt wt Fx r Fysenwt wt Fx t w r mr r rw r m δ δ δ δ ) cos ( ) cos ( 2 ) ( ¨ 2 ¨ 2 + + + · + − ¨ 2 ¨ ) cos ( ) ( r Fysenwt wt Fx r rw r m δ δ + · − ¨ 2 ¨ ) cos ( ) 2 ( r rw Fxsenwt wt Fx t w r mr δ δ + · Con referencia a la figura 3-4, la plataforma giratoria D tiene una velocidad angular determinada por el motor M1. Adherido a la plataforma se encuentra el mecanismo impulsor M2 que hace girar la varilla lisa pa, alrededor del eje horizontal en p, de alguna manera en particular. La varilla pa y las verticales pb y oc se encuentran todas en el mismo plano. Una cuenta de masa m puede deslizarse libremente a lo largo de la varilla, bajo la acción de la gravedad. Suponiendo que alfa y teta son funciones conocidas del tiempo, el sistema tiene un grado de libertad. Tomando r como coordenada, se plantea la ecuación del movimiento, y se encuentra Fr. Se concluye fácilmente que (1) Esta expresión es válida independientemente de la forma como varíen con el tiempo alfa y teta. Supongase que α=W1=constante, y que la varilla se hace oscilar, por medio del mecanismo M2, alrededor de la vertical pb, según θ= θosen w2t. Por consiguiente, (2) Que incluye únicamente a r,rý t. Aplicando la ecuación de Lagrange, se lega a (3) Con el fin de hallar una expresión para Fr, se ignoran por completo los movimientos de la plataforma y de la varilla; es decir que durante el desplazamiento +δr, t permanece constante (θ y α permanecen constantes). Por tanto O sea Fr=-mgcos(θosenw2t) Debe notarse que si la varilla no tiene un movimiento obligado sino que puede girar libremente alrededor de p, el sistema tiene entonces dos grados de libertad. En este caso, despreciando la masa de la varilla, 1 continua siendo la expresión correcta para T. Las ecuaciones del movimiento correspondientes a r y θ, pueden escribirse en forma inmediata y se ve que 170 ] ] ] ] ] + + + · 2 2 . . 2 2 2 . ) ( 2 1 θ α θ rsen s r r m T ] ] ] ] ] + + + · 2 2 . 2 1 . 2 2 2 2 2 2 2 . )) ( ( cos 2 1 t senw rsen w t w w r r m T o o θ δ θ [ ] { ¦ F t senw sen t senw rsen s w t w w r m r m o o o · + + − ) ( ) ( cos 2 2 2 1 2 2 2 2 2 ¨ θ θ θ r t osenw mg r mg W r δ θ θδ δ ) cos( cos 2 − · − · θ θ mgrsen F mg F o r · − · , cos 6.8. Determinación de la aceleración por medio de las ecuaciones de Lagrange. Como se demostró anteriormente (numeral 2.12), la componente a´del vector aceleración alfa, sobre una línea cuyos cosenos directores son l, m y n, esta dada por (1) Si debe hallarse aén la dirección de la tangente a una curva en el espacio en un punto p determinado, (2) En donde ds es el elemento de longitud de la curva en p, dado por (3) Entonces, partiendo de las ecuaciones de la curva en el espacio pueden hallarse l, m y n supóngase que se desea determinar una expresión general para la componente de aceleración en la dirección de la tangente a la coordinado q1 teniendo en cuenta que las coordenadas generalizadas q1, q2 y q3 se relacionan con las rectangulares por medio (4) La línea coordenada de q1 se determina haciendo que permanezca constantes q2, q3 y t en 4 y dibujando la gráfica por puntos x, y y z para valores variables de q1 en forma semejante se tiene las líneas coordenadas de q1 y q3 tomando las derivadas de 4 mientras q2, q3 y t permanecen constantes, se obtienen Etc. Entonces 3 se convierte en (5) En donde ds es un elemento de longitud medido sobre la curva de q1. Según (2) (6) En donde el significado de h1 es bien claro, y donde se ha escrito dx/dq1 como dx/dq1, puesto que q2, q3 y t se consideran todavía constantes. En forma semejante, 171 ¨ ¨ ¨ ´ zn m y xl a + + · ds dz n ds dy m ds dx l · · · , , 2 2 2 2 dz dy dx ds + + · ) , 3 , 2 , 1 ( ), , 3 , 2 , 1 ( ), , 3 , 2 , 1 ( t q q q z z t q q q y y t q q q x x · · · , 1 1 dq dq dx dx · 2 1 2 2 2 2 1 1 1 dq q z q y q x ds ] ] ] ] , ` . | + , ` . | + , ` . | · δ δ δ δ δ δ 1 1 1 1 1 1 2 1 2 2 2 1 1 q x h q z q y q x dq dx l δ δ δ δ δ δ δ δ · ] ] ] ] ] ] , ` . | + ] ] ] , ` . | + ] ] ] , ` . | · . Igualmente, los cosenos directorios de la tangente a la curva coordenada de q2, son (7) Designado aćomo aq1 la ecuación (1) se convierte en (8) Teniendo en cuenta las etapas que condujeron al miembro izquierdo de 3.15, evidentemente puede escribirse 8 en la siguiente forma (9) En donde T´=1/2(x´ 2 +y´ 2 +z´ 2 ), expresada en coordenadas generalizadas. En general, (3.24) Es esta una manera sencilla y fácil de obtener las expresiones generales de las componentes de la aceleración en la dirección de las coordenadas. Véase el siguiente ejemplo. Ejemplo 3.7 Considerando el sistema de coordenadas esféricas , se trata de obtener la conocida expresión de ao, la componente de la aceleración según la dirección de la tangente a una de las curvas coordenadas de θ, por medio de la utilización de 3.24. Para estas coordenadas. De donde 172 1 1 1 1 dq dy h m · 1 1 1 1 dq dz h n · 2 2 1 2 , 2 2 1 2 , , 2 2 1 2 dq dz h n dq dy h m dq dx h l · · · , ` . | + + · 1 1 1 1 1 ¨ ¨ ¨ 1 dq dz z dq dy y dq dx x h a q , ` . | − · 1 ´ 1 ´ 1 1 ¨ 1 dq dT y dq dT dt d h a q , ` . | − · dqr dT y dqr dT dt d h a q ´ ´ 1 1 ¨ 1 2 2 2 ¨ 2 2 ¨ 2 ¨ ´ ( 2 1 θφ θ sen r r r T + + · θ θ φ θ θ δθ δ θ cos 2 ´ 2 2 ´ ´ ¨ 2 ´´ sen r r r r T d dT dt d − + · − , ` . | Por tanto En forma similar pueden obtenerse inmediatamente ar y ao. Si el movimiento de un punto o una partícula está restringido a una superficie móvil después de eliminar una coordenada superflua, las ecuaciones 4 serán (10) Que en realidad son las ecuaciones de la superficie en cualquier instante. Y si ahora se hace que q2 y t permanezcan constantes , las ecuaciones 10 representan una curva q1 sobre la superficie. Por otra parte , es claro que dx/ds, por ejemplo , es la expresión de uno de los cosenos directores de la tangente a esta curva, en un punto cualquiera. Por consiguiente, si se escribe T¨ en función de q1,q2, q1´,q2 ý t, la ecuación 3.24 da las componentes del vector aceleración según la dirección de las tangentes a q1,q2 sobre la superficie , en un instante determinado. Una vez más , es importante recordar que, básicamente, las aceleraciones halladas de esta manera, son relativas al marco X, Y, Z. 6.9. Una consideración adicional sobre las ecuaciones de Lagrange Con el objeto de clarificar aún más el sentido físico de las ecuaciones de Lagrange, considérese lo siguiente: Escribiendo T=1/2m(r´ 2 + r´ 2 θ 2 + r´ 2 φ 2 sen 2 θ), según el numeral 3.9, se sigue que Asimismo, el lector puede demostrar fácilmente que 3.25 En donde si f es la fuerza que actúa sobre m, f, es la componente de f en la dirección en que θ aumenta. (Nótese que f θ es una fuerza verdadera y no un momento; además, a θ es una aceleración lineal). Por tanto resulta claro que la ecuación de Lagrange conduce sencillamente a ma θ=f θ, en coordenadas esféricas en la misma forma como pueden escribirse las ecuaciones correspondientes a radio y φ, como mar=fr y ma φ= f φ, y lo mismo para cualquier otro sistema de coordenadas que pueda usarse. Si existe alguna restricción sobre la partícula, sobre las ecuaciones de transformación toma la forma de las ecuaciones 10 siguiendo el razonamiento dado al final del ejemplo 3.7 se concluye que las ecuaciones de Lagrange correspondientes a q1 y q2 pueden escribirse como maq1=fq1 y maq2=fq2. 173 θ θ θ ma d dT y d dT dt d h · , ` . | + ¨ 1 1 θ θ θ θ θ θ θ f F h d dz Fx d dy F d dx F h y x · · , ` . | + + 1 1 ¨ ) , 2 , 1 ( ), , 2 , 1 ( ), , 2 , 1 ( t q q z z t q q y y t q q x x · · · ¨ 2 ´ ´ ´ cos 2 θ θ φ θ θ sen r r r a o − + · ( ) ( ) [ ] r sen r sen r r z y x h · + + · ] ] ] ] , ` . | + , ` . | + , ` . | · 2 1 2 2 2 2 2 1 2 2 2 cos cos cos θ φ θ φ θ δθ δ δθ δ δθ δ θ Así pues la interpretación física de las ecuaciones de Lagrange para un sistema de una partícula es muy sencilla y además observa en cada una de las ecuaciones se tienen en cuenta automáticamente las componentes de la aceleración. Lo anterior es válido para cualquier sistema de coordenadas y cualquier tipo de restricciones. Considérese, por ejemplo, una partícula sobre una plataforma giratoria montada en un ascensor acelerado. Supóngase que se desean obtener las componentes de la aceleración de la partícula, expresadas en función de ciertas coordenadas cuyo marco se encuentra adherido a la plataforma, y que se requiere tener en cuenta los movimientos de la Tierra, del ascensor y de la plataforma. Aun en este caso tan complicado, es fácil escribir T para la partícula y (.1.24) da los resultados buscados, en forma inmediata. El estudiante debe comparar este método con el sistema vectorial normal. Véase el problema 3.34. 6.10.Experimento sugeridos: Como se mencionó anteriormente, al final de varios de los capítulos, se enumeran unos pocos experimentos que han sido hallados dignos de la atención, del tiempo y de los esfuerzos de los estudiantes. Estos experimentos contribuirán a inculcar una apreciación tangible de la dinámica que el papel y el lápiz no podrían lograr por sí solos jamás Experimento 3.1 Determínese el período de un pedúnculo que se muestra en la figura 3-6 (véase en el problema 3.7). El punto p soporta por medio de un hilo largo y ligero colgado de su extremo superior de un cielo raso suficientemente alto. Al moverse el péndulo. p describe el arco de un gran círculo pero para movimientos pequeños este puede considerarse como una línea recta horizontal. Si se determinan con cuidado los valores de k y m. los resultados experimentales y los calculados concuerdan con una buena precisión. Puede repetirse el experimento ajustando la cuerda vertical de modo que p quede algunos centímetros por encima de la horizontal AB quedando entonces los resortes en forma de V invertida. Naturalmente debe hacerse una aproximación para calcular la tuerza ejercida por los resortes suponiendo pequeños movimientos. (Véase el desarrollo de Taylor). 6.11.Resumen y observaciones 1. Deducción de las ecuaciones de Lagrange: Una partícula sin coordenadas móviles, ni restricciones móviles (numeral 3.2) a. Se ha desarrollado la ecuación de DÁlembert a partir de la segunda ley de Newton y del concepto del trabajo virtual. (Se ha observado que el trabajo virtual es un instrumento simple pero poderoso que se utiliza como medio para llegar a un fin). b. La ecuación de DÁlembert, expresada en coordenadas generalizadas, conduce directamente (con la ayuda de ciertas operaciones matemáticas sencillas) a las ecuaciones de Lagrange. 174 2. Detalles importantes relacionados con estas ecuaciones (numeral 3.3.b y c a. La energía cinética T debe expresarse en función de las coordenadas generalizadas que se hayan escogido, y de sus derivadas con respecto al tiempo. Deben eliminarse de T todas las coordenadas superfluas. b. Es importante entender con claridad el sentido físico de las fuerzas generalizadas no solamente para facilitar el uso de las ecuaciones de Lagrange, sino también para lograr una apreciación de lo que ocurre. 3. Deducción de las ecuaciones de Lagrange: Coordenadas móviles, restricciones móviles, o ambas (numeral 3.6) a. La deducción se basa de nuevo en la ecuación de DÁlembert y en el carácter arbitrario de los desplazamientos virtuales δxt, δyt, δzt. Las ecuaciones resultan con la misma forma anterior. b. T es ahora función de las qr, q´r y t. c. Como anteriormente, se halla Fqr, dejando el tiempo constante. El sentido físico de esto (numeral 3.7) debe ser entendido por las mismas razones mencionadas en 2b. 4. La aceleración determinada por medio de las ecuaciones de Lagrange (numeral 3.9) Como se muestra en el numeral 3.9, la componente de la aceleración de un punto o partícula, en la dirección de una tangente a una cuerva q, en cualquier punto, puede obtenerse, en forma inmediata, partiendo de la ecuación 3.24. 5. Interpretación física de las ecuaciones de Lagrange (numeral 3.10) Para un sistema de una partícula, las ecuaciones del movimiento de Lagrange pueden reducirse a mar = fr, en donde ar es la componente de la aceleración lineal de m, en la dirección de la tangente a la curva de qr; y fr es la componente de la fuerza total sobre m (sin incluir la fuerza de la restricción) que actúa según la dirección de la misma tangente. Por consiguiente, las ecuaciones anteriores se reducen a la simpleza de las ecuaciones en la segunda ley de Newton, independientemente del sistema de coordenadas usado. 7. ECUACIONES DE LAGRANGE PARA UN SISTEMA DE PARTÍCULAS. 7.1. Observaciones introductorias. Por razones pedagógicas, el análisis de las ecuaciones de Lagrange del capitulo 3, se restringido a sistemas que contengan solamente una partícula. Ahora se deducirán estas ecuaciones (y al final adquirirán la misma formada la ecuación (3.18)) para el caso general de un sistema que consiste en muchas partículas con un número finito cualquiera de grados de libertad y en el cual pueden existir restricciones móviles o marcos de referencia móviles o ambos. A continuación, el resto del capítulo se dedica a las técnicas de aplicación de las ecuaciones de Lagrange a varios tipos de sistemas diferentes y al importante aspecto de Lograr un entendimiento del significado físico de las relaciones matemáticas empleadas. 7.2. Deducción de las ecuaciones de Lagrange para un sistema de partículas. En primer lugar se establecerá la forma general de la ecuación de D’Alembert. 175 Considérese un sistema de p partículas cuyas masas m1, m2,…, mp sufren la acción de las fuerzas F1, F2,…, Fp, respectivamente. Debe entenderse que F1, por ejemplo, representa la suma vectorial de todas las fuerzas de cualquier origen (incluyendo las fuerzas de restricción) que actúan sobre m1, etc. Así, suponiendo masas constantes y un marco de referencia inercial, las ecuaciones de “partícula libre”, para cada una de ellas, serán: 1 1 z1 1 1 y1 1 1 x1 m F , m F , m F z y x       · · · (4.1) p z m F , y m F , x m F p x p p y p p x p p p · · · En donde Fx1, Fy1, y Fz1 son las componentes rectangulares de F1, etc. Es importante observar que como se ha supuesto que F1, F2, etc., incluyen las fuerzas de restricción, las relaciones (4.1) son válidas, aunque las partículas tengan cualquier tipo de restricción. Suponiendo ahora que cada una de las partículas sufre un desplazamiento virtual, cuyas componentes son δx1, δy1 y δz1, etc., se procede a ejecutar las siguientes operaciones matemáticas sencillas. Multiplicando 1 1 x1 m F x  · por δx1, 1 1 y1 m F y  · por δy1, etc., en todas las relaciones (4.1) y sumando todo el conjunto, se obtiene, ∑ ∑ · · + + · + + p 1 i i i i i i p 1 i i i i i i ) x ( ) x ( m z F y F F z z y y x zi yi xi δ δ δ δ δ δ       (4.2) relación que si se interprete en forma adecuada, conduce a resultados de gran alcance. (Véase la ecuación (3.3).) Nos referiremos a la ecuación (4.2) como ecuación de D’Alembert. Aquí deben hacerse varias observaciones importantes, semejantes a las que siguieron a la ecuación (3.7). (a) Con respecto a la validez de (4.2) no es necesario que i x δ , i y δ y i z δ , representen desplazamientos, ni que sean magnitudes infinitesimales. En realidad pueden rempla- zarse por cantidades completamente arbitrarias como a1, b1 y c1. (b) Sin embargo si se supone que representan desplazamientos de las partículas, resulta claro que el miembro derecho de (4.2) es sencillamente una expresión general del trabajo total W δ hecho por las fuerzas F1, F2,… en los desplazamientos δx1, δy1, δz1,... de todas y cada una de las partículas. Es decir, ∑ · + + · p 1 i i i i ) x ( z F y F F W zi yi xi δ δ δ δ (4.3) (c) Lo anterior es válido aunque los desplazamientos imaginarios (virtuales) no estén de acuerdo con las restricciones; es decir, que las restricciones pueden considerarle ligeramente “distorsionadas”. En tal caso, naturalmente, W δ incluye el trabajo hecho por las fuerzas de restricción. (d)Pero si se considera que los desplazamientos están de acuerdo con las restricciones, el trabajo hecho por las fuerzas de restricción se anula. (Véanse 105 176 numerales 2.13 y 2.14.) En otras palabras, las fuerzas de restricción quedan efectivamente eliminadas de (4.2) y de (4.3). (e)Con las condiciones enunciadas en (d), la relación (4.2) se denomina principio o ecuación de D’Alembert. Aunque a primera vista no lo refleje, la ecuación de D’Alembert es el principio más general de todo el campo de la mecánica clásica e incluye la estática como caso especial de la dinámica. Las ecuaciones del movimiento de cualquier sistema con un número finito de grados de libertad, pueden obtenerse directamente de (4.2), en cualquier sistema de coordenadas, mediante la aplicación de las ecuaciones de trasformación apropiadas y de las ecuaciones de restricción. Las ecuaciones de Lagrange son apenas una forma más conveniente de (4.2). Todas las demás formulaciones como las ecuaciones de Hamilton, el principio de Hamilton, el principio de Gauss de la mínima restricción, etc., pueden obtenerse a partir de las ecuaciones de D’Alembert. Continuando con la deducción, supóngase que el sistema tiene n grados de libertad, en donde n≤3p, y que las 3p-n ecuaciones de restricción son de tal naturaleza que todas las coordenadas superfluas pueden eliminarse de las ecuaciones de trasformación, ( ) t q q q x x n i i , ,..., , 2 1 · ( ) t q q q y y n i i , ,..., , 2 1 · (4.4) ( ) t q q q z z n i i , ,..., , 2 1 · Con respecto a estas ecuaciones, deben tenerse en cuenta los siguientes hechos. (a)Las relaciones (4.4), son ecuaciones de trasformación de las que se han eliminado previamente las coordenadas superfluas, denominadas anteriormente, ecuaciones “reducidas”. Aquí se consideran únicamente sistemas holonómicos. (Véase el numeral 9.12.) (b)Debido a las restricciones, el número de coordenadas generalizadas que aparece en (4.4) es 3p-n menor que el número de coordenadas rectangulares. (c) La aparición de t indica que pueden existir restricciones móviles, aun marco de referencia móvil, o ambos. (d)Estas ecuaciones tienen en cuenta todas las restricciones, en el sentido que los desplazamientos δx1, δy1 y δz1, que se obtienen aplicando las relaciones n n i i i i q q x q q x q q x x δ δ δ δ ∂ ∂ + + ∂ ∂ + ∂ ∂ · ... 2 2 1 1 ,etc. (4.5) (conservando a t constante) a (4.4), están de acuerdo con las restricciones. (e)Así, si δx1, δy1 y δz1, se determinan de esta manera, se puede estar seguro que el trabajo ejecutado por las fuerzas de restricción suma cero. Por tanto, las fuerzas de restricción pueden ser ignoradas. (Véase el numeral 2.14.) Sustituyendo las relaciones (4.5) en (4.2) se obtiene, después de agrupar términos, n p i n i i n i i n i i i p i i i i i i i i q q z z q y y q x x m q q z z q y y q x x m δ δ ∑ ∑ · · , ` . | ∂ ∂ + ∂ ∂ + ∂ ∂ + + , ` . | ∂ ∂ + ∂ ∂ + ∂ ∂ 1 1 1 1 1 1 ...         177 ∑ ∑ · · , ` . | ∂ ∂ + ∂ ∂ + ∂ ∂ + + , ` . | ∂ ∂ + ∂ ∂ + ∂ ∂ · p i n n i zi n i yi n i xi p i i zi i yi i xi q q z F q y F q x F q q z F q y F q x F 1 1 1 1 1 1 ... δ δ (4.6) Pero como 1 q , 2 q ,.., n q son todas variables independientes (físicamente esto significa que las partículas del sistema pueden desplazarse libremente de tal manera que, sin violar las restricciones, una cualquiera de las q puede tomar cualquier valor independientemente de los valores de las demás), pueden considerarse arbitrarios todos los q δ . Entonces supóngase que todos se hacen cero, excepto, por ejemplo, δq1, con lo cual la ecuación (4.6) se reduce a ∑ ∑ · · , ` . | ∂ ∂ + ∂ ∂ + ∂ ∂ · , ` . | ∂ ∂ + ∂ ∂ + ∂ ∂ · p i i zi i yi i xi p i i i i i i i i q q q z F q y F q x F q q z z q y y q x x m W 1 1 1 1 1 1 1 1 1 1 1 δ δ δ       (4.7) Utilizando aquí las relaciones correspondientes a (3.9), (3.10) y (3.11) y siguiendo el mismo procedimiento del capítulo 3, (4.7) puede escribirse, 1 1 2 2 2 1 1 2 2 2 1 1 ) ( 2 ) ( 2 q z y x m q z y x m q dt d W p i i i i i p i i i i i q δ δ ¹ ' ¹ ¹ ' ¹ + + ∂ ∂ − ] ] ] + + ∂ ∂ · ∑ ∑ · ·        ∑ · , ` . | ∂ ∂ + ∂ ∂ + ∂ ∂ · p i i zi i yi i xi q q z F q y F q x F 1 1 1 1 1 δ (4.8) Ecuaciones idénticas se obtienen de igual manera para 2 q , 3 q ,.., n q . Es decir, r q r r F q T q T dt d · ∂ ∂ − , ` . | ∂ ∂  (4.9) en donde r=1,2,.., n y las fuerzas generalizadas r Fq , son ∑ · , ` . | ∂ ∂ + ∂ ∂ + ∂ ∂ · p i r i zi r i yi r i xi q q z F q y F q x F F r 1 (4.10) Nótese que (4.9) tiene exactamente la misma forma que (3.18). 7.3. Expresión de T en forma adecuada. Aunque ∑ · + + · p i i i i i z y x m T 1 2 2 2 ) ( 2 1    , en donde el marco de referencia es inercial y existen 3p coordenadas rectangulares, puede considerarse como la expresión básica de la energía cinética, su forma final a la cual se le aplicarán las ecuaciones de Lagrange, debe ser expresada en función de 1 q , 2 q ,…, n q , las coordenadas generalizadas, sus derivadas con respecto’ al tiempo, y posiblemente t. Las etapas requeridas para esto se han explicado e ilustrado en el numeral 2.7. Como se demostró allí y en los ejemplos que siguen, con frecuencia resulta provechoso expresar primero T en función de un número cualquiera de coordenadas adecuadas. Luego, por medio de las ecuaciones de trasformación y de las ecuaciones de restricción, puede ponerse en forma final excluyendo las coordenadas superfluas. 7.4. Significado físico de las tuerzas generalizadas. 178 Una vez más, como se indicó en el capítulo 3, une fuerza generalizada r Fq , correspondiente a la coordenada r q , es una magnitud (no siempre una fuerza en el sentido usual de la palabra) tal que r r Fq δ , es el trabajo hecho por todas las fuerzas aplicadas al incrementar únicamente q, (dejando constantes el tiempo y todas las demás coordenadas) en una magnitud igual a r q δ + . Sin embargo, en este caso más general es importante caer en cuenta que para un sistema de p partículas con varias restricciones, un incremento de sólo r q puede requerir un desplazamiento de varias o de todas las partículas. Por consiguiente r Wq δ debe incluir el trabajo hecho por Las fuerzas aplicadas a todas las partículas, que como resultado de r q δ + cambiarían de posición. En prueba de las afirmaciones anteriores obsérvese que (4.3) es una expresión general del trabajo cuando a todas las partículas se lea da un desplazamiento infinitesimal arbitrario. Pero si se supone que sólo q, varia, (4.5) se reduce a r r i i r r i i r r i i q q z z q q y y q q x x δ δ δ δ δ δ ∂ ∂ · ∂ ∂ · ∂ ∂ · , , y por tanto, (4.3) se hace r p i r i zi r i yi r i xi a q q z F q y F q x F W r δ δ ∑ · , ` . | ∂ ∂ + ∂ ∂ + ∂ ∂ · 1 que según (4.10) es, sencillamente, r r Fq δ , (Véase el ejemplo 4.1.) Todas las fuerzas inerciales (véase el numeral 3.3 (d)) se han tenido en cuenta, en el lado izquierdo de (4.9). Por las razones expuestas e ilustradas en la última parte del capítulo 2, las fuerzas de restricción (para el caso de restricciones “lisas”) se anulan en (4.l0). Por tanto, en los análisis de las técnicas y de los ejemplos que siguen, estas fuerzas se ignoran. 7.5. Técnicas para hallar expresiones para las tuerzas generalizadas. Expresiones para r Fq , pueden encontrarse por cualquiera de las técnicas que siguen, las cuales pueden aplicaras a cualquier tipo de fuerzas aplicadas y son básicamente iguales a las explicadas en el numeral 3.3(c). (En ningún caso se incluyen fuerzas inerciales.) (a)Puede aplicarse directamente la relación (4.10). Las componentes rectangulares i Fx , i Fy , y i Fz , de la fuerza i F que actúa en mi, deben determinarse a partir de las fuerzas conocidas del sistema. Utilizando (4.4) pueden obtenerse las expresiones explícitas para r i r i q y q x ∂ ∂ ∂ ∂ / , / y r i q z ∂ ∂ / . Con frecuencia este método resulta muy monótono. (b)Suponiendo que todas las restricciones móviles, o todos los marcos de referencia móviles, o el conjunto de todos ellos, son estacionarios, y que todas las coordenadas, excepto q, son constantes, se incrementa r q en una magnitud r q δ + . En seguida, estudiando el problema entre manos, se escribe una expresión del trabajo, r q W δ , hecho por todas las fuerzas aplicadas a las partículas que deben cambiar de posición como resultado de r q δ + . Usualmente esto puede hacerse 179 directamente, sin necesidad de utilizar las componentes rectangulares de la fuerza. Entonces, por la relación r q q q F W r r δ δ · (4.11) puede obtenerse r Fq en seguida. Al aplicar este método, con frecuencia resulta provechoso escribir primero r q W δ , en función de un número cualquiera de coordenadas y luego expresarlo en términos de 1 q , 2 q ,…, n q . (c) Siguiendo el procedimiento descrito en (b), en muchos casos es posible e incluso provechoso, escribir una expresión del trabajo total total W δ , cuando varían simultáneamente todas las coordenadas. Como puede notarse en (4.6) y en los ejemplos que siguen, esto puede escribirse en la forma n n q q q δ δ δ δ [...] ... [...] [...] W 2 2 1 1 total + + + · (4.12) en donde los paréntesis cuadrados pueden ser constantes, pero usualmente son funciones de las coordenadas, de la velocidad, del tiempo, etc. Resulta claro que el paréntesis cuadrado […]r es sencillamente r Fq . Así, todas las fuerzas generalizadas pueden leerse directamente en (4.12). Una observación adicional: Para un sistema que tenga por ejemplo, cuatro grados de libertad, se hace que 3 2 1 , , q q q F F F y 4 q F indiquen las fuerzas generalizadas correspondientes a 3 2 1 , , q q q y 4 q respectivamente. Supóngase ahora, que se inicia de nuevo el problema remplazando a 3 q y 4 q por otras coordenadas diferentes ' 3 q y ' 4 q . Las fuerzas generalizadas quedan entonces ' 3 2 1 , , q q q F F F y ' 4 q F pero 1 q F y 2 q F del segundo caso son en general, diferentes de 1 q F y 2 q F del primero, aunque correspondan a las mismas coordenadas, (Véase el ejemplo 4.1.) (Debe mencionarse aquí qué cuando las fuerzas son conservativas, usualmente es más conveniente determinar r q F a partir de la función de la energía potencial (véase el capítulo 5). En muchos casos de fuerzas disipativas, el método de la “función de la potencia” resulta beneficioso (véase el capitulo 6). Sin embargo, independientemente del tipo de las fuerzas aplicadas, cualquiera de las técnicas (a), (b) o (c) pueden ser utilizadas.) 7.6. Ejemplos ilustrativos de la aplicación de las ecuaciones de Lagrange a sistemas que incluyen varias partículas. Ejemplo 4.1. Un sistema de tres partículas. Considérese la disposición que se muestra en la figura 4-1. Si se supone que sólo puede haber movimiento vertical, el sistema tendrá dos grados de libertad. Entre las distintas posibilidades, se toman 1 y y 2 y como coordenadas. Ignorando las masas de 180 las poleas, 2 3 3 2 2 2 2 1 1 2 1 2 1 2 1 ° ° ° + + · s m s m y m T Pero como puede verse fácilmente, 2 1 2 ° ° ° − · y y s y 2 1 3 ° ° ° + · y y s . Por tanto 2 2 1 3 2 2 1 2 2 1 1 ) ( 2 1 ) ( 2 1 2 1 ° ° ° ° ° + + − + · y y m y y m y m T Que incluye ahora a 1 ° y y 2 ° y , únicamente. (Nótese que 2 y es una coordenada no inercial.) La ecuación del movimiento correspondiente a 1 y , se obtiene como sigue: ) ( ) ( 2 1 3 2 1 2 1 1 1 ° ° ° ° ° ° + + − + · ∂ ∂ y y m y y m y m y T Y 2 2 3 1 3 2 1 1 ) ( ) ( ) ( °° °° ° − + + + · ∂ ∂ y m m y m m m y T dt d , 0 2 · ∂ ∂ y T Por tanto, 1 2 2 3 1 3 2 1 ) ( ) ( y F y m m y m m m · − + + + °° °° Para obtener una expresión de 1 y F se aplica la ecuación (4.11). Así se determina el trabajo hecho por la, fuerzas impulsoras (la gravedad), despreciando las fuerzas de restricción (tensiones en los hilos), cuando se incrementa 1 y en una cantidad 1 y ∂ + (bajando ligeramente 1 m ) y haciendo que 2 y permanezca constante. Se obtiene 1 3 2 1 1 ) ( 1 y g m m y g m W y ∂ + − ∂ + · ∂ . El segundo término de esta expresión se origina en el hecho de que como 2 y permanece constante, es preciso levantar a 2 m y 3 m en una cantidad Igual a aquella en que se ha bajado a 1 m . Por tanto g m m m F y ) ( 3 2 1 1 − − · y la ecuación del movimiento completa, correspondiente a 1 y es 181 g m m m y m m y m m m ) ( ) ( ) ( 3 2 1 2 2 3 1 3 2 1 − − · − + + + °° °° (1) Para obtener la ecuación del movimiento de 2 y se observa que 1 2 3 2 3 2 2 ) ( ) ( ) ( °° °° ° − + − · ∂ ∂ y m m y m m y T dt d y 0 2 · ∂ ∂ y T Se obtiene una expresión para 2 y F haciendo que 2 y aumente en una cantidad 2 y ∂ + con 1 y constante. Es claro que el trabajo ejercido por la gravedad es de 2 2 3 2 2 2 ) ( y F y g m m W y y ∂ · ∂ − · ∂ °° . Por último, la ecuación del movimiento de 2 y tendrá la forma g m m y m m y m m ) ( ) ( ) ( 3 2 1 2 3 2 3 2 − · − + + °° °° (2) Las relaciones (1) y (2) pueden solucionarse simultáneamente para obtener 1 °° y y 2 °° y y las ecuaciones resultantes pueden integrarse en seguida. Como sencillo ejemplo de (4.12), nótese que g s m s m y m W total ) ( 3 3 2 2 1 1 ∂ − ∂ − ∂ · ∂ (3) Pero 2 1 2 y y s ∂ − ∂ · ∂ y 2 1 3 y y s ∂ + ∂ · ∂ . Por tanto, eliminando 2 s ∂ y 3 s ∂ . 2 3 2 1 3 2 1 ) ( ) ( y g m m y g m m m W total ∂ − + ∂ − − · ∂ En donde pueden leerse directamente 1 y F y 2 y F . Como extensión de este ejemplo, úsense como coordenadas 1 y y 2 s . Como · − + 1 3 2 2y s s constante, ° ° ° − · 2 1 3 2 s y s . Entonces, 2 2 1 3 2 2 2 2 1 1 ) 2 ( 2 1 2 1 2 1 ° ° ° ° − + + · s y m s m y m T de donde 1 2 3 1 2 1 2 ) 4 ( y F s m y m m · − + °° °° (4) 2 1 3 2 3 2 2 ) ( s F y m s m m · − + °° °° (5) Para encontrar 1 y F se hace que 2 s permanezca constante (no se permite que 2 m cambie de posición) y se supone que 1 y se incremente a 1 1 y y ∂ + ( 1 m se mueve ligeramente hacia abajo). Pero como puede verse, por simple inspección, esto requiere un desplazamiento hacia arriba de 3 m en una magnitud igual a 1 2 y ∂ . Por consiguiente, 1 3 1 1 2 1 y g m y g m W y ∂ − ∂ + · ∂ o sea que g m m Fy ) 2 ( 3 1 1 − · (Nótese que las expresiones de 1 y F en (1) y es (4) no son iguales.) En forma 182 semejante, se sigue que g m m Fy ) ( 2 3 2 − · Empleando (4.12), se puede usar (3) de nuevo. Eliminando 3 s ∂ por medio de 2 1 3 2 s y s ∂ − ∂ · ∂ , 2 2 3 1 3 1 ) ( ) 2 ( s g m m y g m m W total ∂ − + ∂ − · ∂ obteniendo así, de nuevo, la, mismas expresiones para 1 y F y 2 s F . Debe observarse que cuando una de la n coordenada vería, dejando fijas las otras, las demás coordenadas que no entran en el problema, pueden, naturalmente, variar. Por ejemplo pare encontrar 1 y F (véase la primera parte del ejemplo anterior) se dejó fijo a 2 y y se hizo variar 1 y . Al hacer esto 1 s , 2 s y 3 s variaron. Ejemplo 4.2. Énfasis adicional sobre las fuerzas generalizadas. En la figura 4-2, despréciense las masas de las poleas. Supóngase únicamente movimiento vertical y ténganse en cuenta las fuerzas que actúan externamente 5 1 ,..., f f y la gravedad. Por ejemplo, nótese que para un desplazamiento 1 q ∂ + (dejando fijas todas las demás coordenadas), 1 m se mueve hacia abajo una distancia 1 q ∂ y 5 m se mueve hacia arriba una distancia igual a 1 4 q ∂ . Siguiendo este razonamiento. ) ( 4 ) ( 5 5 1 1 1 f g m f g m Fq + − + · ) ( 3 3 2 2 2 f g m f g m Fq + − + · ) ( 2 ) ( 3 3 3 2 3 2 3 f g m f f g m m Fq + + − − + − · ) ( 4 4 5 5 4 f g m f g m Fq + − + · Usando ahora como coordenadas s q q , , 2 1 y 4 q demuéstrese que ) ( 2 ) ( 5 5 3 2 3 2 1 1 1 f g m f f g m g m f g m Fq + − + + + − + · ) ( 2 ) ( 5 5 3 2 3 2 f g m f f g m m Fs + − + + + · 2 Fq y 4 Fq son iguales a las anteriores, sin embargo nótese la diferencia en la forma de 1 Fq en los dos casos. En general la expresión r Fq depende de cuales son las otras coordenadas empleadas. Ejemplo 4.3.- movimiento de una palanqueta en un plano vertical 183 Las partículas de masas 1 m y 2 m que se muestran en la figura 4-3 están adheridas rígidamente a una varilla ligera y pueden moverse libremente en el plano XY, bajo la acción de la gravedad. Suponiendo que no hay rotación alrededor del eje de la varilla, y aplicando el teorema del centro de masa, se escribe ° ° ° + + + · 3 2 3 3 1 2 ) ( 2 θ I y x m m T En donde (x, y) son las coordenadas del centro de masa, I es el momento de inercia de la el centro de masa y es perpendicular a la varilla, y θ es el ángulo señalado. Como el sistema tiene tres grados de libertad, y y x, y θ son coordenadas adecuadas, T tiene ya la forma apropiada. Aplicando las ecuaciones de Lagrange, se concluye inmediatamente que s F x m m · °° ) ( 2 1 y F y m m · + °° ) ( 2 1 θ θ F I · °° Dejando constantes a y y θ y aumentando x a x x ∂ + , resulta claro que el trabajo hecho por la gravedad 0 · ∂ s W . Por tanto 0 · s F . En forma semejante, g m m F y ) ( 2 1 + − · y 0 · θ F . Por consiguiente, las ecuaciones del movimiento, en forma final son 0 · °° x , g y − · °° , 0 · °° θ Esto quiere decir que el centro de masa tiene el sencillo movimiento de un proyectil (despreciando la resistencia del aire) y que la palanqueta gira con velocidad angular constante ° θ . Ejemplo 4.3A. Extensión del ejemplo 4,3. Se trata de plantear las ecuaciones del movimiento de la palanqueta usando como coordenadas 1 x , 1 y y θ . Puede escribirse T como ) ( 2 1 ) ( 2 1 2 1 2 1 2 2 1 2 1 1 y x m y x m T + + + · ° ° ° . Pero se observa que θ cos 1 2 I x x + · y que θ Isen y y + · 1 2 . Derivando estas relaciones y eliminando ° s x y ° s y se obtiene ) cos 2 2 ( 2 ) ( 2 1 1 3 3 3 2 1 2 1 2 1 θ θ θ θ θ ° ° ° ° ° ° ° + − + + + · y I sen x I I m y x m m T Aplicando les ecuaciones de Lagrange se obtienen los siguientes resultados: ° °° °° · − − + 1 cos ) ( 3 3 2 1 2 1 s F I m sen I m x m m θ θ θ θ 184 ° °° °° · − + + 1 cos ) ( 3 3 2 1 2 1 y F I m sen I m y m m θ θ θ θ θ θ θ θ F y I sen x I I m · + − °° °° °° ) cos ( 1 1 2 3 De aquí se sigue fácilmente que 0 1 · Fx , g m m Fy ) ( 2 1 1 + − · y θ θ cos 2 gl m F − · . Es Importante notar que al cambiar las coordenadas, la forma de las ecuaciones del movimiento puede variar mucho. Además, aún cuando algunas da las coordenadas se conserven (θ en este caso), las fuerzas generalizadas cambian, como e. demostró en el ejemplo 4.2. Ejemplo 4.4. Péndulo con soporte deslizante. El péndulo de la figura 4.4 está suspendido de un bloque de masa m1 que puede deslizarse libremente sin fricción a lo largo del eje horizontal X. Si se supone que r es constante y que todo el movimiento está confinado al plano XY, el sistema tiene dos grados de libertad. Se usaran como coordenadas 1 x y θ . Iniciando con las coordenadas 2 1 , x x y 2 y se ve que ) ( 2 1 2 1 2 2 2 2 2 2 1 1 y x m x m T + + · ° ° ° Pero θ rsen x x + · 1 2 y θ cos 2 r y · .Eliminando 2 ° x y 2 ° y de T , se obtiene finalmente ) cos 2 ( 2 1 2 1 2 2 1 2 1 2 2 1 1 ° ° ° ° ° + + + · θ θ θ r x r x m x m T de donde 1 2 2 3 1 2 1 cos ) ( s F sen r m r m x m m · − + + ° °° °° θ θ θ θ y ° · + °° °° θ θ θ F r m x r m 2 2 1 2 cos . En la forma usual, se encuentra 0 · s F y θ θ grsen m F 2 − · , y así se completan las ecuaciones del movimiento. Si se supone que el movimiento es de tal naturaleza que θ es siempre una cantidad bien pequeña, puede reemplazarse θ cos en T por la unidad, θ sen en θ F por θ y puede despreciarse el término en ° 2 θ . Las ecuaciones del movimiento se convierten entonces en 0 ) ( 2 1 2 1 · + + °° °° θ r m x m m θ θ gr m r m x r m 2 2 2 1 2 − · + °° °° 185 La primera ecuación puede integrarse en forma directa. Eliminando 1 °° x de la segunda ecuación por medio de la primera, se obtiene una forma fácilmente integrable. Los resultados finales son 2 3 1 2 1 2 1 C t C m m r m x + · + + θ y ) . ( δ ϖ θ + · t Asen en donde A C C , , 2 1 y 2 δ son cantidades arbitrarias que se determinan por las condiciones iniciales específicas, y 1 2 1 ) ( rm g m m + · ϖ . Supóngase que cuando 0 1 0 1 , , , 0 1 θ θ θ · · · · ° ° x x x x t y . ° ° · θ θ θ Sustituyendo estas condiciones en las formas Integradas, se obtienen cuatro ecuaciones de las cuales se deduce que ° ° · + + · θ θ 2 1 2 0 1 m m r m x C θ θ · + + · 2 1 2 0 2 m m r m x C ° ° + · 2 2 2 0 ϖ θ θ θ A y ° · θ θ θ ϖ θ δ tan con lo cual se ilustra al método general para determinar las constantes de integración a partir de las condiciones iniciales dadas. Ejemplo 4.5. Las masas de la figuro 4-5 se mueven verticalmente bajo la acción de la gravedad y los resortes. Aplicando el teorema del numeral 2.10, se ve que ° ° ° ° + + + + + · 2 3 3 2 2 2 2 1 1 2 3 2 1 2 2 2 ) 2 ( q m q m q m y m m m T Pero por la definición del centro de masa, . 3 3 2 2 1 1 q m q m q m + · Derivando esto y eliminando 1 ° q de 1 T , se tiene ° ° ° ° ° ° + + + + · 2 3 3 2 3 2 2 2 3 1 3 3 1 2 1 2 2 2 ) ( 2 2 q m q m y q m m q m m m y M T en donde 3 2 1 m m m m + + · . Como el sistema tiene tres grados de libertad y como 186 2 1 , q y y 3 q son coordenadas adecuadas, se concluye que la segunda forma de T no contiene coordenadas superfluas. Al aplicar las ecuaciones de Lagrange se obtienen fácilmente las siguientes ecuaciones del movimiento: 2 3 1 3 2 2 2 1 1 2 ) ( Fq q m m m q m m m m · + + °° °° , 3 3 1 2 1 3 3 1 3 2 ) ( Fq q m m m m q m m m · + + °° °° , Fy y M · °° Lo que sigue es una clara demostración de la naturaleza de las fuerzas generalizadas y de la técnica de hallar sus expresiones. Por Inspección se demuestra que para un desplazamiento general de todo el sistema (véase las ecuaciones (4.12), y Mg q q I q q k q q I q q k W total δ δ δ δ δ δ − − − + − + − + − · ) )( ( ) )( ( 2 3 1 2 3 2 2 1 1 2 1 1 en donde 1 k y 2 k son las constantes elástica, y 1 I y 2 I son las longitudes normales (sin estirar) de los resortes superior e inferior, respectivamente. Utilizando una vez más la relación del centro de masa 3 1 3 2 1 2 1 q m m q m m q δ δ δ + · y eliminando 1 q y 1 q δ . 2 2 2 3 2 1 3 1 3 2 1 2 1 1 2 1 1 ) ( ) ( ) ( q I q q k I q m m q m m m m m m k W total δ δ ] ] ] − − + − + + + − · y Mg q I q q k I q m m q m m m m m k δ δ − ] ] ] − − − − + + − + 3 3 3 3 3 1 3 1 3 2 1 2 1 1 3 1 ) ( ) ( Esta ecuación tiene la forma de (4.12) y por tanto resulta claro que los coeficientes de 3 2 , q q δ δ y y . δ fuerzas generalizadas 3 2 , Fq Fq y Fy respectivamente. Así se han completado las ecuaciones del movimiento. (Véase el problema 4.5.) A manera de extensión del ejemplo, se determinan a continuación las fuerzas generalizadas por aplicación directa de (4.10) que, para este sistema, toma la forma r r r r q y Fy q y Fy q y Fy Fq ∂ ∂ + ∂ ∂ + ∂ ∂ · 3 3 2 2 1 1 en donde r q puede representar a 1 y a 2 q o a 3 q . 1 Fy es la fuerza vertical total que actúa sobre 1 m , etc. Por inspección de la figura se demuestra que (como 3 1 3 2 1 2 1 q m m q m m q + · ) , ` . | − + + − · 1 2 3 1 3 2 1 2 1 1 1 I q q m m q m m k g m Fy ( ) 1 2 3 2 1 3 3 1 3 3 1 2 1 2 2 I q q k I q q m m q m m k g m Fy − − − , ` . | − + + − · 187 ( ) 1 2 3 2 3 3 I q q k g m Fy − − − · Por otra parte 3 1 3 2 1 2 1 q m m q m m y y + + · , 2 2 q y y − · , 3 3 q y y − · Entonces, por ejemplo 2 Fq está dada por 2 3 3 2 2 2 2 1 1 2 q y Fy q y Fy q y Fy Fq ∂ ∂ + ∂ ∂ + ∂ ∂ · Pero 1 , 2 2 1 2 2 1 − · ∂ ∂ · ∂ ∂ q y m m q y y 0 2 3 · ∂ ∂ q y . Así, esta relación se reduce fácilmente a la hallada anteriormente para 3 Fq y Fy pueden obtenerse en seguida. La ecuación del movimiento correspondiente a y demuestra que el centro de masa cae con una aceleración constante g . Las otras dos ecuaciones se integran fácilmente y pueden ser puestas en la forma A q b q a q b q a · + + + °° °° 3 12 3 12 2 11 2 11 B q b q a q b q a · + + + °° °° 3 22 3 23 2 21 2 21 en donde A, B, las a y las b, son constantes. Aquí no se continúa el estudio de estas ecuaciones ya que en el capitulo 10 se tratan en detalle los métodos de integración aplicables a estas formas. Ejemplo 4.6. El péndulo doble de la figura 2.10. Supóngase que los hilos que sostienen las masas son inextensibles y que el movimiento está confinado a un plano. La expresión (2.42) se reduce a , ` . | − + + + · ° ° ° ° ° ) cos( 2 2 2 2 1 2 2 2 2 2 1 2 2 2 1 1 θ φ φ θ φ θ θ r r r r m r m T De donde ) cos( 2 1 2 2 1 2 2 1 1 θ φ φ θ θ θ − + + · ∂ ∂ ° ° ° ° r r m r m r m T ) ( ) ( ) cos( ) ( 2 1 2 2 1 2 2 1 2 1 θ φ θ φ φ θ φ φ θ θ − + − − + + · , ` . | ∂ ∂ ∂ ∂ ° ° ° °° °° ° sen r r m r r m r m m T t Asimismo, ) ( 3 1 2 θ φ φ θ θ − · ∂ ∂ ° ° ° sen r r m T θ θ φ φ θ φ φ θ F sen r r m r r m r m m · − − − + + ° °° °° ) ( ) cos( ) ( 2 2 1 2 2 1 2 2 1 2 1 En forma semejante la ecuación correspondiente φ es φ θ φ φ θ φ φ θ F sen r r m r r m r m · − + − + ° ° °° °° ) ( ) cos( 2 2 1 2 2 1 3 2 2 2 Para hallar θ F supóngase que se incremente el ánguloθ en una cantidad igual a δθ + , dejando constante φ . 188 Esto significa que las dos masas deben ser elevadas ligeramente. Por tanto, θ θδθ δ sen gr m m W 1 2 1 ) ( + − · y θ θ sen gr m m F 1 2 1 ) ( + − · Con θ fijo, la masa 1 m no mueve y , 2 2 φδθ δ φ sen gr m W − · de donde φ φ sen gr m F 2 2 − · . Así, se tienen las ecuaciones del movimiento completas. Si el movimiento es muy pequeño (θ y φ sIempre pequeños) estas ecuaciones del movimiento se reducen a la misma forma de las del ejemplo 4,5. y por consiguiente pueden integrarse. (Véase el capitulo 10.) Ejemplo 4.7. Un sistema que se mueve con aceleración lineal constante (Fig. 4.1). El punto de apoyo del sistema de poleas de la figura 4-1 se mueve hacia arriba con aceleración constante a ° ° ° ° + + − · 2 3 3 2 2 2 2 1 1 2 1 2 1 ) ( 2 1 s m s m y I m T En donde at I · , at y s y · − + ° ° ° 1 2 2 y ° ° ° + · 2 2 2 2 s y s por tanto, 2 2 1 3 2 2 1 2 2 1 1 2 1 2 1 ) ( 2 1 , ` . | − + + , ` . | − + + − · ° ° ° ° ° y y at m y y at m y at m T Y entonces las ecuaciones del movimiento serán 1 1 3 2 2 2 3 1 3 2 1 ) ( ) ( ) ( Fy a m m m y m m y m m m · − + + − + + + °° °° 2 2 3 3 3 2 1 1 3 ) ( ) ( ) ( Fy a m m y m m y m m · − + + + − °° °° Como para determinar las fuerzas generalizadas se deja fijo el tiempo Y g m m m Fy ) ( 3 2 1 1 − − · y g m m Fy ) ( 3 2 2 − · tal como en el ejemplo 4.1. En realidad, en el caso de este sencillo ejemplo de aceleración lineal constante, las ecuaciones del movimiento son las mismas excepto que. Efectivamente, g se ha aumentado a g + a. Como extensión de lo anterior, el estudiante puede escribir fácilmente las ecuaciones del movimiento suponiendo que h varía de cualquier forma determinada, con respecto al tiempo. (Véase el problema 4.16.) Ejemplo 4.5. Un sistema que se mueve con rotación y aceleración lineal. Considérese el sistema que se muestra en la figura 4.6. Un pequeño tubo que contiene las masas 1 m y 2 m conectadas por medio de resortes, está montado formando un ángulo α sobre una plataforma giratoria. El plano vertical que pasa por el centro del tubo pasa también por el eje de rotación de la plataforma. El conjunto está montado en un elevador que se mueve con aceleración hacia arriba α . Obtendremos las ecuaciones del movimiento de 1 m y 2 m en función de las coordenadas 1 q y 2 q . 189 En coordenadas cilíndricas, fijas a la superficie de la Tierra y supuestas inerciales ) ( 2 1 ) ( 2 1 2 2 2 2 3 2 3 2 2 1 2 1 2 1 2 1 1 ° ° ° ° ° ° ° + + + + + · z r r m z r r m T θ θ Tomando el origen de estas coordenadas en el centro de rotación del disco, se ve que , cos 1 1 α q s r + · , . 1 t ϖ θ · , . 2 1 2 1 1 t sen q z α α + · , cos 2 2 α q s r + · , . 2 t ϖ θ · , . 2 1 2 2 2 t sen q z α α + · Por medio de estas relaciones puede expresarme T fácilmente como ( ) ] ] ] ] ] + + + + · ° ° 2 2 2 2 1 1 2 1 1 ) cos 2 2 1 t q s sen t q q m T α ϖ α α α ( ) ] ] ] ] ] ] + + + + + ° ° 2 2 2 2 2 2 2 2 2 ) cos 2 2 1 t q s sen t q q m α ϖ α α α Las únicas coordenadas que aparecen en T son 1 q y 2 q y debe observarte además que t aparece en forma explicita. Al aplicar las ecuaciones de Lagrange, se obtiene ( ) 1 1 2 1 1 1 cos cos Fq q s m sen q m · + − , ` . | + °° α α ϖ α α ( ) 2 2 3 2 2 2 cos cos Fq q s m sen q m · + − , ` . | + °° α α ϖ α α Ignorando el movimiento del sistema, el trabajo hacho por la gravedad al Incrementar ligeramente a 1 q únicamente, es ( ) 1 2 1 2 2 1 1 1 1 1 1 1 ) ( q I q q k q I q k q gsen m Wq δ δ αδ − − + − − − · ∂ En donde 1 I y 2 I representan las longitudes normales de los resortes primero y segundo respectivamente. Así 2 2 1 1 2 2 1 2 1 1 1 ) ( I k I k q k q k k gsen m Fq − + + + − − · α En forma similar ) ( ) ( 2 1 2 2 2 1 2 2 3 2 2 2 I I k I k q k q k k gsen m Fq + + + + − − · α Con esto se completan las ecuaciones del movimiento. Por Inspección puede demostrarse que la aceleración del elevador tiene el efecto de Incrementar a g en una magnitud Igual a α . 190 Ejemplo 4.9. Ecuaciones del movimiento cuando partes de un sistema se obligan a moverse de una manera determinada. Con lo que sigue se ilustra un tipo de problema que algunas veces se encuentra en la práctica. Se supone que en el sistema de la figura 4.1 se ha introducido un mecanismo adherido al piso que ejerce una tuerza variable sobre 2 m de tal manera que 2 s varía con el tiempo, de una manera determinada. Se trata de determinar la ecuación del movimiento para el resto del sistema, despreciando las masas de las poleas. Debido a este movimiento forzado (es decir, como 2 s una función conocida del tiempo) y suponiendo movimiento vertical únicamente, el sistema tiene ahora sólo un grado de libertad. Bien 1 y o 2 y pueden servir como coordenada adecuada, y suponiendo que los hilos están siempre tensos, 1 2 2 1 C s y s · + + y 2 1 1 C y s · + . Por tanto ° ° ° + · 2 1 2 s y y . Así pues se escribe, , ` . | − + + · ° ° ° ° s y m s m y m T 1 3 2 2 2 2 1 1 2 2 1 2 1 2 1 A fin de hacer el ejemplo más específico, se supone que la fuerza aplicada a 2 m es tal que t sen A s s ω + · 0 2 , en donde 0 s a. es une constante; en tal caso, 2 1 3 2 2 2 2 2 1 1 ) . cos 2 ( 2 1 cos 2 1 2 1 t A y m t A m y m T ω ω ω ω − + + · ° ° y la ecuación del movimiento será 1 2 3 1 3 1 2 ) 4 ( Fy t sen A m y m m · + + °° ω ω (Nótese que no es necesario conservar el segundo término de T por ser función t solamente.) Al aplicar la ecuación 1 1 1 y Fy Wy δ · ∂ dejando a t constante, se encuentra g m m Fy ) 2 ( 3 1 1 − · . Con esto se completa la ecuación del movimiento. Se observa que 1 Fy aquí, no es igual a la del ejemplo 4.1. A manera de ejemplo adicional considérese el sistema de la figura 2-15, que tiene cuatro grados da libertad. Supóngase ahora que una fuerza exterior que actúa sobre el eje de la polea superior hace que 1 s varíe de una manera determinada; y otra que actúa sobre 2 m le imprime otro movimiento conocido. El sistema tiene ahora sólo dos grados de libertad, y suponiendo que los hilos se conservan tensos, puede escribirse T en función de ° ° 3 2 , s s y t , por ejemplo. (Véase el problema 4.19.) 7.7. Fuerzas y movimientos de las partículas cargadas en un campo electromagnético. Constituye una rama importante de la dinámica, el estudio del movimiento de las partículas cargadas y las masas, a través de campos eléctricos y magnéticos. Sin embargo salvo en el caso especial de sistemas de coordenadas inerciales y velocidades relativamente bajas (que supondremos a continuación) el problema debe resolverse por métodos relativísticos. Este tema constituiría por si mismo un capitulo de buen tamaño. 191 Con las suposiciones anteriores, las componentes rectangulares de la fuerza sobre una partícula con carga Q, que se mueve con velocidad ) , , ( ° ° ° z y x a través de un espacio en donde Existe un campo eléctrico E, de componentes ) , , ( z y x E E E y un campo magnético ) , , ( z y x B B B B están dadas por ) ( y z x x B z B y Q QE F ° ° − + · ; ) ( z z y y B x B z Q QE F ° ° − + · ; ) ( z y z z B y B x Q QE F ° ° − + · (4.13) en donde E y B pueden ser funciones de las coordenadas y del tiempo. Utilizando estas expresiones de ) , , z y x F F F en (4.10), el procedimiento para plantear las ecuaciones del movimiento es tal como se ha hecho en-los ejemplos anteriores. Ejemplo 4.10. Ecuaciones del movimiento de una palanqueta cargada en un espacio con campo eléctrico y magnético. Las pequeñas esferas de la figura 4-3 portan cargas 1 Q − y 2 Q + respectivamente, distribuidas uniformemente. Supóngase un campo magnético en la dirección del eje Z y un campo eléctrico E, en la dirección de X, siendo ambos uniformes en el plano XY. Al moverse la palanqueta, 1 m sufre la acción de una fuerza. ° − − · 1 1 1 1 y B Q E Q Fs , ° · 1 1 1 x B Q Fy Y algo semejante para 2 m . Por tanto para un desplazamiento virtual general, 3 3 3 2 2 2 2 1 1 1 1 1 1 1 ) ( ) ( y x B Q x y B Q E Q y x B Q x y B Q E Q W total δ δ δ δ δ ° ° ° ° − + + + + − · Tomando a y x, y θ como coordenadas generalizadas (véase el ejemplo 4.3) por las relaciones θ cos 1 1 I x x − · θ sen I y y 1 1 − · , etc. se concluye que θ θ sen I x x ° ° ° − · 1 1 θδθ δ δ sen I x x 1 1 + · , etc. Por tanto, la expresión anterior puede escribirse finalmente como x I Q I Q B y Q Q E Q Q W total δ θ θ δ ° ° + + − + − · ] cos ) ( ) ( ) [( 1 1 2 2 1 3 1 2 y sen I Q I Q B x Q Q B δ θ θ ] ) ( ) ( [ 2 2 1 1 2 1 ° ° + + − + y sen y x B sen E I Q I Q δ θ θ θ )] cos ( [ ) ( 2 2 1 1 ° ° + + + − en donde pueden leerse directamente las expresiones de las fuerzas generalizadas. (Ya que tiene la forma de (4.12).) T , y por tanto las ecuaciones del movimiento, tienen exactamente las mismas formas que en el ejemplo 4.3. (Véase el problema 4.20) 7.8. Consideraciones sobre el significado físico de las ecuaciones de Lagrange. Las observaciones del numeral 3.10 relacionadas con una sola partícula se extienden a continuación para un sistema de p partículas. 192 Supóngase que en las ecuaciones (4.4) t y todas las coordenadas, menos r q se conservan constantes. Entonces, estas ecuaciones se convierten en ) ( 1 1 r q x x · , ) ( 1 1 r q y y · , ) ( 1 1 r q z z · (4.14) Como 1 1 , y x y 1 z son las coordenadas rectangulares de la partícula individual 1 m , existirá un conjunto de tales ecuaciones para cada una de las p partículas. Es decir, que (4.14) representa p conjuntos de ecuaciones. Si se permite que r q varíe y se hace la gráfica de las coordenadas 1 1 , y x y 1 z (4.14), -de una cualquiera de las partículas 1 m se obtiene una curva (en general, una curva en el espacio tridimensional) que representa una trayectoria posible para 1 m de conformidad con las restricciones: Nos referiremos a esta curva como a la línea de r q para 1 m . Es claro que la localización y forma de tal curva depende de los valores constantes asignados a t y a las demás coordenadas, así como de la naturaleza de las restricciones. En este sentido puede existir un número ilimitado de líneas de r q para una partícula cualquiera. Pero en un instante determinado y para ciertos valores dados a las demás coordenadas, puede trazarse una línea específica de r q relativa al sistema de ejes X, Y, Z. De la misma manera las líneas de r q pueden trazarse para cada una de las partículas. Las ideas anteriores no presentan ninguna dificultad puesto que se refieren a líneas y superficies tridimensionales comunes. Como un ejemplo sencillo, considérese el péndulo doble de la figura 2.10. Las ecuaciones (2.13) corresponden a (4.4). Las líneas de θ para 1 m y para 2 m pueden trazaras en el plano .XY para diversos valores constantes de φ . En la misma forma pueden trazarse las líneas de φ para 2 m . (No existen líneas de φ para 1 m .) (Véase el ejemplo 4.11.) El significado anterior de las líneas de r q cumple un útil propósito en lo que sigue Designando por r s 1 δ al desplazamiento lineal de 1 m a lo largo de una línea de r q , se observa que sus componentes 1 1 , y x δ δ y 1 z ∂ son justamente los desplazamientos virtuales considerados en las ecuaciones (4.2), (4.3), etc. Los cosenos directores, r r m I 1 1 , y r n 1 de la tangente a la línea de r q en cualquier punto, están dados por. r s x I r 1 1 1 δ δ · , r s y m r 1 1 1 δ δ · , r s z n r 1 1 1 δ δ · (4.15) en donde el elemento de trayectoria es 2 1 2 1 2 1 2 1 1 ) ( z y x s r δ δ δ δ + + · . (Nótese que r s 1 δ es exactamente el mismo desplazamiento (lineal) que se supuso dado a 1 m con el objeto determinar r Wq δ en la ecuación (4.11).) ,Pero por (4.4), con t y todas las q fijas excepto r q , r r q q x x δ δ δ δ 1 1 · , etc. Así pues, r r r r q h q qr z qr y qr x s δ δ δ δ δ δ δ δ δ 1 2 1 2 1 2 1 2 1 1 · ] ] ] ] , ` . | + , ` . | + , ` . | · (4.16) 193 Finalmente r r r q x h I δ δ 1 1 1 1 · , r r r q y h m δ δ 1 1 1 1 · , r r r q z h n δ δ 1 1 1 1 · 1 (4.17) Como la componente ' v de un vector v en la dirección de una recta con cosenos directores m I , y n está dada por z y x nv mv Iv v + + · ' , se deduce que ir f , la componente de la fuerza aplicada 1 F que actúa sobre 1 m según la tangente a su línea de r q es , ` . | + + · qr z Fz qr y Fy qr x Fx h f i i i r ir δ δ δ δ δ δ 1 1 1 1 1 (4.18) En igual forma, la componente ir a de la aceleración i a de la partícula 1 m en la dirección de la misma tangente es, , ` . | + + · °° °° °° qr z z qr y y qr x x h a i i i r ir δ δ δ δ δ δ 1 1 1 1 1 (4.19) Ahora, multiplicando y dividiendo los dos lados de (4.7), (habiendo remplazado a 1 q δ por r q δ ), por ir h y utilizando la relación r ir ir q h s δ δ · , se observa que las ecuaciones de Lagrange pueden escribirse como r r p i p i ir ir ir ir i q Fq s f s m δ δ δ α · · ∑ ∑ · · 1 1 (4.20) Teniendo en cuenta el sencillo significado de ir ir f a , y ir s δ , se observa con claridad una simple interpretación física y geométrica de las ecuaciones de Lagrange, por medio de (4.20). Por otra parte, nótese que, como puede verse en (4.19), una expresión de ir a , la aceleración lineal de 1 m en la dirección de su línea de r q , puede obtenerse en forma inmediata a partir de ] ] ] ] − , ` . | ∂ ∂ · ° ° r r ir ir q T q T t h m δ δ δ δ α 1 1 1 1 (4.21) en donde ) ( 2 1 2 1 2 1 2 1 1 1 ° ° ° + + · z y x m T se expresa en coordenadas generalizadas por medio de las ecuaciones (4.4). Ejemplo 4.11. Considere el sistema que se muestra en la figura 4-7. Las partículas de masas 1 m y 2 m están suspendidas de los extremos de un hilo que pasa por los pequeños anillos lisos en a y en b . La masa 1 m puede moverse en contacto con el cono 1 C en tanto que 2 m debe moverse únicamente en contacto con el plano vertical P (por la acción de dos superficies planas, paralelas y lisas que no se muestran en el dibujo). El cono 194 está fijo, pero el plano P se hace oscilar alrededor del eje vertical B , según t Asen . ω α · , en donde α se mide a partir del eje X. Como · · + c r r 2 1 constante y · 1 θ constante, el sistema tiene trae grado, de libertad. De acuerdo con la notación general, se escribe 1 1 r q · , φ · 2 q y 2 3 ϑ · q . En función de estas coordenadas, las ecuaciones (4.4), como puede verse fácilmente en la figura, tienen la forma, para 1 m , 1 2 1 1 cos θ sen q q x · , 1 2 1 1 cos θ sen q q y · , 1 1 1 cosθ q k z + · Para 2 m ( ) [ ] ( ) t Asen senq q c I x . cos 3 1 2 ω − + · , ( ) [ ] ( ) t Asen sen senq q c I y . 3 1 2 ω − + · , 3 1 2 cos ) ( q q c h z − − · Nótese que en este ejemplo en particular no todas las coordenadas aparecen en todas las ecuaciones de (1) y (2). Al hacer variar a 1 q y trazar las relaciones (1) y (2) pera diferentes valores constantes de 2 q , 3 q y t , se obtienen las líneas de 1 q de 1 m (recta, sobre el cono) y las líneas de 1 q de 2 m (rectas radiales sobre P). En forma semejante se obtienen las líneas de 2 q de 1 m y las de 3 q de 2 m . Como 3 q no aparece en ) (I no existen las líneas de 3 q para 1 m . Asimismo, es evidente que no hay líneas de 2 q para 2 m . Nótese, que 11 a es la componente de la aceleración lineal de 1 m a lo largo de una de sus líneas de 1 q sobre el cono, y que 21 a es la aceleración de 2 m a lo largo de su línea de 1 q en P . Asimismo, 23 a , por ejemplo, es la aceleración de 2 m en la dirección de la línea de 3 q en el plano P . Las expresiones de estas aceleraciones pueden encontrarse aplicando (4.21) a ( ) ( ) ( ) ] ] ] − + + − + + , ` . | + · ° ° ° ° t A senq q c I q q c q m sen q q q m T . cos 2 1 2 1 2 2 2 2 3 1 2 3 2 1 2 1 2 1 2 2 2 2 1 2 1 1 ω ω θ 7.9. Experimento sugerido. 195 Determinación de las frecuencias del movimiento del sistema de “dos partículas” que se muestra en la figura 4.8. El equipo necesario es sencillo y los resultados obtenidos son interesantes. Los valores de las masas y de las constantes eléctricas no tienen características críticas; los que se muestran en el diagrama son solamente sugeridos. Suponiendo movimiento vertical únicamente y utilizando como coordenadas a 1 q y 2 q que indican los desplazamientos verticales de 1 m y 2 m de sus posiciones de equilibrio, se plantean las ecuaciones del movimiento. Estas ecuaciones de segundo orden con coeficientes constantes pueden integrarse fácilmente por medio de métodos comunes. Las soluciones mostrarán que al iniciar el movimiento de alguna manera arbitraria, cada una de las masas sufrirá la combinación de dos movimientos armónicos simples de diferentes frecuencias 1 f y 2 f . (Las dos masas oscilan con las mismas frecuencias pero con diferentes amplitudes.) Para obtener una comprobación experimental de las frecuencias calculadas, se procede de la siguiente manera: Aplicando un movimiento oscilatorio a 1 m (o a 2 m ) con la mano, luego de cierta práctica, es posible excitar bien 1 f o 2 f o f, únicamente. Se aseguran los buenos resultados si se tiene en cuenta que cuando la frecuencia aplicada es aproximadamente igual a 1 f o a 2 f , se requiere muy poco esfuerzo para logar oscilaciones grandes. Al retirar la mano, el sistema continúa oscilando en uno de sus modos naturales. El tiempo cubierto por cincuenta oscilaciones, determinado con un cronómetro confiable, produce un buen valor experimental de la frecuencia. Cuando se ha logrado suficiente precisión en las mediciones de 1 m , 2 m , 1 k y 2 k , los valores experimentales y calculados para 1 f y 2 f concuerda estrechamente. Por observación directa es fácil hacer una comprobación cuantitativa de las amplitudes relativas del movimiento de 1 m y 2 m para 1 f , o para 2 f . Es posible lograr una comprensión adicional considerable sobre el comportamiento de los sistemas oscilantes al observar 1 m y 2 m luego de haber iniciado el movimiento de alguna manera arbitraria, de modo que las dos frecuencias resulten incitadas simultáneamente. 196

Física Molecular (termodinámica) A.Kikoin Kikoin

Comments

Description