3.2 Arquitectura del Procesador §1 Sinopsis El procesador es todo un mundo en sí mismo; aunque los primeros eran comparativamente simples, actualmente han alcanzado una notable complejidad. En el presente capítulo dedicaremos algunos comentarios a su estructura lógica, mencionando de pasada que su tecnología física ha avanzado paralelamente con la de construcción de circuitos integrados, IC's, lo que a la postre ha significado unas dimensiones físicas cada vez más pequeñas y un menor consumo. La evolución de ambos parámetros no solo ha permitido incrementar la densidad de integración, también la velocidad (frecuencia de funcionamiento). Si nos referimos a la familia Intel, de los 2.100 transistores del 4004 en 1970, que con solo 46 instrucciones funcionaba a unos 800 KHz, se pasó a los 29.000 transistores del 8086 en 1979 a 14 MHz; y en 1999 a los 8.200.000 transistores del Pentium III a 2 GHz. Nota: acabo de leer (Noviembre 2001) que Intel anuncia la nueva tecnología de 0.13 micras para su serie Pentium 4 (hasta ahora era de 0.18 micras), con la que se espera que a fines de 2002 se alcancen los 3 GHz. en estos procesadores. Un poco después (Enero 2002) leo que Intel espera alcanzar 1.2 THz en sus procesadores para el 2005 (escribo esto en un Pentium II a 200 MHz no demasiado antiguo). En Abril del 2002 Intel anuncia el procesador Pentium 4 con tecnología CMOS de 0,16 micras a 2.4 GHz y mejoras en el proceso de fabricación que permiten su fabricación en obleas de 300 mm. Esta tecnología permite al fabricante proporcionar más de cinco veces el volumen de productos en una sola oblea en comparación con la del procesador Pentium 4 inicial. En Junio del mismo año Intel desvela su nueva tecnología de fabricación de transistores "TeraHerz", con la que pretende que en el 2005 pueda alcanzar los 10 GHz. Craig Barret, CEO [7] de la compañía, afirma que en un futuro no lejano esperan conseguir 2.000 millones de transistores en un procesador a 30 GHz. Actualmente se trabaja en el límite de la resolución óptica de los dispositivos utilizados en su construcción (se usan técnicas fotográficas con longitudes de onda cada vez menores para la luz utilizada), y debido a la altísima frecuencia de funcionamiento, los conductores internos funcionan más como guías de onda que como conductores eléctricos convencionales. Además, las dimensiones físicas del propio dispositivo están teóricamente limitadas si se desea que todos sus elementos funcionen según un mismo patrón de tiempo (cosa que es imprescindible). Para dar una idea de las formidables dificultades técnicas que han debido resolver los diseños actuales, considere que a la velocidad del Pentium III, las señales eléctricas solo recorren 15 centímetros en cada ciclo de reloj. Segundo: cualquier operación que deba ejecutarse con el procesador deberá poder ser descrita en términos de este "lenguaje" elemental (recuerde que los compiladores e intérpretes son en realidad traductores desde el lenguaje de alto nivel (fuente) a este lenguajemáquina. rapidez individual aunque hay que ejecutar un mayor número [2]. en las RISC. por tanto de ejecución lenta. La primera conduce a máquinas denominadas CISC ("Complex Instruction Set Computer"). que deben ser cuidadosamente escogidas. Utilizan instrucciones muy simples. y constituye lo que se conoce como lenguaje ensamblador o lenguaje-máquina [1]. Como puede deducirse de sus propios nombres. En las máquinas CISC. por dos razones. Las instrucciones son muy simples. Las consecuencias son justamente opuestas a las anteriores: • • • El lenguaje contiene un conjunto pequeño de instrucciones. lentitud de cada instrucción frente a poca cantidad de ellas. Para cualquier operación se requieren varias instrucciones elementales. Naturalmente cada criterio tiene sus pros y sus contra en lo que a rendimiento se refiere. porque cualquier operación debe ser expresada como una secuencia de estas pocas instrucciones. por tanto de ejecución rápida. podemos decir que frente a esta cuestión caben dos filosofías de diseño. lo que necesariamente se traduce en varias consecuencias: • • • El lenguaje debe contener un amplio surtido de ellas (una para cada circunstancia distinta). Para un trabajo específico se requieren pocas instrucciones (siempre hay una que resuelve el problema). Son instrucciones complejas.§2 Tipos de arquitectura Una de las primeras decisiones a la hora de diseñar un procesador es decidir cual será su juego de instrucciones. . Primero: el juego de instrucciones decide el diseño físico del conjunto. La circuitería del procesador también es compleja. Este conjunto de instrucciones (órdenes) es el lenguaje que realmente entiende el procesador. las máquinas construidas según el otro criterio se denominan RISC ("Reduced Instruction Set Computer"). La circuitería es más simple que en los procesadores CISC. La decisión es trascendente. las máquinas CISC utilizan instrucciones muy complejas. Las máquinas RISC representan el enfoque opuesto. Sin entrar en detalles. diríamos que muy descriptivas y específicas. Comparados con los accesos a RAM.§3 Componentes principales.1.1 Registros de uso general .1) ) ) Puesto que su conocimiento es esencial para la programación en ensamblador. además de ser el motor del primer PC. §3. Además recordemos que incluso los modernos Pentium pueden emular el funcionamiento en modo real de sus ancestros. es uno de los primeros ejemplares de una prolífica saga que ha tenido una gran influencia en la informática actual. y que son de dimensiones mínimas [3]. El 8088 dispone de catorce registros de 16 bits que se agrupan en cuatro grupos y que reciben nombres especiales (precisamente los que se utilizan para designarlos en lenguaje ensamblador). De forma esquemática podemos suponer que un procesador se compone de cinco elementos: • • • • • Memoria Unidad Artimético-Lógica ALU ("Arithmetic and Logic Unit" Unidad de Control CU ("Control Unit" Bus interno Conexiones con el exterior ( 3.2. sin embargo. §3.1 Los registros El procesador necesita para su funcionamiento de ciertas áreas de almacenamiento. que aquí se llaman registros. nos detendremos brevemente la descripción de la arquitectura del 8088. tienen la ventaja de su rapidez. En le figura 1 se muestran sus elementos. los de registro son como mínimo 10 veces más veloces. 5). contiene el número de puerto ( 2.3 Registros de puntero . CL.2).2 Registros de segmento Se dispone de cuatro registros que sirven para contener las direcciones de otros tantos segmentos (zonas de 64 KB de memoria). aunque pueden ser utilizados a discreción para cualquier cosa que necesitemos.2).3. permiten manejar la totalidad de la memoria direccionable (el bus de direcciones es de 20 bits). DH y DL. los anteriores y sus mitades: AH. §3. los datos y la pila.2). y después de esta.1. su mitad inferior DL.Existen 4 registros denominados AX. • AX es denominado acumulador. Segmento extra ES ("Extra segment"). Las instrucciones de bucle (LOOP) utilizan este registro como contador. Es un segmento auxiliar a los anteriores. el resultado de la operación. Segmento de datos DS ("Data segment"). BX. En general las instrucciones que trabajan con este registro (o su mitad inferior) tienen un microcódigo • • • más simple que la misma instrucción ejecutada con otro registro. Ver al respecto el epígrafe "Direccionamiento segmentado" ( • • • • 5. en caso necesario pueden ser utilizados en dos mitades (nibbles). En operaciones de entrada/salida de puertos IN/OUT. Se utiliza en operaciones de multiplicación y división junto con AX. BX es el registro base. CH. CX y DX que en realidad tienen asignados usos característicos.1). Segmento de pila SS ("Stack segment"). BH. Señala la dirección del segmento de datos del programa en ejecución ( E1.3. Nota: Puede ocurrir que programas pequeños utilicen el mismo segmento para el código. multiuso. Aunque estos cuatro registros son de 16 bits (como los 10 restantes) [6]. BL. Segmento de código CS ("Code segment"). Señala la dirección del segmento de código del programa que se está ejecutando ( E1. "High" y "Low". Utilizándolos en conjunción con otros registros que señalan las direcciones concretas dentro de estos segmentos (los desplazamientos ). DX es un registro de datos. suele contener la dirección de inicio de una tabla de valores. de 8 bits. suele contener uno de los operandos que intervienen en las operaciones aritméticas y lógicas.1. AL.3. con lo que puede considerarse que existen 12 registros de uso general (no simultáneos). Señala la dirección del segmento donde está la pila del programa ( E1. CX es denominado contador. §3. se utiliza para señalar espacio extra en alguno de los segmentos o para almacenar momentáneamente direcciones intermedias. 2) El primero. Si está activo Indica un número par de bits activos (bits cuyo . Por ejemplo. El puntero de pila SP ("Stack Pointer"). de forma que por ejemplo.1.2 Ejemplo-2). Son los siguientes: Bit Indicador de: CF Acarreo ("Carry Flag") PF Paridad ("Parity Uso Indicador de arrastre del bit de mayor orden. estas direcciones son desplazamientos dentro de los segmentos indicados por los registros de segmento • (ver figura 5. indica el desplazamiento (dentro del segmento de código CS) de la próxima instrucción a ejecutar. una nueva invocación de función creará un nuevo registro de activación que comenzará en este punto. En caso necesario la pila puede crecer a partir de este punto. que puede ocurrir en las operaciones aritméticas suma y resta. el registro de estado (FLAGS). y tiene un identificador que termina en F ("Flag"). denominado indistintamente puntero de instrucción IP ("Instrucción pointer") y contador de programa PC ("Program counter"). Generalmente estos dos registros se utilizan con alguno de los registros de uso general y con ciertas instrucciones específicamente pensadas para transferir datos (dentro de un rango de posiciones de memoria). señala el desplazamiento del final de la pila dentro del segmento de pila SS. en razón de su utilización muy particular. en el que 9 de los 18 bits actúan como semáforos (indicadores del estado del procesador y del resultado de determinadas operaciones). dentro de la palabra de 16 bits. desde un punto inicial de un segmento de datos. Cada bits individual puede estar "activo" (1) o "inactivo" (0). si después de una suma aritmética hay o no desbordamiento del bit más significativo. • • • Ver en la página adjunta un ejemplo relativo al uso de punteros ( §3.Son 5 registros destinados a contener direcciones. 3. Existen dos registros denominados "de índice". Los nombres y situación de cada uno. a otro. el índice fuente SI ("Source index") y el índice destino DI ("Destination index").1 Fig. El puntero base BP ("Base pointer") señala el desplazamiento (dentro del segmento de pila SS) donde se encuentra el origen de la zona ocupada por las variables dinámicas. se muestran en la figura 2.4 Registro de estado Existe un registro especial. el "prompt" es un guión "-") introducir el comando R (pedimos que nos muestre el contenido de los registros).1) para Flag") Invocar DEBUG desde una ventana DOS (suponemos que estamos en Windows. el procesador genera automáticamente una Flag") interrupción después de la ejecución de cada instrucción. ZF Cero ("Zero Flag") Está activo si el resultado de operación es cero o resultado de comparación igual.4). AF Acarreo auxiliar Indicador de ajuste en operaciones aritméticas con cantidades BCD ( E0. Esta información es útil cuando el procesador controla transmisiones de datos.contenido es 1). el significado de la notación utilizada es el siguiente: Bit Indicador de: CF Acarreo PF Paridad AF Acarreo auxiliar Indicativo si bit 1 Indicativo si bit 0 CY ("Carry yes") NC ("No Carry") PE ("Parity Even") paridad par PO ("Parity Odd") paridad impar AC ("Auxiliar Carry") NA ("No Auxiliar") . el estado inactivo (0) las deshabilita. SF Signo ("Sign Flag") Si está activo indica que el resultado de operación o de comparación son negativos [5]. lo que permite controlar paso a paso la ejecución del programa. IF Interrupción Este bit controla el estado del sistema de interrupciones ("Interrupt Flag") enmascarables ( 2. DF Dirección Indica la dirección de las operaciones.1w1). Cuando está activo (1) permite las interrupciones. ("Direction Flag") OF Desbordamiento Señala desbordamiento aritmético (Overflow Flag") Nota: Los usuarios de MS-DOS o Windows puede usar el programa DEBUG ( inspeccionar y modificar el contenido de los registros de la siguiente forma: • • • 1. Este bit debe estar normalmente inactivo (a 0). Salir de Debug con Q En mi PC la respuesta al comando tiene el siguiente aspecto: AX=0000 BX=0000 CX=0000 DX=0000 SP=FFEE BP=0000 SI=0000 DI=0000 DS=1779 ES=1779 SS=1779 CS=1779 IP=0100 NV UP EI PL NZ NA PO NC Los valores están expresados en hexadecimal. TF Detención ("Trap Si está activo.7. La última secuencia de caracteres (NV UP EI PL NZ NA PO NC) muestra el contenido del registro de estado (el bit TF de detención no se muestra). Después de un comando de este tipo. DEBUG responde con un "prompt" distinto del habitual ":". etc ( E4. SP.2 Unidad Aritmético-lógica Como su propio nombre indica.ZF SF IF DF OF Cero Signo Interrupción Dirección Desbordamiento ZR NG EI DN OV ("Zero") ("Negative") negativo ("Enabled Interrupt") activa ("Down") decremento ("Overflow") NZ ("No Zero") PL ("Plus") positivo DI ("Disabled Interrupt") desactivada UP incremento NV ("No overflow") También es posible inspeccionar el contenido de un solo registro. y que las operaciones con números fraccionarios debían hacerse mediante artificios software. BP. En cuanto a las primeras. Los nombres que pueden utilizarse para los registros son los siguientes: AX.9. también ejecuta operaciones como raíz cuadrada y funciones trascendentes.1. . SS. SI.5 Comentario Observe que tanto el registro contador de programa IP. es responsable de realizar ciertas operaciones aritméticas y lógicas. DX. DS. las operaciones trascendentes están implementadas mediante funciones de la Librería Estándar ( 5).9. §3. para indicar que debe introducir el nuevo valor que desea para el registro. la unidad lógica es la responsable de realizar operaciones lógicas como AND. Por ejemplo. La unidad aritmética de los procesadores actuales no solo puede realizar las operaciones aritméticas básicas con números enteros o fraccionarios. DI. Esto había motivado la aparición de procesadores específicos para estas operaciones. los denominados coprocesadores matemáticos. en la que existe toda una sección dedicada a estas operaciones <math. ES. IP y F (este último para el registro de estado). Ni los registros de segmento ni los de puntero se pueden dividir en mitades (como los de uso general). §3.8).1). logaritmos y exponenciación. tangente. XOR. OR. añadiendo al comando R el nombre del registro. CS.h>. A partir de la introducción del Intel 80486 el coprocesador matemático fue incluido en el procesador. como el de base BP. siempre contienen direcciones de memoria (los otros pueden contener direcciones o datos). como cálculo del seno. coseno. BX. arcotangente. CX. Pulsando INTRO se vuelve al modo normal. el comando R IP muestra el contenido del contador de programa. Nota: En C++ los operadores aritméticos están incluidos en el lenguaje ( E4. la unidad Aritmético-Lógica ALU ("Arithmetic and Logic Unit"). ya hemos indicado ( 3) que los primeros procesadores solo eran capaces de realizar operaciones de aritmética básica con números enteros. Por su parte. Esto requiere una serie de operaciones. frente a los 4 ciclos de las instrucciones más rápidas. §3. Para la ejecución de una instrucción de lenguaje máquina se requieren una serie de operaciones elementales y de sucesos físicos en los diversos componentes del procesador. ajustar la velocidad. Como todo lo demás que ocurre en el ordenador estas operaciones se ejecutan según el compás de las señales de reloj que llegan desde la placa-base. en las máquinas de von Neumann [4].4 El bus interno Los diversos elementos de un microprocesador están interconectadas de forma muy compleja (el propio micro lo és). requiere también la operación de una serie de válvulas (aquí se llaman puertas lógicas) en un orden determinado. etc. a un módulo de la CU denominado decodificador de instrucciones.2). Al referirse al microcódigo. alterando así el microcódigo. Las únicas formas de acelerarlo es aumentar la frecuencia del reloj y el procesamiento paralelo y simultaneo de varias instrucciones. orientar el timón de profundidad. etc. para el que se necesitan varios ciclos de reloj. Esta última capacidad requiere una arquitectura especial (súper escalar) de los procesadores. la operación MOV AX. Se encarga de coordinar que todos los elementos funcionen de forma armónica. también corregir ocasionalmente algunos errores ("Bugs").§3. las versiones del microcódigo se denominan escalamientos. permiten modificar el contenido de la CROM. BX (mover el contenido del registro BX a AX). En ocasiones se trata de un microcódigo complicado. El conjunto de operaciones necesarias para que se complete cada instrucción de lenguaje-máquina se conoce como microcódigo. Nota: Algunos microprocesadores modernos (por ejemplo los Pentium de Intel). que marca el rendimiento del procesador. y suele comenzar con las maniobras necesarias para traer ("Fetch") la próxima instrucción (señalada por el contador de programa IP). Es un programa de actuación cableado en silicio (firmware) o en una memoria interna especial del procesador CROM ("Control Read Only Memory). En la terminología utilizada por los fabricantes de procesadores.3 Unidad de Control La Unidad de Control CU ("Control Unit") funciona como árbitro del funcionamiento del procesador. Aunque el microcódigo se mejora constantemente. Por ejemplo. el número de escalamiento es equivalente al número de versión en el caso del software. cerrar otras. a la que ya nos hemos referido ( 3). responsable de que todas estas operaciones se ejecuten correctamente. estas actualizaciones se realizan a través de la secuencia POST del BIOS ( 4. de forma que la imagen de la figura 1 es solo una simplificación conceptual. el microcódigo de las instrucciones más complejas necesitaba nada menos que 18 ciclos de reloj (CLK) para su ejecución. es en realidad el poder ejecutivo de la UCP (siguiendo con nuestro símil. en el 8080 (un antepasado del 8088 montado en los primeros PC's). Esto no solo permite actualizarlo. Podríamos poner un ejemplo: El procesador es un submarino en inmersión y el comandante da la orden de emerger. el "Poder legislativo" sería el programa grabado en memoria). . los tripulantes deben abrir unas válvulas. su simplificación tiene un límite. En el procesador. La Unidad de Control. no trata sobre programación en assembler (que además no es mi especialidad). para los que se inician en el ensamblador del PC.jegerlehner. .edu En mi opinión. cuya anchura que es dos a cuatro veces la del bus externo ( H2) de los PC's.En realidad existen varios buses principales. pero todos los miembros de la saga Intel x86 (incluídos los actuales Pentium) comparten un núcleo que proviene de su ancestro el 8086.cz Un completo diccionario sobre el juego de instrucciones la familia Intel 80x86 hasta el 80486. En la figura adjunta se muestra un esquema de la arquitectura interna de un procesador de la familia Pentium de Intel ( Arq. esta web mantenida por Randall Hyde. Contienen algunos ejemplos de programas en ensamblador. Desde luego este tutorial "Tecnología del PC". Hace honor a su título: "The Place on the Net to Learn Assembly Language Programming". pero ráramente se emplea como tal.cs. Cada modelo de procesador tiene su propio lenguaje-máquina y necesita su propio ensamblador. • IBM Personal Computer Assembly wiretap.edu Estas páginas de un curso sobre arquitectura de ordenadores y ensamblador del Trinity College de Hartford en Connecticut. • WEB Ster webster.ucr.ch Esta página contiene un excelente resumen de las instrucciones ensamblador de la serie Intel 80x86 descargable en formato .com Tutorial de Joshua Auerbach. incluyo algunas referencias donde puede encontrarse información acerca de la programación en ensamblador y donde conseguir macroensambladores. Pentium) en la que puede apreciarse su complejidad. §4 El lenguaje del procesador Hemos señalado que el lenguaje que entiende el procesador es lenguaje-máquina. Empieza por aquí y seguramente no tendrás que seguir buscando por ahí. y muchos más secundarios. pero como algunos me han escrito solicitando información al respecto.area. es el "Sitio" por antonomasia sobre este asunto de la programación en ensamblador. ensamblador o macro-ensamblador. • Winston (Leos Literak) www. se utiliza un lenguaje de un poco más alto nivel.pdf • Trinity College shakti.penguin. de la Universidad de Yale.trincoll. • Roger Jegerlehner www. Por ejemplo. [3] El procesador se apoya constantemente en la RAM externa para su funcionamiento. o más caracteres por instrucción.10). Por ejemplo. pero escribir directamente en este lenguaje nativo sería inhumano. son importantes. La última vez que nos vimos le dije entre risas que era un delineante RISC. Tengo un viejo amigo que. aunque una de las razones de la invención de su antecesor el C. este lenguaje dispone de algunas otras comodidades. emigrado a USA. pero cuando conoció el ENIAC. Aunque AutoCad tiene centenares de instrucciones. y en alguna ocasión he tenido que pedirle ayuda. en el 8088. Una de las mentes más brillantes de su tiempo. en realidad hay una diferencia importante entre ambos. así como sus trabajos teóricos para la construcción de la primera bomba atómica.programmersheaven. Seguramente muchos sabéis que AutoCad® es un programa de diseño gráfico asistido por ordenador muy utilizado en arquitectura e ingeniería. Posteriormente el compilador traduce nuestros nemónicos al verdadero lenguaje-máquina y el conjunto es ensamblado en un conjunto ejecutable. como permitir escribir comentarios en el fuente. que con los años ha llegado a unos niveles de refinamiento y potencia realmente notables (creo que llegar a dominarlo supone casi una diplomatura). PUSH DX y PUSH BX respectivamente (como puede ver mucho más fáciles de recordar). Sus aportaciones matemáticas. según el tipo de instrucción y procesador utilizado. El lenguaje C++ permite incluir directamente en sus fuentes sentencias ensamblador ( E4. cuya traducción ASCII es uno. DX y BX en la pila. llegaría a ser una leyenda en Princeton. a pesar de lo cual es increíblemente rápido.com www. y a veces hace verdaderos malabarismos para conseguir lo que quiere en base a tan pocas instrucciones. ha desarrollado su propia técnica. quedó fascinado por las posibilidades y potencial de los ordenadores. en el campo de la teoría de Juegos. [4] John von Neumann matemático Húngaro (Budapest 1903).programmersheaven. dos. 52h y 53h son respectivamente órdenes de salvar el contenido de los registros CX. de cuyos aspectos teóricos llegó a ser una autoridad. las instrucciones anteriores pueden escribirse como: PUSH CX.• En el Infierno de los programadores pueden consultarse dos páginas en las que hay abundante información sobre ensambladores y desensambladores: www. las instrucciones 51h. en el que sienta las bases teóricas para el diseño de un ordenador . mi amigo utiliza solo un conjunto pequeñísimo de ellas. Aunque es de muy bajo nivel (muy cercano al lenguaje-máquina). fue precisamente no tener que escribir en el referido lenguaje ensamblador.com Inicio. donde falleció en 1957. [2] A este respecto se me ocurre una anécdota que viene al caso. Su trabajo más conocido es un famoso informe de 1945: "First draft of a report on EDVAC". El verdadero lenguaje máquina es un conjunto de instrucciones en forma de unos y ceros. [1] Aunque los informáticos suelen utilizan el vocablo ensamblador como sinónimo de lenguajemáquina. en razón de su profesión lo utiliza en su trabajo diario. este lenguaje ha sustituido cada instrucción-máquina por un nemónico o macroinstrucción que la hace más fácil de recordar por el programador. En realidad se utiliza un lenguaje denominado ensamblador o macro-ensamblador. CL. [7] CEO "Chief Executive Officer".4a). . por lo que [6] Cuando a partir de la introducción del 80386. y sus cuartas partes como AH. Este trabajo le ha valido ser considerado por algunos (quizás un poco exageradamente) como el padre de la moderna informática. [5] La forma de almacenamiento interno utilizada es de complemento a dos ( el bit más significativo de los números negativos es 1. ECX y EDX. CX. los registros generales pasaron a denominarse EAX. BX. los registros pasaron a ser de 32 bits. Por supuesto todos los ordenadores modernos lo son. E. las mitades de estos registros podían seguir direccionándose como AX. parece que le corresponde el honor de ser el primero en concebir un ordenador cuyo programa está albergado en la memoria de la máquina (como otro dato más). AL. En cualquier caso. Como Intel garantizó la compatibilidad hacia atrás con el código ensamblador antiguo. EBX.("Electronic Discrete Variable Automatic Computer"). justamente por eso. "de von Newmann". DX.2. Consejero delegado en español. DH y DL. Una máquina de este tipo se denomina. BL. CH. BH.