1Necesidades de los usuarios de herramientas de traducción asistida por ordenador: la perspectiva humana en la traducción hombre-máquina La falta de especialistas en traducción plantea un problema para los mercados de traducción en crecimiento en todo el mundo. Una de las soluciones propuestas por la falta de recursos humanos es el automatizado de herramientas de traducción. En las últimas décadas, las organizaciones han tenido la oportunidad de aumentar el uso de los recursos tecnológicos. Sin embargo, no hay consenso sobre la forma en que los recursos tecnológicos deben integrarse en los proveedores de servicios de traducción (PST). El enfoque adoptado por este trabajo es examinar la traducción interactiva donde los humanos y las máquinas cooperan. ¿Cuál es el papel del ser humano? Con base en el marco conceptual de los sistemas de información y ciencias de la organización, se recomienda dar a los usuarios, que son principalmente traductores para los que las herramientas de traducción interactiva se diseñan, un papel fundamental en el pensamiento que rodea a la implementación de una herramienta tecnológica. Introducción La globalización y el incremento de operaciones de comercio mundial ha dado lugar a un crecimiento impresionante del mercado mundial de los servicios de traducción. Según la EUATC (Asociaciones de Empresas de Traducción de la Unión Europea), se espera que la industria de la traducción crezca alrededor de un cinco por ciento al año en un futuro previsible (Hager, 2008). Con sus dos idiomas oficiales, Canadá es un buen ejemplo de un mercado importante de la traducción, donde los traductores profesionales altamente cualificados sirven no sólo el mercado interno, sino tambien a clientes internacionales. Los recursos humanos especializados en Canadá son demasiado escasos para enfrentarse a este enorme aumento de las necesidades de traducción global. El Comité Sectorial de Industria Traducción canadiense había anunciado ya en 1999 que la industria necesitaría un promedio de 1.000 nuevos profesionales cada año para sostener el crecimiento de la demanda (Comité Sectorial de Industria de Traducción canadiense, 1999); Sin embargo, las universidades canadienses en el año 2005 aún seguían produciendo sólo alrededor de 300 graduados por año. Aparentemente, esta escasez de recursos especializados no sólo es un problema en Canadá. Después de su reunión anual internacional sobre servicios lingüísticos, documentación y 2 publicaciones, que se celebró en París en junio de 2010, las Naciones Unidas dio a conocer una declaración que dice lo siguiente: "Sin una nueva generación de lingüistas y profesionales capacitados con conocimientos de idiomas, la organizaciones internacionales no podrán realizar sus tareas vitales ". Debido a la utilización de las nuevas tecnologías, los procesos se han acelerado en todos los campos de la actividad humana. La traducción no es una excepción. Durante más de medio siglo, los traductores ocupados han estado confiando en tecnologías de la información para ajustarse a los plazos y entregar servicios de traducción de gran volumen. Sin embargo, cuando Beesley (1986: 251) escribe: "Los defensores sostienen que los ordenadores no sólo son valiosos en la traducción, sino que se están convirtiendo en herramientas absolutamente necesarias para ayudar a manejar la explosión de la información mundial", se refiere principalmente a un hardware común y software básico de procesador de textos . En nuestro siglo XXI, los proveedores de traducción pueden sacar ventaja de la traducción automática (TA) o de traducción (CAT) con ayuda del ordanador, con el fin de aumentar su productividad. En pocas palabras, las organizaciones han aumentado sus necesidades de servicios de traducción, con el fin de estar presente en los mercados de todo el mundo, pero carecen de los recursos humanos capacitados para apoyar esas necesidades. Existen herramientas que automatizan parcialmente el proceso de traducción, pero los efectos de esas herramientas en la productividad de los distintos traductores 'aún no están claros. Además, la influencia de esas herramientas en el rendimiento global de las organizaciones para las que la traducción es una actividad principal - los proveedores de servicios de traducción o TSP - aún no se ha explorado concienzudamente. De las estaciones de trabajo individuales a Sistemas de Información lingüística integrados (LIS) El proceso de automatización de la traducción conduce a la interacción hombre-máquina que puede caracterizarse por un grado variable de implicación humana, desde la traducción enteramente humana - lo que podemos llamar traducción artesana - a la traducción automática por completo - sin ningún esfuerzo humano en absoluto. La traducción producida en su totalidad por las máquinas todavía no es lo suficientemente buena para su uso generalizado entre el público y por lo general está diseñada 3 para consumo interno. La calidad real de la traducción totalmente automatizada, no es aceptable para un TP. Un traductor profesional (TP) necesita es una gama adecuada de herramientas - incluidas las herramientas de traducción automática, herramientas de traducción asistida por ordenador y herramientas de referencia lingüísticas - que los traductores humanos puedan utilizar para producir entregas rápidas de traducciones de alta calidad. Para ello, las organizaciones necesitan más que una simple estación de trabajo de traductor individual computarizado. Necesitan un sistema que les ayude a compartir y difundir información, de forma que informe de manera útil sobre los procesos de producción de la traducción. Los traductores profesionales necesitan lo que nosotros proponemos llamar un Sistema de Información lingüística. ¿Qué es un Sistema de Información lingüística integrado (LIS)? Ein-Dor y Segev (1993: 167) lo define como cualquier sistema informático con una interfaz de usuario o de operador, siempre y cuando el equipo no está incrustado físicamente. Por ejemplo, los traductores que trabajan en estaciones de trabajo individuales tienen ahora la rutina de acceso a glosarios bilingües digitalizadas que se colocan en la intranet de su organización. En tal caso, la organización se basa en una ya en un sistema de información existente - la intranet - para compartir información a través de lo Taravella (2011) llama la tecnología pasiva del lenguaje. Otra aplicación de un sistema de información sería la asignación de los trabajos de traducción por un sistema de flujo de trabajo centralizado que muestra a cada traductor individual las tareas que él o ella tienen que realizar. Lo que hace la investigación en sistemas de información distinta de otras disciplinas de la computación, es decir, la informática y la ingeniería de software, es su enfoque en temas humanos. Según Glass, Ramesh y Vessey (2004), la investigación sobre los sistemas de información examina temas relacionados, en gran medida, con los conceptos de organización, sobre todo el uso, la explotación y transferencia de la tecnología, aunque también explora temas / sistemas de software, principalmente a un nivel de análisis de comportamiento. Esto convierte los sistemas de información en un campo adecuado para nuestra investigación sobre el impacto de la utilización de los sistemas de información lingüística en los traductores humanos. De hecho, y teniendo en cuenta que las dimensiones del usuario individual tales como la percepción, la resistencia al cambio, la inercia y el análisis de necesidades son algunos de 4 los principales desafíos de promoción del cambio organizacional a través del uso de tecnología de la información. La tecnología de la información facilita la coordinación interna entre los individuos (Gurbaxani et Whang, 1991), que es precisamente lo que los profesionales de la lengua necesitan para la colaboración en la producción de una traducción. Los sistemas de gestión de flujo de trabajo (WMS) son otro tipo de sistemas de información útiles para los profesionales de la lengua. Estos sistemas están diseñados para estructurar el trabajo a realizar, dividirlo en diferentes tareas, organizarlas de manera lógica y el seguimiento de su ejecución. Los usuarios de un WMS saben qué tareas se han ejecutado y reciben alertas sobre las que aún no se ha completado. Los WMS ofrecen una estructura formal para los profesionales de la lengua que se enfrentan con una carga de trabajo cada vez mayor. Sin embargo, puede darse el caso de que no todos los traductores están listos para ese tipo de estructura. Desde un WMS se hace menos flexible para los usuarios la elección de tareas a ejecutar y el momento en que pueden hacerlo, los traductores que no están cómodos con la tecnología puede sentir que su autonomía y, en consecuencia, su sentido de propiedad se han reducido. Las herramientas de traducción interactivas deberán estar diseñadas para facilitar el trabajo de los profesionales de la lengua. Para lograr esto, a la hora de seleccionar las herramientas, cada organización deberá tener en cuenta el factor humano y buscar la integración de todas las funciones, la adopción de un enfoque de sistemas de información. El objetivo ya no es la selección de una herramienta, o el montaje de los ya existentes, sino el diseño y la construcción de un Sistema de Información Lingüístico. La traducción automática ya no es una disyuntiva En términos prácticos, la adopción de un sistema de información lingüística libera las empresas de traducción de tener que decidir si deben optar o no por la traducción automática. Con un enfoque de una sola herramienta, el TP se enfrentan a la cuestión de cuál es la herramienta que necesitan adquirir, y si la traducción automática es una buena solución. Pero la gran variedad de herramientas que se ofrecen en el mercado, las infinitas posibilidades de la combinación de máquina y la traducción humana, y el hecho de que la diferencia entre la traducción automática, traducción asistida por ordenador y tecnología del lenguaje no está claro hacen que sea imposible seleccionar la herramienta "perfecta". Con un enfoque sobre el proceso, es decir, un enfoque de sistemas de información, la atención se centra en una prioridad práctica diferente: entregar proyectos de traducción solicitados a tiempo, junto con el cumplimiento de todos los requisitos de calidad. Con esta 5 prioridad en mente, una organización puede seleccionar e integrar una serie de diferentes herramientas, con el fin de construir el sistema de información "perfecta" para sus necesidades. Traducción automática vs. traducción interactiva Al explorar la literatura sobre las herramientas de traducción, la diferencia entre traducción automática, traducción asistida por ordenador y otras formas de traducción interactiva (combinado de trabajo de máquina y trabajo humano) no es clara y evidente en el uso terminológico. Por ejemplo, de acuerdo con Bouillon (1993) y Quah (2006), la traducción de la máquina-humana asistida (Hamt) es un tipo de traducción automática (AT) que no puede tener lugar sin la intervención humana. En francés, su equivalente, traduction automatique assistée par l'homme (TAAH), también se llama traduction assistée par ordinateur (TAO), 'traducción asistida por ordenador' o automatique traduction assistée (TAA) 'traducción automática asistida'. Quah (2006: 6) señala que La traducción asistida por ordenador (CAT) es a menudo el término usado en los Estudios de Traducción (TS) y la industria de la localización [...], mientras que la comunidad de software que desarrolla este tipo de herramientas prefiere llamarlo 'la traducción automatizada (MAT) ». Es especialmente difícil distinguir entre los sistemas automáticos de traducción con ayuda human(HAMT) y los sistemas de traducción humana que son asistidas por ordenador (traducción humana asistida por ordenador (MAHT). Por esta razón, ambos sistemas se refieren a menudo como (CAT) herramientas de traducción asistida por ordenador (Hutchinson y Somers, 1992; Quah 2006). Por último, como Bowker (2002: 4) nos recuerda, que HAMT se refiere a menudo simplemente a la traducción automática (TA). Los límites muestran pues una imagen borrosa entre diferentes tipos de sistemas debido a la larga historia de los términos y la evolución de los sistemas a los que se refieren. Los investigadores tampoco no están de acuerdo sobre la definición de la traducción automática con respecto a la participación de los seres humanos. Sin embargo, dado que ningún otro término se ha adoptado, se sigue utilizando para referirse a los sistemas que están totalmente automatizados, y a los que requieren de participación humana (Quah 2006: 9). 6 Para evitar el mal uso de términos, nos atendremos a la traducción automatizada interactiva. Este término se refiere a la traducción realizada con un cierto uso de la traducción automática, pero considerado como el resultado de la colaboración entre la máquina y los traductores humanos. Si la traducción es asistida por ordenador o por los humanos no es el objetivo aquí. Los usuarios de LIS integrarán rutinariamente herramientas de traducción automática, traducción asistida por ordenador, herramientas y tecnologías pasivas del lenguaje (por ejemplo, bases de datos y glosarios en línea compartidos), con su propio conocimiento humano, con el fin de producir una traducción. La atención se centra en los procesos que hacen posible que los usuarios de LIS interactuen con herramientas automatizadas, y sobre las consecuencias de la automatización y la interacción en los aspectos humanos de la utilización de un LIS. Importancia del aspecto humano La primera pregunta sobre automatización es si, y de qué manera, el trabajo humano sigue siendo importante. En otras palabras, ¿cuánto de automática tiene la traducción automatizada interactiva y cuánto de interactiva? La principal distinción entre MT y CAT se encuentra en cuál es el principal responsable de la tarea actual de la traducción. En MT, el ordenador traduce el texto, aunque el resultado de la máquina más tarde pueda ser editado por un traductor humano. En CAT, los traductores humanos son los responsables de hacer la traducción, pero pueden hacer uso de una variedad de herramientas informáticas para ayudar a completar esta tarea y aumentar su productividad. Por lo tanto, mientras que los sistemas MT tratan de sustituir a los traductores, las herramientas CAT apoyan a los traductores, ayudándoles a trabajar más eficientemente. (Bowker 2002: 4) Frente a las posibilidades teóricamente infinitos de la organización de la ejecución de tareas mediante la combinación de la actividad humana y el trabajo de la máquina, las organizaciones deben decidir qué combinación de hecho va a mantener el rendimiento y servir a profesionales de la lengua, En otras palabras, tienen que encontrar un equilibrio entre personas, ambientes de trabajo y procesos (Beesley 1986; Williams 1989). La decisión sobre cómo distribuir el trabajo debe basarse en una descripción de los procesos de producción de traducción dentro de la organización, junto con la implementación de sistemas de información lingüítica de tamaño completo (LIS). Esos sistemas pueden ser vistos como una nueva forma de sistemas de información especializados, que compartirían atributos con todos los demás sistemas de información. También tendrían características que abordan la especificidad del trabajo y los procesos de traducción y hacen que el LIS sea diferente de otros sistemas 7 especializados de información, sistemas de información gerencial (MIS) o sistemas de gestión del conocimiento (KMS), por ejemplo. A continuación se presentan algunos aportes de la investigación sobre los sistemas de información que creemos que puede informar a nuestra investigación sobre la LIS. En primer lugar, el uso de tecnología de la información ofrece el potencial para mejorar el desarrollo de tareas de una organización (Davis 1989). Según Daft y Lengel (1986: 556), la tecnología de la información ayuda a las organizaciones a procesar información, lo que reduce tanto la incertidumbre y la equivocidad: "Incertidumbre significar la ausencia de información. Equivocidad significa ambigüedad, la existencia de múltiples y contradictorias interpretaciones acerca de una situación de la organización. "Cuando un traductor carece de información para responder a una pregunta específica, por ejemplo, cómo fue traducido un segmento o el término en un proyecto anterior para la mismo cliente, hay incertidumbre. Las Memorias de traducción y las bases de datos terminológicas pueden reducir esta incertidumbre mediante la recuperación de algunas respuestas precisas a la pregunta. Cuando un traductor ni siquiera sabe cómo formular la pregunta con el fin de recuperar información útil, hay Equivocidad. Si una frase que debe traducirse no esta muy clara para el traductor, ni semánticamente, ni sintácticamente ni terminológicamente hablando, podría pasar cierto tiempo antes de que el traductor sea capaz de averiguar por dónde empezar la búsqueda de información. Un sistema de información lingüística, con un interfaz de búsqueda lo suficientemente flexible, podría reunir todas las fuentes de información pertinentes y ayudar al traductor a encontrar su camino a través de una jungla de información. En la práctica, por ejemplo, el pegado de la frase a traducir en la interfaz de búsqueda solicitará al sistema de información que muestre en la pantalla los resultados de varias bases de conocimiento: una con los equivalentes terminológicos, otra con frases de estructura similar contextualizadas, y otra con una versión electrónica de un cierto diccionario tradicional. En segundo lugar, un sistema de información lingüítico puede ser visto como un sistema experto. De acuerdo con la definición dada por Hunt y citado en Ein-Dor y Segev (1993: 190), un sistema experto "por lo general se compone de una base de conocimientos y un motor de inferencia." Textos paralelos, en los que un texto y su traducción es colocada al costado de una pantalla de dos columnas, son las bases de conocimiento. Herramientas de traducción, es decir las memorias de traducción, utilizan un motor de inferencia para recuperar y sugieren traducciones basado en los criterios de decisión que se construyen en el sistema o decididas por el usuario. En consecuencia, los LIS corresponden a la definición general de los sistemas expertos. Esto abre un camino de investigación para la 8 aplicación de los conocimientos existentes sobre los sistemas expertos a los sistemas de información lingüística. En tercer lugar, la investigación sobre los sistemas de información ha mostrado, desde muy temprano, que "la comprensión de la actividad empresarial es un requisito previo para el diseño e implementación de sistemas efectivos" (Gorry y Scott Morton-1971). Esto hace que sea necesario explorar sistemáticamente los procesos que subyacen a la producción de la traducción. Gorry y Scott- Morton (1971) también insisten en la importancia de tomar en cuenta la percepción de los usuarios que se enfrentan a una nueva tecnología. Para Davis (1989), que creó el TAM (modelo de aceptación de la tecnología), los dos factores de éxito más importantes en la adopción de tecnologías de la información se perciben como la utilidad y facilidad de uso. Sin embargo la útilidad y fáciliad de uso de un sistema pueden ser objetivos, pero es la utilidad y facilidad de uso que los usuarios perciben subjetivamente lo que forma la actitud de los usuarios y lo puede dar lugar a la adopción o el rechazo de un sistema de información: "Por lo tanto, incluso si una aplicación mejorase objetivamente el desempeño de sus funciones, si los usuarios no lo perciben como útil, es poco probable que lo utilizan. Por el contrario, las personas pueden sobrestimar las ganancias de rendimiento ofrecido por un sistema y adoptar sistemas disfuncionales "(Davis, 1989: 335). Los factores claves para el éxito en la implementación de un sistema de información han sido explorados por muchos investigadores. Armstrong y Sambamurthy (1999) señalan la importancia del papel de liderazgo de alto nivel y la infraestructura de TI, mientras que Jean-Jules y Villeneuve (2011) insisten en que los usuarios se apropien de la nueva tecnología, en la medida en que el uso que se convierte "en rutina." Por último, dado que la investigación sobre los sistemas de información tiene en cuenta los factores humanos que permitan un uso eficiente de la tecnología de la información, el enfoque de los sistemas de información se adapta perfectamente a explorar el camino para que los traductores se apropien de las herramientas de traducción interactivos automatizados. Como Banker y Kauffman (2004) nos recuerdan, el valor de la tecnología para una organización está fuertemente relacionada con cómo precisamente los procesos de negocio y las estructuras organizativas se definen, así como a las capacidades cognitivas y la capacidad para procesar información demostrado por los usuarios de tecnología. La siguiente declaración de esos autores nos anima aún más a explorar el tema de la traducción automatizada interactivo a través del objetivo de la investigación de sistemas de información: "[Hay] una 9 creciente apertura de la investigación académica a la teorización interdisciplinaria relacionada con la interacción humano-computadora, y [a] verdadera necesidad de explicaciones más ricos para que funcione bien en ajustes aplicados complejos "(Banker y Kauffman. Breve historia de la traducción automática Esta sección ofrece un resumen de la historia y de los acontecimientos más significativos de la traducción automática. La impresión de que la traducción automática es algo novedoso no es del todo correcta ya que en 1933, un francés de origen armenio Georges Artsrouni y un ruso Petr Troyanskii patentaron sendas máquinas de traducción. La más significativa fue la de Petr Smirnov-´Troyanskii quien propuso no sólo un método para un diccionario bilingüe automático sino también un esquema para codificar funciones gramaticales interlingüísticas, basado en el Esperanto y un esbozo de como debe funcionar el análisis. Dividió la traducción en tres etapas. En el primer paso un editor que solo conoce el idioma de origen (SL) que analiza las palabras en su forma básica y las funciones sintácticas. En el paso siguiente, las secuencias de formas y funciones de base de la máquina se convierten en secuencias equivalentes en el idioma destino (TL) Por último, otro editor convierte el resultado en formas normales de su propia lengua. Sin embargo, la idea de Troyanskii no se conoció hasta finales de los años 50. Poco después, Konrad Zuse, ingeniero alemán, completó la primera calculadora programable de uso general en 1941 y las primeras calculadoras electrónicas salieron al mercado. Comenzó asimismo la investigación del uso de ordenadores para la traducción de las lenguas naturales. En pocos años la investigación sobre MT se había extendido a muchas universidades Americanas. En 1954, la colaboración entre IBM y la Universidad de Georgetown hizo posible la primera demostración pública de un sistema de TA. Esta primera década estaba llena de grandes expectativas y optimismo que se fueron desvaneciendo en la década siguiente debido al encuentro de barreras semánticas infranqueables que hicieron el progreso mucho más lento de lo esperado. Asimismo la calidad resultante fue un tanto decepcionante. El informe ALPAC en 1966 mostró que las expectativas no se habían alcanzado lo que provocó la reducción de la financiación en los EEUU, aunque continuó, sin embargo en Canadá, Francia y Alemania. A finales de la década de los 1980, debido al aumento de capacidad de cálculo de los ordenadores, se abarató el costo de la investigación y se cambión el marco de la investigación. Producto de esta época es el sistema METAL, un traductor alemán –inglés. Uno de los proyectos más conocidos de este período fue el proyecto Eurotra de la Unión Europea. Era un sistema de transferencia multilingüe modular, avanzado y de 10 procesamiento por lotes para la traducción de las lenguas de la CE. En 1976, en Canadá, la Universidad de Montreal desarrolló el sistema METEO, para la traducción de los informes meteorológicos y textos de campos específicos cuya diversidad planteaba problemas en el manejo de la ambigüedad del sentido de las palabras y su traducción. Hasta finales de la década del 1980, la investigación se basó en las reglas esencialmente lingüísticas como las normas para el análisis sintáctico, reglas léxicas, y las reglas para la transferencia léxica. Desde principios de 1990 la investigación se diversificó en muchas direcciones. La dirección principal de esta época se basó en grandes corpora de textos, la alineación de textos bilingües, el uso de métodos estadísticos y el uso de corpora paralelos basados en los ejemplos de traducción. Desde los años 60 se sucedieron tres generaciones de sistemas de traducción automática representado el primero por SYSTRAN caracterizado por falta de información lingüística sobre el texto fuente. El esfuerzo por encontrar formas de captura de esta información llevó a los sistemas de traducción indirectos basados en sistemas interlingüísticos y de transferencia como EUROTRA, SUSY, METAL y ARIADNE, hasta los años 80. A partir de esa época hasta el final de la década, otros sistemas basados en el conocimiento lingüístico combinado con las reglas gramaticales, tales como DTL y Rosetta fueron los más utilizados. A partir de los años 90 surgieron los sistemas híbridos. El diseño de los sistemas de traducción se pueden dividir en dos grupos principales Sistemas bilingües diseñados para dos lenguas en particular y Sistemas multilingües diseñados para más de un par de idiomas. Además los sistemas bilingües pueden ser unidireccionales, diseñados para funcionar en una sola dirección tal como del ruso al alemán o diseñado para funcionar en ambas direcciones por ejemplo de ruso al alemán y viceversa. Ha habido dos tipos básicos de traducciones automáticas: las directas y las indirectas. El primer tipo basado en reglas cuyos enfoques pueden ser de información interlingüística o de transferencia y el segundo basado en corpus que, a su vez sigue métodos estadísticos o de corpora de ejemplos de traducciones. Sistemas de traducción directa El tipo históricamente más antiguo del diseño del sistema de TA es el método directo. Este sistema está diseñado para un determinado par de lenguas por ejemplo el alemán como idioma de origen y el inglés como lengua de destino. Este 11 método se basa en grandes diccionarios y la traducción de palabra por palabra con algunos ajustes gramaticales simples. Estos sistemas consisten principalmente en grandes diccionarios bilingües, donde las entradas de la lengua de origen presentan uno o más equivalentes en la lengua destino y algunas reglas para producir el orden correcto. Todos los sistemas de traducción automática de primera generación se basaron en este método y los resultados del mismo eran muy primitivos. El primer paso hacia adelante fue el análisis morfológico del texto de origen donde tenía lugar la identificación de terminaciones de las palabras y los componentes de las palabras. Los resultados del análisis morfológico se utilizarían para la búsqueda de entradas del diccionario bilingüe. No se hacía el análisis de la estructura sintáctica ni de las relaciones semánticas lo que significaba que la identificación léxica dependería del análisis morfológico y conduciría directamente al diccionario bilingüe para búsqueda de las equivalencias correspondientes en la lengua destino. A continuación el programa hacía una búsqueda de reglas de ordenamiento de la frase en el idioma destino. La traducción basada en reglas El proceso de traducción basado en normas requiere el análisis y la representación del significado del texto original y la generación del text TL equivalente. Las características típicas de estos sistemas son el procesamiento por lotes con post-edición y sin componentes interactivos esencialmente orientados a la sintaxis. A este planteamiento siguieron dos grandes enfoques, el interlingüístico de dos etapas una que conduce a la representación independiente del idioma y de esta representación interlingual comienza la generación de los textos en la lengua destino u objeto. El enfoque de transferencia se hacía en tres etapas, el primero el análisis de representaciones en abstrato, el segundo paso sería el traslado de estas representaciones y finalmente la generación o síntesis de textos. Los sistemas de modelo interlingüístico implican la transformación de la lengua origen a un lenguaje de representación independiente interlingüístico. El idioma de destino se genera después de la interlingua. Las principales característica de este sistema son su robustez y la economía en los entornos multilingüísticos. Los problemas del sistema son la complejidad cada vez mayor del sistema. Este sistema requiere un análisis en profundidad para la representación abstracta independiente del lenguaje de origen. 12 Sistemas de transferencia La tercera estrategia o sistemas de transferencia operan en tres etapas que involucra representaciones subyacentes de los dos idiomas; el de origen y el de destino. El análisis es la primera etapa, convierte el texto de origen en representaciones abstractas. Este paso implica el analizador y la gramática de la lengua de origen. La segunda etapa es de transferencia. En esta etapa las representaciones abstractas de la lengua origen se convierten en representaciones de la lengua objeto equivalentes. La tercera y última etapa, llamada de síntesis o de generación. Esta etapa genera el texto final. El enfoque de transferencia implica una comparación entre dos lenguas. La fase de transferencia compara unidades léxicas y la estructura sintáctica exactamente a través de la brecha del idioma y utiliza reglas de asignación para convertir la representación de la lengua fuente a la de destino. Estas reglas y cualquier semántica adicional u otra información se almacenan en los diccionarios o bases de conocimiento. Ambos métodos el directo y el indirecto se basan en la especificación de reglas para la morfología, la sintaxis, la selección léxica, el análisis semántico y la generación de lenguaje. Los sistema de traducción directos se basan en la traducción de palabra por palabra o frase por frase y esto no soluciona los problemas de ambigüedad de la traducción automática. El método interlingua se base en un análisis independiente de la lengua fuente. La ventaja del sistema interlingua es que se pueden añadir nuevos idiomas a un coste relativamente bajo creando sólo las reglas que se asignan a partir de la nueva lengua. Por el contrario, el enfoque de transferencia requiere la construcción de reglas de asignación de la nueva lengua hacia todos y cada uno de las otras lenguas. Pera mejorar la calidad se necesita la adición de información semántica lingüística extra, tarea compleja que consume mucho tiempo. Los sistemas basados en la transferencia son menos ambiciosos que los interlingüísticos porque aceptan la necesidad de reglas de correspondencia entra las representaciones más abstractas del texto de la lengua fuente y el texto de la lengua destino En la práctica los sistemas basados en la transferencia se eligen porque son más simples y los sistemas interlingüísticos se utilizan debido a que requieren menos trabajo añadir nuevas lenguas. 13 Métodos basados en corpus Desde 1989 la investigación se ha vuelto hacia el corpus basándose primordialmente en los aspectos semánticos y bajo la premisa de que los textos tienen el mismo significado si son semánticamente equivalentes. El corpus podrá ser monolingual o multilingual. En el segundo caso los corpora que se han formateado y comparado se denominan corpora alineados paralelos. Las traducciones de corpora permiten comenzar por una forma o grupo de formas con un significado determinado en una lengua y buscar el significado equivalente en la otra lengua. La extracción de unidades equivalentes permitirá a los diseñadores del sistema de traducción buscar unidades equivalentes en la otra lengua y así recuperar la traducción de unidades equivalentes, incluyendo palabras, frases, compuestos, colocaciones y frases Descubrir la ayuda proporcionada por el corpus para la producción de textos traducidos que muestran la naturalidad de la lengua destino. Crear nuevas bases de datos de traducción que permiten a los usuarios traducir correctamente en un idioma extranjero que sólo conocen muy someramente. Generar nuevas bases de datos terminológicas dado que una gran proporción del material terminológico de los nuevos textos no está ni estandarizado ni dentro de los bancos de términos. Los enfoques basados en corpus se distinguen de los métodos basados en la estadística y en los ejemplos Statistical Machine Translation La esencia del método es la alineación de oraciones, frases, grupos de palabras y palabras individuales en dos lenguas y el cálculo de probabilidades de que cualquier palabra en una oración de una lengua corresponde a dos, uno, cero palabras en la frase traducida en el otro idioma. La alineación se establece mediante una técnica ampliamente utilizada en el reconocimiento de voz. Las probabilidades son estimadas por digramas a juego (dos palabras consecutivas) en cada frase de la lengua fuente contra digramas en las frases de la lengua equivalente. Una característica de la traducción basada en la estadística es la disponibilidad de grandes corpora bilingües adecuados y con traducción fiable. Traducción basada en ejemplos (EBMT) Se basa en el principio que los datos son más duraderos que las teorías lingüísticas y en esencia la traducción se realiza 14 por analogía. El objetivo es descubrir ejemplos análogos, y ver cómo se han traducido con anterioridad. Los corpora como fuente de información. Dentro de la traducción automática la información del corpus es esencial por varios motivos para la construcción de sublenguajes o de dominios específicos para los que es necesario obtener un conocimiento detallado del vocabulario, las funciones gramaticales de los tipos de texto que se va a traducir. Las bases de textos lexicográficas y de conocimiento son también de importancia para los sistemas interlingüísticos con representaciones conceptuales. Las bases de datos bilingües son necesaria para la traducción basada en ejemplos. Sistemas híbridos La dificultad innata de los sistemas basados en la estadística para el procesamiento de frases largas, junto con los problemas del dominio lingüístico, los inconvenientes y costos de su formulación en la traducción basada en reglas llevó a los ingenieros lingüísticos a plantearse sistemas híbridos integrando teorías distintas y paradigmas tales como el uso de grandes programas de análisis simbólico, el conocimiento semántico integrado que es en parte simbólico y en parte basado en modelos estadísticos y por último la participación activa del usuario. En otros casos se combinan sistemas basados en reglas con sistemas de transferencia lingüística basados en ejemplos. Otro método consiste en hacer pasar un texto por distintos sistemas de traducción, cada uno utilizando distintas técnicas, uno basado en léxico, otro basado en el análisis de las reglas gramaticales y generación y un tercero basado en ejemplos o métodos estadísticos. En cada caso un sistema de evaluación interno evalúa el resultado final. La fortaleza de los sistemas híbridos reside en el hecho que distintos enfoque pueden complementarse entre si. No obstante es extremadamente difícil encontrar un equilibrio entre las diferentes arquitecturas. Lenguajes controlados, dominios específicos y sistemas específicos de usuario. Muchos sistemas bien asentados que fueron diseñados originalmente para uso general se han limitado a tareas más específicas. Las áreas más importantes en las que superar las deficiencias conocidas de los sistemas de traducción automática son: El control de los textos de entrada o input Restricción de los sistemas de dominio específico o sublenguajes Diseño de sistemas para usuarios específicos 15 El control del vocabulario y de las estructuras gramaticales de los textos destinados a la traducción reduce las dificultades de contrucción de los léxicos con cobertura suficiente y los problemas de ambigüedad y la selección de los equivalentes. El control del input es una característica del sistema XEROS SYSTRAM. El mejor ejemplo de diseño de sistemas para sublenguajes es el conocido METEO, que lleva traducción información meteorológica más de 15 años Memorias de traducción El grupo consultivo de expertos en estándares de ingeniería del lenguaje define la memorias de traducción como un archivo de texto multilingüe segmentado, alineado, analizado y clasificado que permite la recuperación de los segmentos de texto alineado en varias lenguas por medio de búsquedas variadas. La última generación de estas memorias incluye un motor de análisis lingüístico que divide los segmentos lingüísticos en grupos terminológicos inteligentes creando así glosarios específicos automáticamente. Estas memorias se utilizan normalmente en combinación con otras herramientas de traducción tales como procesadores de texto, sistemas de gestión terminológica, diccionarios multilingües, o incluso traducciones automáticas. El traductor suministra un texto en el idioma fuente a la base de datos de la memoria de traducción, el programa analiza el input e intenta buscar segmentos en la base de datos que se utilizarán para generar una traducción para ser revisada por el traductor quien, a su vez, podrá decidir y realizar cambios o aceptar las sugerencias del sistema, si se realiza alguna modificación, esta quedará archivada en la base de datos para la próxima traducción. Las memorias de traducción comparan y buscas las coincidencias entre el texto almacenado en la base de datos y el texto actualizado y revisado. La principal diferencia entre los sistemas de traducción automática y las memorias de traducción es que los primeros fueron diseñados para traducir sin intervención humana mientras que las memorias se diseñaron para ayudar a los traductores humanos. Ambas tecnologías utilizan bases de datos con diccionarios integrales y reglas gramaticales pero las memorias de traducción actualizan la base de datos con segmentos de texto creado por el elemento humano. Detrás de este procedimiento aparentemente simple se desarrolla una operación cognitiva compleja. Para el descifrado del significado del texto original, el traductor interpreta y analiza todas las características del texto, este proceso requiere un profundo conocimiento de la gramática, semántica, sintaxis, modismos y formas similares de la lengua de origen así como la cultura de sus hablantes. Para la codificación posterior en la lengua meta, el traductor deberá tener un conocimiento aún más profundo de dicha lengua. Las memorias de traducción ayudan a los traductores humanos en sus tareas, crean bases de datos, con la terminología traducida, glosarios de términos para su 16 posterior recuperación y permite acceso al material previamente traducido logrando que todo el proceso sea más eficiente y menos costoso al recuperar material ya traducido. De estas memorias el traductor puede recuperar coincidencias exactas o equivalencias aproximadas con información de la fecha de traducción, nombre del creador, identificación del proyecto, dominio, etc. El uso de una base de datos terminológica integrada proporciona a los traductores un potencial para realizar las equivalencias aproximadas de un término determinado o utilizar el sugerido por el sistema. Sin la ayuda de estas memorias el traductor no puede obtener las sugerencias de traducción para términos individuales. Memorias de traducción compartidas Las memorias de traducción compartidas permiten a dos o más traductores traducir los archivos del mismo proyecto al usar la misma memoria de traducción para recuperar los segmentos previamente traducidos. Las memorias pueden compartirse desde un archivo centralizado de memorias gestionado por uno de los proveedores del cliente. Cuando el proveedor 1 recibe un trabajo de traducción deberá descargar toda la memoria, realizar las labores de preprocesado necesarias y analizar el trabajo con la memoria que ha descargado. Cuando el proveedor 2 recibe un encargo de traducción, repite esta misma operación. Al finalizar los trabajos, es preciso incluir las unidades de memoria nuevas o cambiadas en la memoria principal. Esta tarea será responsabilidad exclusiva de uno de los proveedores en calidad de custodio de la memoria, o, si dispone de los recursos adecuados, del cliente. Razones para compartir las memorias de traducción Las razones por las que un cliente puede desear este sistema son: Reducir costes haciendo que ambos proveedores compitan entre sí en igualdad de condiciones respecto a la memoria. Permitir que dos proveedores especializados en áreas distintas (software, sitios web, marketing) compartan contenidos traducibles. Diversificar riesgos y evitar una dependencia total de un único proveedor. Tener el control de la base de datos de las memorias. Las razones por las que un proveedor puede preferir este sistema son: 17 Tener una ventaja comercial sobre otros proveedores. Como custodio de la memoria de traducción (TM), el proveedor utilizará su posición para conseguir más trabajos y relegar a otros proveedores a un papel subsidiario. Demostrar su superioridad técnica sobre otros proveedores. Ventajas del uso compartido de memorias Si se gestionan adecuadamente, las unidades de traducción (frases y expresiones) creadas y gestionadas por un proveedor pueden ser utilizadas por otro, con la consiguiente reducción de costes. Además, al centralizarse el recurso de memoria, desaparece la duplicación de gastos de mantenimiento de las memorias. Todo ello redunda en la reducción de los costes de uso de la memoria. Existe la percepción de que si se comparte la memoria en línea (o de cualquier otra forma) el contenido se pone a libre disposición de quien desee utilizarla, como en los procesos de authoring. Sin embargo, es preciso indicar que las herramientas de memoria de traducción como Trados están diseñadas para el uso diario por parte de traductores profesionales, el software no está ideado para facilitar esta utilización por parte del cliente. Problemas Para utilizar con éxito las memorias de forma compartida es preciso solventar una serie de problemas. Algunos son de fácil solución, pero otros constituyen un reto importante. Aunque la utilización compartida de memorias parece ser positiva desde el punto de vista del cliente por eliminar la dependencia de un solo proveedor, en la práctica esta dependencia no está relacionada con quién sea el custodio de la memoria en un momento dado. Hay razones mucho más poderosas para utilizar un único proveedor para un mismo tipo de contenidos. Cuando distintos proveedores traducen distintos tipos de contenido, entonces sí puede considerarse la utilización compartida de memorias, pero aun así hay varios problemas que habrá que tener en cuenta. En la mayoría de los casos, la práctica más aconsejable sería mantener separados los procedimientos del proveedor y distribuir periódicamente a ambos los archivos de memoria. Si se utilizan memorias compartidas, un proveedor (o, si dispone de recursos especializados, el cliente) deberá responsabilizarse de las memorias. Si esta tarea recae sobre uno de los proveedores, recomendamos que el segundo proveedor sea considerado como una subcontrata a efectos del proceso. 18 Bases de datos terminológicas Otras herramientas de gran utilidad para los traductores son las bases de datos terminológicas que incluyen campos en el registro de la base de datos para cada término y para definir cada concepto, proporcionando glosas apropiadas para cada concepto. La mayor parte de los sistemas de traducción incluyen una base de datos terminológica. Esta deberá ser robusta, bien estructurada y granular; capaz de grabar homónimos, sinónimos capaz de incorporar nuevos término y otra información al uso. Las bases de datos pueden ser orientadas a la palabra que reúne todos los significados de una palabra en un solo registro, de la misma forma que un diccionario tradicional. La mayoría de los programas de software de gestión de terminología off-the-shelf están orientados a la palabra. Las bases de datos orientadas al concepto conectan términos con el mismo significado en un mismo registro utilizando sinónimos. El uso de una base de datos terminológica integrada proporciona a los traductores un potencial para buscar las equivalencias aproximadas de un término determinado o utilizar el sugerido por la máquina Analisis de input Es muy difícil calcular el tiempo empleado en una traducción. Los sistema de Traducción tienen la capacidad de analizar un documento para buscar frases, segmentos repetidos o similares, proporcionar el número de palabras ignorando elementos no textuales tales como gráficos, etiquetas html, código de software, etc. Esta función también se puede utilizar para explorar documentos buscando similitudes y así calcular el tiempo empleado en la traducción. El proceso de análisis se desarrolla en seis etapas a saber: Análisis textual. El reconocimiento de la puntuación hace posible el reconocimiento del final de una frase y distinguir etiquetas o códigos o elementos especiales que no deben traducirse. El análisis sintático o linguistic parsing. Este análisis prepara un lista de palabras conocidas y otra de las desconocidas y un texto para la recuperación automática de vocabulario de un banco de términos. Este análisis normaliza la variación del orden de palabras de las frases y determina qué palabras pueden formar una oración. La segmentación cuya principal función es la selección de las unidades traducibles más útiles. Una correcta segmentación puede dar como resultado unidades de traducción naturales y de longitud adecuada. Permite además correspondencias de traducción entre la lengua fuente y la meta. El alineamiento significa definir las correspondencias de traducción entre los texto origen y destino o meta. El alineamiento se basa en la segmentación y proporciona información al propio proceso de segmentación que corrige 19 la segmentación inicial incrementando así la utilidad de las memorias de traducción. La extracción de términos es muy útil en la estimación del tiempo a emplear en la traducción lo que facilita la programación de tareas del traductor y junto con herramientas de estadísticas de texto proporcionan información sobre la cantidad de tiempo involucrado en la tarea de traducción de un proyecto. Estándares y productos La estandarización permite la utilización de datos lingüísticos en los distintos sistemas y plataformas sin ser bloquearlos por formatos propios. LISA (Localization Industry Standards Association) y OSCAR (Open Standards for Container/content Allowing Reuse) intentan desarrollar estándares abiertos que den apoyo a las industrias de traducción y localización. OSCAR desarrolla y mantiene normas técnicas relacionadas con las necesidades lingüísticas asociadas a las memorias de traducción, los gestores terminológicos, procesadores de textos para la traducción, recuento de palabras y gestores de contenido multilingüe. Los estándares OSCAR oficialmente aceptados y recomendados son el formato TMX (Translation Memory eXchange) es un estándar abierto XML, aunque no aceptado universalmente para el intercambio de datos de traducción sin pérdida de información durante el proceso lo que transforma las bases de datos terminológicas en más portátitles. TBX (TermBase eXchange format) es también un formato abierto XML para el intercambio de datos terminológicos que incluye información léxica detallada. Los archivos TBX se pueden importar y exportar a la mayoría de los sistemas de traducción compatibles que incluyan un base de datos terminológica. Tarea que facilita la fluidez de información entre una organización y sus proveedores de servicios. SRX (Segmentation Rules eXchange format) es un estándar XML que mejora el estándar TMX para que los datos de la memoria de traducción que se intercambia entre las aplicaciones se pueda utilizar de manera má eficaz. GMX (Global Information Management Metrics eXchage Metrics or GILT Metrics) es una familia de estándares para la métrica de productos de la traducción. Consta de tres partes GMX-V para la métrica del volumen; GMX-C para la métrica de la complejidad y GMX-Q para la métrica de calidad. La norma GILT tiene la tarea de cuantificar los requisitos de carga de trabajo y de calidad para cualquier tarea. 20 Xml:tm (XML based Text Memory) es un enfoque radicalmente nuevo a las memorias de traducción basado en el concepto de memoria de texto, que comprende la memoria autor y la traducción. Es uno de los primeros avances significativos en la tecnología de memoras de traducción desde su creación. OLIF (Open Lexicon Interchange Format) es otro estándar compatible XML para el intercambio de terminología y datos léxicos. XLIFF (XML Localization Interchange File Format). Este formato o estándar tiene como objetivo proporcionar un único formato de archivo de intercambio para intercambiar información de localización que puede entenderse con cualquier proveedor de localización. TransWS (Translation Web Services) especifica los requerimientos necesarios para la utilización de los servicios Web para la presentación y recuperación de archivos y mensajes relacionados con los proyectos de localización. Textos adecuados para el uso de Sistemas de traducción Aunque los sistemas de traducción automática pueden ser de gran ayuda al asegurar la coherencia, mejorar la eficiencia y reducir los costos, no son ideales para todos los documentos. En particular, los sistemas de traducción son menos eficaces para documentos cortos o los producidos con diferentes estilos de escritura y con varios contextos de terminología. Tampoco son recomendables para documentos que contengan las llamadas fuzzy matches (equivalencias aproximadas)en el texto origen, como puede ser la traducción de un menú de una aplicación informática. La cantidad de documentación a traducir es un factor importante para el uso de un sistema de traducción. Los sistemas de traducción automática son ideales cuando se trata de gran cantidad de documentación o documentos multiples relacionados y documentos con vacabulario especializado. La reutilización del texto es problemente el criterio más importante para el uso de un sistema de traducción ya que permite la actualización de la traducción y su revisión. Estas actualizaciones de traducción se vuelven más fáciles dado que el traductor no tiene que buscar en todo el documento para realizar los cambios. En muchos casos cuando un documento a revisar es similar a una versión anterior, el trabajo de la traducción de la versión actualizada se puede reducir en un 70 o 80 % Las ventajas de los sistemas de Traducción son la consistencia especialmente cuando el trabajo lo realizan varios traductores lo que lleva, a su vez, a un aumento de la calidad del resultado final, la rapidez pues el sistema guarda 21 todos los segmentos traducidos anteriormente que no have falta volver a traducir lo que puede acelerar el proceso de traducción, la reducción de los costes al emplear menor tiempo y poder reutilizar los segmentos ya traducidos. A pesar de las grandes ventajas de las memorias de traducción, también ellas conllevan desventajas materializadas en el alto costo de adquisición al principio, la falta de adecuación a todo tipo de documentos, las dificultades de post edición de los textos traducidos, y, sobre, la dificultad en la integración total con los sistemas de traducción actuales. 22 Sistemas de traducción en el mercado actual Comparación entre las herramientas de traducción más conocidas. http://www.proz.com/software-comparison-tool/cat/cat_tools/2 Herramientas de ayuda para la traducción (CAT Tools) Nombre Formatos compatibles Sistema Operativo Idioma Widget tool Licencia Déjà Vu Microsoft Office (Word, Excel, Powerpoint, also embedded objects, and Access), Help Contents (CNT), FrameMaker (MIF), PageMaker, QuarkXPress, QuickSilver/Interleaf ASCII, Java Properties (.properties), HTML, HTML Help, XML, RC, C/Java/C++, IBM TM/2, Trados Workbench, Trados BIF (old TagEditor), Trados TagEditor, JavaScript, VBScript, ODBC, TMX, EBU, InDesign (TXT, ITD, INX, IDML), GNU GetText (PO/POT), OpenOffice, OpenDocument SDLX (ITD), ResX, XLIFF (XLF, XLIF, XLIFF, MQXLIFF, Windows Proprietary 23 Nombre Formatos compatibles Sistema Operativo Idioma Widget tool Licencia unsegmented and segmented SDLXLIFF), Visio (VDX), PDF, Transit NXT PPF, WordFast Pro TXML GlobalSight Text ANSI / ASCII / Unicode for Windows, Text for Apple Macintosh, HTML, XML (ASP.NET, ASP, JSP, XSL), SGML, MS Word for Windows, MS Excel, MS PowerPoint, RTF, RC, Adobe FrameMaker, Adobe InDesign Java platform / Java Apache License 2.0 gtranslator PO POSIX C GTK+ GNU General Public License Lokalize Gettext PO, Qt ts, XLIFF, TMX Cross-platform C++ Qt GNU General Public License memoQ .MIF, InDesign formats (.INDD, .INX, .IDML), .XML, .DITA, .XML, .MM, .PO, .HTML, .HMT, .SHT, .properties, .DOC, .RTF, .BAK, .DOT, .DOCX, .XLS, .XML, Windows Proprietary 24 Nombre Formatos compatibles Sistema Operativo Idioma Widget tool Licencia .XLSX, .XLSM, .XLS, .XLT, .PPT, .PPS, .POT, .PPTX, .PPSX, .POTX, .SLDX, .VDX, .HHC, .HHK, .ODT, .ODF, .TXT, .INF, .INI, .REG, .PDF, .SVG, .SDLPPX, .TTX, .SDLXLIFF, .TMX, .TXML, .RESX, .XLF, .XLIF, .XLIFF, XLIFF:doc MemSource .doc, .docx, .rtf, .ppt, .pptx, .xls, .xlsx, .htm, .html, .properties, .tmx, .ttx, .xhtm, .xhtml, .xml, .dita, .ditamap, .xliff, .sdlxliff, .txt, .csv, .resx, .idml, .mif Java platform / Java Proprietary MetaTexis Microsoft Word, Excel and Powerpoint, all kinds of text formats, XML, HTML, XLIFF, RTF, TRADOS Studio (SDLXLIFF), TagEditor (TTX), POT/PO, Manual Maker, several further formats... Microsoft Office Word add-in Proprietary OmegaT Plain text, HTML, XHTML, StarOffice, OpenOffice.org, OpenDocument (ODF), MS Office Open XML, Help & Manual, HTML Help Compiler (HCC), LaTeX, DokuWiki, QuarkXPress CopyFlow Gold, DocBook, Android Resource, Java Properties, Typo3 LocManager, Mozilla DTD, Windows RC, WiX, ResX, INI files, XLIFF, PO, SubRip Subtitles, SVG Images Java platform / Java GNU General Public License 25 Nombre Formatos compatibles Sistema Operativo Idioma Widget tool Licencia Open Language Tools XLIFF, HTML/XHTML, XML, DocBook SGML, ASCII, StarOffice/OpenOffice/ODF, PO, .properties, .java (ResourceBundle), .msg/.tmsg (catgets) Java platform / Java CDDL Poedit PO Cross-platform C++ GTK+ MIT License Pootle PO, XLIFF, OpenOffice GSI files (.sdf), TMX, TBX, Java Properties, DTD, CSV, HTML, XHTML, Plain Text Cross-platform Python Web GNU General Public License SDL Trados Features four translation environments: dedicated TagEditor, MSWord Interface, SDLX, the integrated interface SDL Trados Studio 2014. Filters for translating with Trados Studio or TagEditor available: Word, Excel, PowerPoint, OpenOffice, InDesign, QuarkXPress, PageMaker, Interleaf, Framemaker, HTML, SGML, XML, SVG, Xliff, Legacy Trados files TTX, ITD, Word Bilingual, Wordfast, MemoQ .... Includes SDL MultiTerm for terminology management and Project Management Dashboard for automating tasks and Windows Proprietary 26 Nombre Formatos compatibles Sistema Operativo Idioma Widget tool Licencia tracking. Virtaal XLIFF, PO and MO, TMX, TBX, Wordfast TM, Qt ts Many others via converters in the Translate Toolkit Cross-platform Python GTK+ GNU General Public License WordfastPRO MS Word, Excel, PowerPoint (all versions), PDF, SGML, HTML, XML, InDesign, FrameMaker, tagged documents, XLIFF, etc. Java platform / Java Proprietary Según la encuesta de Imperial College a 874 traductores profesionales de 54 countries,en el año 2006, la principal herramienta de traducción uitlizada fue : Trados(35%), Wordfast (17%), Déjà Vu (16%), SDL Trados 2006 (15%), SDLX (4%), STAR Transit (3%), OmegaT (3%), others (7%). 27 En el siguiente dirección se pueden comparar las herramientas de traducción entre si. En este caso, a modo de ejemplo, hemos elegido sólo 5 de las herramientas más utilizadas en la traducción http://www.proz.com/software-comparison-tool/compare/2-/sdl_trados_studio_2011_freelance-to- Resultado de la comparación entre SDL Trados studio 2011 Freelance, SDL Trados Studio 2014, Déjàvu X2 Professional, Wordfast y Omega T. Name SDL TRADOS Studio 2011 - Freelance SDL Trados Studio 2014 Atril Déjà Vu X2 Professional Wordfast Pro OmegaT Review breakdown (20 reviews) (11 reviews) (10 reviews) (10 reviews) (7 reviews) 28 Most helpful review The Dinosaur of CAT By Pavel Tsvetkov PROS 1. Trados is still considered by many to be the best CAT tool out there – if not the most advanced or reliable, at least the most comprehensive one. 2. Their support is good, as long as you are willing to pay for it. That said, oftentimes, even they cannot figure what the problem is. 3. It is actively developed and marketing is aggressive, and with clear messages – not the case with Atril' More 54 out of 58 found this review helpful. Read more reviews → Losing Momentum By Pavel Tsvetkov PROS 1. Trados is still considered by many to be the best CAT tool out there – if not the most advanced or reliable, at least the most comprehensive one. 2. Their support is good, as long as you are willing to pay for it. That said, oftentimes, even they cannot figure what the problem is. 3. It is actively developed and marketing is aggressive, and with clear messages – not the case with Atril' More 41 out of 48 found this review helpful. Read more reviews → Easy to learn By Selcuk Akyuz None of the CAT tools are excellent but some of them are very good, DVX2 is one of them. Easy to install, easy to create a project, translation memory or termbase. Most functions are intuitive, possibly one can start translation right after installing it without reading the pdf help file even partially. 20 out of 20 found this review helpful. Read more reviews → Quite good, especially for the young translator By SonengoleA I started with the demo version of this tool and later on bought the licence. It's quite easy to use and has the basic functionalities needed by a young translator. Compared to other CAT tools, there are a lot of improvements to make. It is however worth its price. It is a good entry level tool for those new to the translation industry, especially its demo version. Unlike other cat tools, you ca More 17 out of 18 found this review helpful. Simple, robust, efficient By esperantisto I use this program for most of my translation. It’s a free program [1]. Very simple to learn (the start screen shows a 5-minute start guide, and it takes really 5 minutes to start off). Has an excellent spell check feature, as well as grammar check via a plugin [2]. Extremely robust: haven’t experienced any crash or hang for years. You can have it as a portable version on a USB stick. User setting More 17 out of 17 found this review helpful. Read more reviews → 29 Read more reviews → Product description SDL Trados Studio 2011 Freelance is the ultimate translation software, providing all the tools you need to edit and review high quality translations in the quickest possible time. Based on leading translation memory used by over 80% of the translation supply chain, SDL Trados Studio can help you complete translations up to 40% faster*! Depending on the type of content being translated, this fi More The #1 computer assisted translation environment for translation professionals. SDL Trados Studio 2014 is the leadingtranslation memory software. It offers a complete environment for professional More DVX2 Professional combines Intelligent Quality technology with customisable productivity and quality assurance. THE #1 TRANSLATION MEMORY SOFTWARE FOR ANY PLATFORM Wordfast Pro (WFP) is a standalone, multiplatform TM tool designed to change the landscape for every stakeholder in the translation process, from project manager to freelance translator OmegaT is the best free and fully multiplatform professional translation memory application. Downloaded close to 400,000 times since its first release and included in most standard Linux distributions, OmegaT is the CAT tool that gives you the most freedom and power as a user. Developed by and for translators, it offers everything you expect from a standard CAT tool. And more! Price From €845 Starter €99 (Perfect for part-time translators) | Freelance €695 (Perfect for freelance translators) | Professional €2.595 (Perfect for language service providers) €590 €400 Free of charge & total freedom of use (no license number, no registration etc) 30 File formats 25 years of filter development provides the most comprehensive framework including new filters for PDF, XML, FrameMaker & InDesign file formats Work with over 70 different file types – never have to turn down a translation project due to file compatibility ever again. See the full list View all file formats here MS Word MS Excel MS Powerpoint HTML XML ASP/JSP/Java INX (InDesign) MIF (FrameMaker TTX PDF Microsoft Office 2007 and later (.docx, .xlsx, .pptx), PDF (via Infix export), XHTML and HTML, ODF, PO, IDML/TTX/XLIFF/TXML (via Okapi plugin) and close to 30 more formats. License type Perpetual Perpetual Perpetual 3-year license Perpetual, open source Operating system Windows Vista, Windows 7, Windows XP, Windows 8 Windows XP, Windows Vista, Windows 7, Windows 8 Windows XP, Windows Vista, Windows 7, Windows 2000, Windows 8 Windows XP, Windows Vista, Windows 7, Mac OS X 10.4 and higher, Linux Windows Vista, Windows 7, Mac OS X 10.4 and higher, Linux, Windows 8, Windows XP System requirement s As a minimum requirement, we recommend a Pentium IV-based computer with 1 GB RAM and a screen resolution of 1280x1024. For optimum performance, we recommend 2 GB RAM and a more recent Pentium or compa 1 gigahertz (GHz) or faster, 32-bit (x86) or 64-bit (x64) processor and 2 GB RAM (32-bit) or 4 GB RAM (64-bit) based Microsoft Windows PC and a screen resolution of 1280x1024 Minimum system requirements: 1GHz or faster 32-bit (x86) or 64-bit (x64) processor, 1GB RAM No data No specific requirements. Runs anywhere. Compatibilit y Supports open standard file formats XLIFF, TMX, TBX & OLIF and an app store – OpenExchange – allowing Supports open standard file formats XLIFF, TMX, TBX & OLIF, interoperability Supports open standard file formats XLIFF, TMX, TBX & No data Supports standard data exchange formats (TMX, TBX) and most standard source 31 anyone to integrate their solution with other CAT tools & an OpenExchangeapp store OLIF formats (see above) Support and upgrades offered/incl uded Installation support and complimentary QuickStarthelp Free installation and licensing supportand a choice of competitively priced support and maintenance services. Free updates, but not upgrades, Free technical support via support ticket center Free upgrades for duration of license/Subscriptio n Free community support, Free upgrades to all future versions Support and tutorial links http://www.translationzone.com/ support/online-product-help/ No data No data No data No data Free trial SDL-30 days 30-day trial (fully functional and provides every feature of the product for you to try) Déjà Vu - 30 days full-featured demo version that runs without a paid license for translation memories of up to 500 translation units OmegaT is a free download Languages supported Work with as many languages as you want - the Freelance version supports up to 5 languages (which are selected upon installation) SDL Trados Studio 2014 will work with virtually any language combination that is also supported by Everything that takes place in Déjà Vu X Workgroup happens within Unicode. This means that all the languages supported Wordfast Pro supports any language that is supported by Microsoft Word. This includes No limitation whatsoever regarding useable language pairs. Possibility to use language codes that are not listed in the defaults. 32 Microsoft Windows.See the full list. by Windows are supported by Déjà Vu X Workgroup as source and target (includi Eastern European, Cyrillic, Asian, Right-to-Left, and various other languages.