Logos Multilingual Portal

25 – Memorias de traducción

IndexBackNext


«Sin embargo, una adopción del estado de autoobservación exenta de crítica o, como describe Schiller, la supresión de la vigilancia a las puertas de la consciencia, no es nada difícil.»1.

 

Uno de los avances tecnológicos que ha modificado en mayor medida la actividad de los traductores en los dos últimos decenios ha sido el uso de memorias de traducción, aunque es necesario reconocer que sólo una parte de ellos las utiliza. Empecemos por definir qué es una "memoria de traducción".

Las memorias de traducción nacen cuando se adquiere conciencia del fracaso de la traducción automática palabra por palabra. La consideración de que se partía era ésta: si era posible crear bases de datos con la correspondencia perfecta entre las palabras de la lengua del prototexto y las de la lengua del metatexto, se llegaría a una situación muy cómoda, ya que sólo restaría introducir el par de palabra-trasladante en la base de datos y utilizarlo de manera indefinida en traducciones futuras.

Dado que tal cosa no es viable, o al menos no funciona de manera satisfactoria, se podía intentar un objetivo menos vistoso pero más preciso: no almacenar palabras aisladas, sino combinaciones de palabras en frases cortas. En tal caso, la incorporación de términos a la base de datos sería un trabajo mucho más arduo. Por ejemplo, en lugar de introducir sólo la palabra "casa", debería introducir todas las frases que puedan contener la palabra "casa". Sin embargo, el resultado es sin duda más interesante.

Dado que el principal problema de la traducción automática radica en la sintaxis (es difícil implantar en un ordenador conocimientos sintagmáticos, por lo que las palabras se combinan mal) y la elección del trasladante correcto entre n trasladantes posibles (también es difícil inculcar al ordenador la capacidad paradigmática), dicho problema se evita presentado al ordenador fragmentos de discurso sintácticamente coherentes, que puedan (al menos algunas veces) sustituir fragmentos del discurso del prototexto.

A partir de ese supuesto teórico, los técnicos han ideado un programa informático que combina las dos funciones principales: la segmentación y la memoria de traducción en sí. Por lo tanto, para definir "memoria de traducción", establezcamos primero el concepto de "segmentación".

Como ya dije, las memorias de traducción trabajan con fragmentos de texto, que en la jerga del sector se denominan "segmentos", por lo que alguien debe decidir cómo se obtienen esos fragmentos, es decir, cómo se segmenta el texto. Es obvio que criterios como el número de caracteres, de líneas o de palabras no tendrían mucho sentido. El número de caracteres implicaría el recorte de las palabras, el número de palabras truncaría las frases de manera aleatoria, y el número de líneas sería igualmente arbitrario.

Por consiguiente, para dotar a los fragmentos de cierta autonomía y sentido, que puedan representarse razonablemente en otros textos de forma igual o similar, la segmentación habitual se produce en función de los signos de puntuación. La elección de segmentos más cortos o más largos comporta ventajas y desventajas. Si se eligen segmentos muy cortos, aumenta la posibilidad de repetición de la misma cadena de texto en traducciones futuras. El número de palabras que componen una cadena de texto es inversamente proporcional a su difusión. Veamos un ejemplo.

Si busco en Google el texto:

"Instructions for use" obtengo 1.970.000 resultados.

Si la búsqueda en Google es de:

"Instructions for use of", indica 292.000 casos.

Si añado un artículo:

"Instructions for use of the", el resultado se reduce a 196.000.

Si la cadena de texto es aún más específica:

"Instructions for use of the software", sólo se obtienen 426 casos.

Esa constatación nos inclinaría hacia la elección de segmentos cortos. Por otra parte, si este razonamiento se lleva al extremo, los segmentos terminan siendo palabras aisladas, y sabemos que tal cosa implica demasiados problemas como para resultar útil. Por lo tanto, la elección de segmentos largos tiene la ventaja de garantizar la probabilidad de que el trasladante propuesto en primera instancia pueda volver a utilizarse.

Normalmente, los signos de puntuación son un buen punto para interrumpir y segmentar una frase; dependiendo de cada caso, del tipo de texto y de las preferencias personales, se podrá decidir si se incluye o no la coma.

El programa que gestiona la memoria de traducción procede inicialmente a segmentar el prototexto. Es cuando entra realmente en juego.

Después de la segmentación del prototexto, se presentan dos ventanas al usuario, una seguida de la otra. En la superior se muestra el primer segmento del prototexto, y la inferior aparece vacía. Estamos suponiendo que se trata de la primera frase que el traductor procesa con la memoria de traducción, por eso la segunda ventana no contiene texto.

El traductor escribe la traducción en la ventana inferior e indica al programa que siga adelante. A continuación ve la frase siguiente del prototexto (segmento) y la ventana inferior vacía. Sin embargo, entre tanto el programa ha creado automáticamente un archivo en formato de texto (los que tienen la extensión .txt) que contiene algunos datos (que veremos en las unidades siguientes) referentes al traductor, a la combinación de idiomas, tal vez al cliente, etc., y ha almacenado en ese archivo el segmento de prototexto y el de metatexto.

De ese modo, en la primera ocasión en que el traductor encuentre el mismo segmento de prototexto, el programa situará automáticamente en la ventana inferior (como sugerencia, que el traductor puede modificar) el fragmento de metatexto tal como se tradujo y tal vez se modificó en la sesión anterior.

Puesto que, como he dicho, son escasas las posibilidades de que se repita exactamente el mismo fragmento de prototexto, el programa que gestiona la memoria permite fijar el porcentaje de correspondencia por el que un fragmento se considera asimilable a otro. En las unidades siguientes veremos esos principios en acción utilizando el ejemplo del programa Wordfast.

Un comentario adicional sobre las ventajas y desventajas de fijar un porcentaje de correspondencia menor o mayor. Si se define un valor del 100% (el programa sólo propone segmentos pretraducidos si el segmento del prototexto corresponde al 100% con el segmento en cuestión), la ventaja es que se tiene la certeza de que el texto propuesto es "correcto", y la desventaja es que habrá muy pocas probabilidades de encontrar segmentos idénticos.

Si, por ejemplo, el porcentaje se fija en 50, la memoria ofrecerá muchas "sugerencias", pero en la mayoría de los casos serán inaceptables.

Téngase en cuenta que las memorias de traducción resuelven el antiguo problema que ha afectado siempre a la traductología: cómo saber si una traducción es "correcta".

Una "traducción correcta", en mi opinión, es una traducción realizada por mí, revisada por mí y aceptada por mi cliente. Sin duda, es una posición muy pragmática. En este caso, si la traductología no puede aportar una mejor definición de "correcto", es porque se trata de una ciencia descriptiva, no prescriptiva. El cliente sí nos dice algo respecto a la calidad si decide volver a encargarnos un trabajo o si nos elimina de su lista.

 

BIBLIOGRAFÍA

FREUD SIGMUND, La interpretación de los sueños, traducción de Luis López-Ballesteros y de Torres, Alianza Editorial, ISBN 84-206-1036-4.

FREUD SIGMUND, The Interpretation Of Dreams, translated by A. A. Brill, London, G. Allen & company, 1913.

CHAMPOLLION YVES Wordfast, disponible en la dirección www.wordfast.org, consulta realizada el 23 de mayo de 2004.


1 Freud 1900: 101.


 



IndexBackNext