Logos Multilingual Portal

25 - Memorie di traduzione

 

«E tuttavia, un tale arretramento degli osservatori dalle porte dell’intelletto, come si esprime Schiller, tale traduzione nella condizione di autoosservazione acritica, non è per niente difficile»1.

Uno degli sviluppi tecnologici che hanno segnato maggiormente l’attività dei traduttori negli ultimi vent’anni è l’uso delle memorie di traduzione. Anche se, va detto subito, soltanto una parte dei traduttori ne fa uso. Comincio con la definizione di «memoria di traduzione».

Le memorie di traduzione nascono là dove si è preso coscienza del fallimento della traduzione automatica parola per parola. La considerazione di base è stata: se fosse stato possibile creare delle banche dati contenenti corrispondenze perfette tra parole nella lingua del prototesto e parole nella lingua del metatesto, sarebbe stato molto comodo, poiché la fatica necessaria sarebbe stata solo quella di inserire una volta nella banca dati la coppia parola-traducente, e poi la si sarebbe potuta usare un numero indefinito di volte nelle varie traduzioni.

Dato che questo non funziona, o quanto meno non funziona in modo soddisfacente, si potrebbe puntare a un risultato meno appariscente ma più preciso: memorizzare non singole parole, ma combinazioni di parole, piccole frasi. In questo caso, l’immissione di parole nella banca dati sarebbe un’operazione assai più faticosa. Infatti, anziché inserire la parola «casa», devo inserire tutte le frasi che possono contenere la parola «casa». Però il risultato è di certo più interessante.

Dato che il problema della traduzione automatica riguarda soprattutto la sintassi (è difficile insegnare a un computer la capacità sintagmatica, quindi le parole vengono combinate in modo errato) e la scelta del corretto traducente tra N traducenti possibili (è difficile insegnare a un computer la capacità paradigmatica), tale problema viene aggirato presentando al computer frammenti di discorso già sintatticamente coerenti che possono essere (almeno in certi casi) sostituiti a frammenti di discorso del prototesto.

Basandosi su questo costrutto teorico, i tecnici hanno ideato un programma informatico che combina al suo interno due funzioni principali: la segmentazione e la memoria di traduzione vera e propria. Per definire «memoria di traduzione», definisco prima il concetto di «segmentazione».

Dato che, come ho detto, le memorie di traduzione lavorano su frammenti di discorso, che in gergo si chiamano «segmenti», è necessario che qualcuno decida come si possono ricavare tali segmenti, ossia in che modo un testo va segmentato. È evidente che criteri come il numero di caratteri, o di righe, o di parole, non avrebbero molto senso. Il numero di caratteri determinerebbe il taglio di parole a metà, il numero di parole determinerebbe la troncatura di una frase in un punto qualsiasi, e il criterio della riga sarebbe altrettanto arbitrario.

Di conseguenza, per riuscire ad avere frammenti dotati di una certa autonomia e di un certo senso, che possono ragionevolmente ripresentarsi in altri testi nella stessa forma o in forma simile, la segmentazione avviene di solito in funzione dei segni d’interpunzione. La scelta di segmenti più lunghi o più corti comporta vantaggi e svantaggi. Scegliere segmenti molto corti fa sì che aumentino le probabilità di rincontrare la stessa stringa in altre traduzioni future. Infatti il numero di parole che compongono una stringa è inversamente proporzionale alla sua diffusione. Faccio un esempio:

Se cerco in Google la stringa:

«Instructions for use» ricavo 197.000 risultati

Se cerco in Google la stringa:

«Instructions for use of» i risultati sono già 20.500

Se aggiungo l’articolo:

«Instructions for use of the» i risultati diventano 7.800

Se la stringa è ancora più specifica:

«Instructions for use of the software», i risultati sono appena 55.

Questa constatazione fa propendere per la scelta di segmenti corti. D’altra parte, portando all’estremo questo ragionamento, si ritorna a considerare le parole singole come segmenti massimi, e questo sappiamo che comporta troppi problemi perché possa essere conveniente. Perciò la scelta di segmenti lunghi ha il vantaggio di garantire probabilità notevoli che il traducente proposto una prima volta sia utilizzabile in sèguito.

Di solito i segni d’interpunzione sono un buon punto per interrompere una frase e segmentarla: a seconda dei casi, dei tipi di testo, e delle preferenze personali, si potrà decidere se includere la virgola o no.

Il software che gestisce la memoria di traduzione procede inizialmente a segmentare il prototesto. E qui entra in gioco la memoria di traduzione vera e propria.

Dopo avere segmentato il prototesto, all’utente si presentano due riquadri, uno sopra l’altro. In quello superiore si legge il primo segmento del prototesto, mentre quello inferiore è vuoto. È vuoto perché stiamo ipotizzando che questa sia la prima frase che il traduttore traduce con questa memoria di traduzione, che è quindi vuota.

Il traduttore scrive nel riquadro inferiore la propria traduzione, quindi dà il comando di procedere. Al traduttore compare quindi la frase successiva del prototesto (segmento), con il riquadro inferiore vuoto. Il programma, però, nel frattempo ha creato automaticamente un file in formato testo (quelli che finiscono con il suffisso .txt) che contiene alcuni dati (che vedremo nelle prossime unità) riguardanti il traduttore, la combinazione linguistica, eventualmente il cliente ecc., e ha memorizzato in questo file il segmento del prototesto e il segmento del metatesto.

In questo modo, alla prima occasione in cui al traduttore si ripresenterà lo stesso segmento di prototesto, il programma automaticamente collocherà nel riquadro inferiore (sotto forma di suggerimento, modificabile dal traduttore) il frammento di metatesto così come era stato tradotto ed eventualmente modificato in precedenza.

Dato che, come detto, le probabilità che si ripresenti esattamente lo stesso frammento di prototesto sono scarse, i programmi che gestiscono le memorie prevedono la possibilità di regolare la percentuale di corrispondenza perché un frammento sia considerato assimilabile a un altro. Nelle prossime unità vedremo questi princìpi concretamente in azione utilizzando l’esempio del programma Wordfast.

Per il momento accenno soltanto ai vantaggi e agli svantaggi di fissare una percentuale di corrispondenza più alta o più bassa. Se si fissa come percentuale 100% (e quindi si fa sì che il programma proponga segmenti pretradotti soltanto se il segmento corrispondente del prototesto corrisponde al 100% al segmento in questione), si ha il vantaggio di avere la certezza che è proposta una traduzione "giusta", e lo svantaggio di avere una quantità scarsissima di probabilità che si ripresenti un segmento identico.

Se si fissa come percentuale, supponiamo, 50%, la memoria avrà spesso occasione di dare "suggerimenti", ma nella maggior parte dei casi saranno suggerimenti inaccettabili.

Si noti che le memorie di traduzione risolvono l’annoso problema che affligge da sempre la traduttologia: come si faccia a stabilire se una traduzione è "giusta".

«Traduzione giusta», per me, è una traduzione fatta da me e revisionata da me e accettata dal mio cliente. Molto pragmatico, non c’è che dire. In questo caso, se la traduttologia non può dirci nulla perché è una scienza descrittiva e non prescrittiva, ci dice qualcosa invece il cliente, che decide di proporci un altro lavoro, o di cancellarci dai suoi elenchi.

 

Riferimenti Bibliografici

FREUD SIGMUND L’interpretazione dei sogni in Opere vol. 3 Torino Boringhieri a cura di C. L. Musatti 1966.

FREUD SIGMUND The Interpretation Of Dreams translated by A. A. Brill London G. Allen & company 1913.

CHAMPOLLION YVES Wordfast, disponibile nel world wide web all’indirizzo www.wordfast.org, consultato il 23 maggio 2004.


1 Freud 1900: 101.