Logos Multilingual Portal

6 - Het genereren van de tekst – deel drie

HomeTerugVooruit


"[...] relatar lo ocurrido, dar cuenta de lo acaecido [...] es una mera ilusión o quimera [...]"1.

 

Anders dan kunsttalen zijn natuurlijke talen heel flexibel. De verschillende componenten (van begripsmatige, lexicale en syntactische aard) zijn in sterke mate van elkaar afhankelijk, en elk kan de andere beïnvloeden. Het voordeel van die heterarchische architectuur is dat gegevens op verschillende wijzen kunnen worden verwerkt. Zo kan bijvoorbeeld de lexicale keuze voorafgaan aan de keuze van de syntactische structuur of omgekeerd2.

Nog een argument dat pleit voor de hypothese dat er geen rigide chronologisch onderscheid kan worden gemaakt tussen de fase van mentale bewerking en die van het onder woorden brengen van de gedachte is het volgende. De volgorde waarin gedachten zich aandienen valt niet noodzakelijk samen met die waarin ze onder woorden worden gebracht. Ook omdat de verbale taal zich op lineaire wijze ontplooit (de woorden vertonen zich één voor één) of op segmentale wijze (waaraan de term "suprasegmentale eigenschappen" ontleend is), terwijl de gedachte meer lijkt op een hypertekst, waarin elk element niet alleen in relatie staat tot het voorafgaande en het volgende woord, in volgorde van uiting, maar ook tot andere elementen die er om redenen van klank, paradigma, betekenis, affectieve lading, ervaring of puur toevallig raakvlakken mee hebben.

Wanneer we gedachten uitkiezen om onder woorden te brengen, dan surfen we in een multidimensionale hyperruimte (lange termijn-geheugen). De objecten in deze ruimte zijn gemarkeerd volgens verschillende dimensies (vorm, functie, als deel van iets anders, enz.). Zo kan een roos worden gezien als een bloem, geschenk, of als symbool, een auto kan zijn gemarkeerd op basis van herkomst (Frankrijk, Italië), van de fabrikant (Renault, Fiat), van de functie (privé-vervoer, openbaar vervoer), het type (sportief, four wheel drive), de prijs (luxueus, goedkoop), het jaar (old-timer of modern) en ga zo maar door. Deze multidimensionele classificatie (cross indexing) maakt het mogelijk dat de objecten in verschillende categorieën of op meerdere niveaus van het schema kunnen voorkomen3.

Er zijn talrijke experimenten uitgevoerd om de banale fouten te analyseren die we allemaal maken bij het spreken (verschillende vormen van lapsus, vervanging van een woord door een ander, omkering van elementen, enz.). Uit deze experimenten kan men langs abductieve weg proberen af te leiden welke fasen in de mentale bewerking leiden tot de geanalyseerde formuleringen. De mening die onder de geleerden die zich bezig houden met de wetenschappelijke literatuur op het gebied van onvrijwillige fouten het meest voorkomt is de hier volgende. De bewerking verloopt in fasen; eerst zouden de handelingen of gebeurtenissen in grote lijnen worden vastgesteld, daarna de elementen waaruit ze bestaan en vervolgens de onderlinge relaties, volgens een schema dat er als volgt uit ziet:

 

Figuur 1: het schema dat met zijn vertakkingen de mentale processen weergeeft die nodig zijn voor het formuleren van een taaluiting (ontleend aan Zock 1996). De voortgang in de tijd verloopt van boven naar beneden. De verschillende delen van de taaluiting zijn horizontaal gerangschikt.

Dit boomvormige schema geeft het procédé weer dat nodig is om de zin "When the old man saw the little boy drowning in the river, he went to his canoe in order to rescue him" te genereren4.

Men ziet dat als je van boven naar beneden gaat, vanuit een cognitief standpunt wordt begonnen met de identificatie van de twee belangrijkste gebeurtenissen waarover de taaluiting gaat (de oude man ziet, de oude man gaat). In de tweede fase worden beide gebeurtenissen in grote lijnen gespecificeerd: waarneming, doelgerichte handeling. In de derde fase vindt een nadere specificatie plaats, en dat gaat zo verder, totdat men bij de details van de uiteindelijke versie komt (het onderste deel van het schema).

Een van de elementen die pleiten voor de theorie van de gemengde generering van de tekst (die begint met een benaderende maar globale macroplanning en daarna, naarmate het moment van de realisering van de afzonderlijke delen in woorden naderbij komt, overgaat tot afzonderlijke microplanningen en gedetailleerde verwoording) is de aanwezigheid van elementen die alleen maar betekenis hebben als je de complete taaluiting bekijkt, zoals in het voorbeeld van Zock, "When". Zo´n woord, dat zich aan het begin van de zin bevindt, zou noch enige betekenis hebben noch te voorzien zijn als de schrijver (of spreker) niet op de hoogte was van het totale verloop van de taaluiting, die bestaat uit een hoofdzin en een bijzin van tijd.

Aan de andere kant is het korte termijn-geheugen te weinig uitgebreid om programmering van de hele uiting in al haar details vanaf het moment van verwezenlijking van het eerste segment mogelijk te maken. Het is daarom nodig de planning van de uiting wel in twee fasen te zien, net als Zock: een algemene planning waar het skelet van de uiting al deel van uitmaakt, en diverse specifieke microplanningen waarin de afzonderlijke componenten hun vorm krijgen.

Wanneer men het heeft over de vorming van een doeltekst als vertaling van het mentale in het verbale, dan wil men een algemeen, benaderend idee geven, een idee bij benadering. Kijkt men daarna naar de details, dan merkt men dat men in werkelijkheid te maken heeft met een serie microvertalingen die heen en weer slingeren tussen het verbale en het mentale vlak. Na de eerste, benaderende vertaling van mentaal in lexicaal materiaal bepalen de semantische velden van de gekozen woorden, hun mate van syntactische combineerbaarheid, de connotatieve betekenissen van deze woorden voor de schrijver, de cognitieve ervaringen die samenhangen met het gebruik van die woorden door het subject, alle gezamenlijk een informatieve feedback (van het verbale naar het mentale). Deze beïnvloedt de keuze van andere woorden en de completering en/of wijziging van de syntactische structuren (van mentaal naar verbaal).

Zowel in de fase van schrijven van de tekst van een vertaling als in die van revisie van de doeltekst vindt er een voortdurende activiteit van microvertaling van mentaal in verbaal en vice versa plaats. Die houdt pas op wanneer men besluit geen andere wijzigingen aan te brengen in de tekst (dat wil zeggen, op het moment dat we de vertaling als definitief beschouwen).

 

Bibliografische verwijzingen:

BATEMAN J. & ZOCK M. Natural Language Generation, in R. Mitkov (ed.), Handbook of Computational Linguistics, Oxford University Press, 2001

MARÍAS J. Negra espalda del tiempo, Punto de lectura, 2000 (oorspronkelijke uitgave 1998), ISBN 84-663-0007-7.

ZOCK M. Holmes meets Montgomery: an unusual yet necessary encounter between a detective and a general, or, the need of analytical and strategic skills in outline planning, in VI Simposio Internacional de Comunicacion Social, Santiago de Cuba, 1999, pp. 478-483.

ZOCK M. The power of words, in Message Planning, 16th International Conference on Computational Linguistics (COLING), Copenhagen, 1996, pp. 990-5.

ZOCK M. Sentence generation by pattern matching: the problem of syntactic choice, in R. Mitkov & N. Nicolov (ed.), Recent Advances in Natural Language Processing. Series: Current Issues in Linguistic Theory, Amsterdam, Benjamins, 1997, p. 317-352.


1 Marías 2000, p. 10. "[...] to tell what happened, give an account of what took place [...] is, in fact, a mere illusion or chimera" (Engelse vertaling van Bruno Osimo).
2 "Natural languages, as opposed to artificial languages, are very flexible. The different components (conceptual, lexical and syntactic) are highly interdependent, each component possibly influencing the others. The advantage of such heterarchical architecture is that it allows for various orders of data processing. For example, lexical choice may precede the choice of syntactic structure and vice versa". Zock 1997, p. 326.
3 "When choosing the thoughts to be expressed, we navigate in a multidimensional hyperspace (long-term memory). The objects of this space are indexed along various dimensions (from, function, part of, etc.). For example, a rose can be seen as a flower, a gift or a symbol, a car may be indexed according to its origin (France, Italy), producer (Renault, Fiat), function (private, public transportation), type (sport, 4-wheel drive), price (luxury, economic), year (old-timer, modern), etc. This multidimensional classification (cross indexing) allows objects to appear in several categories or at different levels of a tree". Zock 1999, p. 481.
4 Zock 1996, pp. 990-991. HomeTerugVooruit