Logos Multilingual Portal

5 – Génération de Texte – Deuxième Partie

SommairePrécedentSuivant


"[mots] on ne peut les imaginer sans ornements,

bien que parfois on le fait involontairement; il y a des

ornements même dans la plus aride des expositions [...]"1.

L’esprit humain possède une mémoire de longue durée, qui conserve ses informations les plus stables c’est-à-dire, le matériel quasi permanent qui caractérise le patrimoine culturel de l’individu; il s’agit d’une mémoire qui en termes d’ordinateurs peut être comparée à un disque dur: des données peuvent y être ajoutées ou effacées mais, excepté dans le cas d’un accident majeur, les données demeurent toujours présentes lorsque l’ordinateur est débranché.

L’esprit humain possède une autre mémoire de service de courte durée: il s’agit d’une mémoire volatile, qui ne dure que le temps au cours duquel elle est utile, et qui possède un caractère exclusivement organisationnel. Elle est similaire à la mémoire RAM de notre ordinateur pour au moins deux raisons:

- La première est que nous dépendons de sa capacité de mémorisation pour exécuter le nombre d’opérations simultanées qui peuvent être accomplies au cours d’une période de temps donnée;

- La deuxième est que lorsque nous débranchons l’ordinateur le contenu de la mémoire RAM est effacée.

Dans le cas de la production d’un texte, une telle mémoire de courte durée peut, par exemple, souffler des idées pendant que l’on organise un discours. Puisque cette mémoire est limitée, pour ce qui est du fonctionnment de la génération de texte, plusieurs possibilités sont basées précisément sur cette caractéristique. Les limites de notre mémoire de courte durée gênent nos capacités stratégiques de planification de phrases et, particulièrement dans le langage parlé, elles sont la cause de fautes ou de défauts de discours, tels que des incongruités de nombre ou de genre, des anacoluthes, de mauvais liens structurels ou logiques.

Le passage du contenu mental en texte écrit peut être décrit selon les termes suivants:

  • identifier les éléments utiles pour discerner entre le contenu qui doit être exprimé et des contenus similaires;
  • identifier les éléments redondants;
  • choisir les mots (lexicalisation) et porter attention à leur cohésion (liens intérieurs);
  • choisir la/les structure/s grammaticales;
  • l’ordre linéaire des mots;
  • partie de discours;
  • complexité de la phrase;
  • les prépositions et les autres mots de fonction;
  • forme finale2.

À cause des limitations de la mémoire de courte durée, les phrases sont construites graduellement, en interpolant les étapes de planification et d’exécution. Pendant qu’une partie du discours est actualisé (= prononcé, écrit), la partie suivante est planifiée: "nous pensons pendant que nous parlons et, pendant que nous parlons, nous pensons" 3. Il existe plusieurs affinités entre le langage et la perception: tous les deux sont des moyens de composition, tous les deux doivent satisfaire à des conditions de bonne forme et de perfection (au sens que la psychologie de Gestalt nous a donné à comprendre: le fonctionnement arrive sous forme de blocs et par la perception de structures) 4.

Une étape fondamentale de génération de texte réside dans le choix des mots pour exprimer le message. Comme l’écrit Michael Zock, un chercheur du CNRS Français: de déclarer qu’un ordre chronologique exact existe selon lequel la formation de la pensée se produit d’abord, et que par la suite les mots adéquats pour l’exprimer sont choisis, a deux implications: la pensée précède rigoureusement et complètement le langage, et la pensée est codée entièrement et spécifiée avant que la lexicalisation se produise5. Quoique que selon l’hypothèse de Zock, le codage linguistique joue un rôle important dans la modélisation du contenu aussi, i.e. il existe une interaction réciproque entre le contenu et le langage.

Si l’on considère le processus de génération du texte en termes de traduction intersémiotique du langage mental en langage verbal et qu’en appliquant des mots au contenu mental génère un contenu, le processus de traduction devient complexe, bi-directionnel et multiple. Si la sélection de mots donnés altère le contenu du message à exprimer, une telle sélection a un impact aussi bien sur la structure de ce message qui pourrait diverger vers des sentiers imprévus avant que la lexicalisation ne débute, que sur toutes les révisions avant l’ébauche finale (lorsqu’il y en a une; l’hypertextualisation de la communication, la transmisibilité technique la plus élevée de l’information, limitent de plus en plus l’utilisation de mots tels qu’"ébauche finale": nous voyons plus souvent en leur place: "travaux en cours").

Comme nous l’avons vue lorsque nous étudiions l’interprétant et sa composante subjective, il n’existe pas de constante exacte ou de correspondance universelle entre les mots et l’aura de la signification mentale subjective ou, comme nous le dit Zock:

[...] les mots ne peuvent être calqués directement sur leur contrepartie conceptuelle, ce qui signifie qu’il n’y a pas de correspondance d’un pour un entre les concepts et les mots: un mot donné peut exprimer plus qu’un simple concept [...]6.

Ceci implique que le choix d’un mot ou d’une combinaison de mots altère non seulement la façon par laquelle le contenu est exprimé, mais il altère aussi le contenu du discours. D’un point de vue psychologique et psycholinguistique, un tel énoncé, parmi d’autres, supporte bruyamment le point qui a été soulevé dans la littérature par des écrivains Romantiques et, dans des critiques, par des Formalistes Russes d’abord, et par la suite, par les Structuralistes linguistes, qui ont ravivé l’intérêt pour la sémiotique des textes dans les années 1960: il n’est pas possible de distinguer nettement la forme du contenu, parce que la forme est le contenu et le contenu reste dans la forme aussi.

Les langages naturels, à l’opposé des langages artificiels, sont très flexibles. Les différentes composantes (conceptuelle, lexicale et syntaxique) sont très interdépendantes, chaque composante influence possiblement les autres. L’avantage d’une telle architecture hétéarchique est qu’elle permet d’avoir divers ordres de traitement des données. Par exemple, le choix lexical peut précéder le choix de la structure syntaxique et vice versa7.

Bibliographie

BATEMAN J. & ZOCK M. Natural Language Generation, in R. Mitkov, editor, Handbook of Computational Linguistics, Oxford University Press, 2001, ISBN

MARÍAS J. Negra espalda del tiempo, Punto de lectura, 2000 (original edition 1998), ISBN 84-663-0007-7.

MARÍAS J. Dark Back of Time, New York, New Directions, 2001 (translated by Esther Allen), ISBN 0-8112-1466-4.

ZOCK M. Holmes meets Montgomery: an unusual yet necessary encounter between a detective and a general, or, the need of analytical and strategic skills in outline planning, in VI Simposio Internacional de Comunicacion Social, Santiago de Cuba, 1999, p. 478-483.

ZOCK M. The power of words, in Message Planning, 16th International Conference on Computational Linguistics (COLING), København, 1996, p. 990-5.

ZOCK M. Sentence generation by pattern matching: the problem of syntactic choice, in R. Mitkov & N. Nicolov editors, Recent Advances in Natural Language Processing. Series: Current Issues in Linguistic Theory, Amsterdam, Benjamins, 1997, ISBN p. 317-352.


1 Marías 2001, p. 8. «[...] y además [la palabra] no se concibe sin ornamento, a menudo involuntario, lo hay hasta en la exposición más árida [...]» Marías 1998 (2000), p. 10.
2 Bateman e Zock 2001.
3 Zock 1997, p. 327 note.
4 Zock 1997, p. 328.
5 Zock 1997, p. 990.
6 Zock 1997, p. 990.
7 Zock 1997, p. 326.


 



SommairePrécedentSuivant