Logos Multilingual Portal

19 – Moteurs de Recherche – Première Partie

SommairePrécedentSuivant



"Nous devrions alors avoir à découvrir les lois par lesquelles les stimuli organiques sont transformés en des représentations-rêves"1.

 

Dans les sections précédentes nous avons étudié les corpora de textes électroniques, comment ils opèrent et comment ils peuvent être utilisés par le traducteur dans son travail. Et nous avons vu que l’internet est rempli d’autres ressources souvent disponibles gratuitement aux usagers, aux citoyens et au public en général.

 

Un aspect que nous n’avons pas encore pris en considération est celui de l’usage du moteur de recherche. Comme nous le savons, l’information sur internet par elle-même, ne serait pas très utile sans ces applications très puissantes qui indexent le matériel sur le Net et l’utilisation de tels indexes, permet des recherches dans tout l’ensemble du matériel indexé.

 

Bien sûr aucun système d’index n’est complet ni parfait : ils peuvent tous être améliorés et complétés. Mais encore, les développements dans ce domaine sont dramatiques, et tout l’ensemble des sites web partout dans le monde est de plus en plus près de devenir un énorme outil de références grâce aux moteurs de recherche et, dans certains cas, de se développer en un immense corpus qui peut être consulté d’une grande variété de façons.

 

Ceux qui sont ordinairement habiles à utiliser l’internet sont aussi experts dans l’utilisation d’un moteur de recherche : il est presqu’impossible de trouver des choses utiles sur l’internet sans être capable d’utiliser le moteur de recherche. Toutefois, la connaissance technique de l’usage du moteur de recherche est souvent très faible, quelquefois insuffisante, pour plusieurs raisons : parce qu’on considère que c’est un outil ennuyant, de peu d’intérêt et on n’est pas prêt à en apprendre les détails techniques, parce qu’on pense que certains détails sont réservés uniquement aux ingénieurs en logiciels, et aussi parce qu’on ne réalise pas combien une recherche peut devenir sophistiquée si on connait bien les outils qui le régissent.

 

Le moteur de recherche le plus populaire est Google. Disons au départ qu’il existe plusieurs versions de Google, presqu’une pour chaque pays dans le monde et par conséquent beaucoup plus qu’une pour chaque langage. Afin d’avoir une image complète de ce phénomène, connectez vous simplement à un des divers sites Google, par exemple, le site principal, www.google.com, puis cliquez sur "Language Tools", situé côté droit sur l’écran, en caractères plutôt petit. Cette opération vous permet d’accéder à la page http://www.google.com/language_tools?hl=en qui présente une liste et des langages représentés dans Google et la version Google dans les domaines des divers pays. Par exemple il y a au moins vingt sept versions nationales différentes en langue Anglaise (qui se terminent en .com) en plus de la version principale en langage Américain:

  1. http://www.google.co.uk/ (United Kingdom)
  2. http://www.google.ca/ (Canada: plus une version Française)
  3. http://www.google.com.au/ (Australia)
  4. http://www.google.co.nz/ (New Zealand)
  5. http://www.google.co.in/ (India: plus des versions en langages Hindi Bengali Telugu Marathi Tamil)
  6. http://www.google.co.in/ (Ireland)
  7. http://www.google.com.my/ (Malaysia: plus une version en langages Bahasa Melayu)
  8. http://www.google.com.sg/ (Singapore: plus une version en langages 中文(简) Bahasa Melayu தமிழ்)
  9. http://www.google.com.hk/intl/en/ (Hong Kong)
  10. http://www.google.com.hk/intl/en/ (Porto Rico: plus une version en Espagnol)
  11. http://www.google.com.hk/intl/en/ (Malta: plus une version en Maltais)
  12. http://www.google.com.fj/ (Fiji)
  13. http://www.google.com.na/ (Namibia: plus une version en Afrikaans)
  14. http://www.google.vg/ (Virgin Islands)
  15. http://www.google.mu/ (Mauritius: plus une version en Français)
  16. http://www.google.mu/ (Samoa)
  17. http://www.google.com.gi/ (Gibraltar: plus des versions en langages español Italiano Portugais (Portugal) )
  18. http://www.google.com.vc/ (Saint Vincent and the Grenadines)
  19. http://www.google.mw/ (Malawi)
  20. http://www.google.fm/ (Micronesia)
  21. http://www.google.ms/ (Montserrat)
  22. http://www.google.com.nf/ (Norfolk Island)
  23. http://www.google.sh/ (Saint Helena)
  24. http://www.google.gg/ (Guernsey: plus une version en Français)
  25. http://www.google.co.je/ (Jersey: plus une version en Français)
  26. http://www.google.gm/ (Gambia)
  27. http://www.google.pn/ (Pitcairn Islands)

Ce ne sont pas simplement de nouvelles étiquettes placées sur le même moteur de recherche en Anglais : ce sont des outils adaptés localement aux besoins spécifiques d’un pays donné. Si par exemple je connecte mon ordinateur au site http://www.google.ch/intl/en/, c’est la version du langage Anglais de Google en Suisse, et sous la boîte de recherche je trouve l’option «Search the web / Search pages from Switzerland», ce qui fait évidemment une énorme différence; par exemple, si je cherche la fréquence d’usage d’une chaîne donnée en Italien, ou en Français, ou en Allemand, et que je suis intéressé à comprendre si cette différence existe entre une telle fréquence sur le web en général, ou si elle existe seulement sur les sites Suisses, ou uniquement sur les sites Allemands ou Français.

 

Si je cherche la chaîne "emmental" uniquement sur les sites Suisses par exemple, je trouve 75,900 sites dans lesquels le nom du fameux fromage est absent, mais où je retrouve bien Emmental, ou Emmen Valley, bien connue par son caractère surtout touristique ou géographique. Si je recherche la même chaîne sur les sites Italiens uniquement à l’adresse www.google.it et en spécifiant "only pages in Italian", j’obtiens 2,560 références à des sites qui sont consacrés presqu’exclusivement au fromage (lequel dans son langage d’origine est plutôt appelé "Emmentaler"); si je l’insère dans le moteur de recherche www.google.fr, et en cliquant sur l’option "Pages: France», j’obtiens 12,100 références de sites surtout à propos du fromage Français qui est une imitation de l’Emmental Suisse et qu’on appelle "Emmental français".

 

Quand je tape "emmental käse" dans le moteur de recherche Suisse en spécifiant l’option Seiten auf Deutsch", je n’obtiens que 21 réponses, qui ne sont pas pour la plupart de sites Suisses (un Suisse pourrait très difficilement utiliser le mot "Emmental" pour épeler le fromage national il utilisera plutôt l’épellation correcte "Emmentaler), mais surtout de sites Allemand. Afin de bien spécifier que je désire faire ma recherche uniquement sur des sites Suisses et uniquement en langue Allemande, je tape les options opened clicking on "advanced search" (Erweiterte Suche), puis j’indique l’Allemand comme langage et comme "domain .ch, en indiquant le suffixe après le nom de tout site Suisse. Je n’obtiens qu’un seul site.

 

Dans la boîte du moteur de recherche apparaît "emmental käse" site:.ch, qui est la syntaxe de ce que j’avais demandé traduit en un langage compréhensible pour le programme du recherche du moteur. Si j’édite la même chaîne afin de lire "emmentaler käse" site:.ch, j’obtiens un total de 482 réponses, ce qui m’informe immédiatement du nom de ce fromage en Suisse, contrairement au nom par lequel il est connu en Italie et en France.

 

La page "Language Tools" est l’une des principales références pour les recherches que font les traducteurs sur l’internet, et l’exemple que j’ai citée n’est qu’un des millions possibles. L’aspect essentiel est que la syntaxe nécessaire pour initier des recherches n’a pas à être apprise : elle est simple en fait, mais si quelqu’un n’est pas prêt a apprendre les diverses formules il n’a qu’à utiliser les pages "advanced search" et "language tools".

Dans la page "advanced search", nous trouvons les options suivantes :

 

"results containing all the following words"

"results containing the following sentence" (différent de l’option précédente parce qu’ici l’ordre des mots doit être le même)

"results containing any of the following words"

"results not containing the following words"

 

Si, afin de savoir ce qui se passe, j’énonce que je veux trouver le mot "emmental" sur des sites où le mot "cheese", n’apparaît pas, je peux constater si la vallée qui est bien connue touristiquement en Suisse est connue aussi à l’étranger, j’obtiens un résultat décevant : je trouve plusieurs références à des sites au sujet du fromage Emmentaler, mais le mot "cheese" n’est tout simplement jamais mentionné.

 

Si je lis le contenu de la boîte de recherche, je vois qu’elle contient "emmental -cheese", la traduction du critère de ma recherche dans le langage de Google. Je constate alors qu’il est suffisant d’indiquer les mots à exclure, en plaçant un signe moins avant les mots en question, si je ne veux pas utiliser la page advanced search

 

En regardant les sites auxquels je suis référé, je note que la syntaxe de

"-cheese" n’est pas toujours approprié parce que le mot est souvent au pluriel, de plus on retrouve aussi souvent les mots recipe, recipes. J’essaie alors de reformuler ma recherche : emmental -cheese -recipes -recipe -cheeses

 

Et cette foi ça marche : je trouve surtout des sites consacrés à la vallée Suisse, et non pas à son fromage renommé.

 

Dans les prochaines sections nous examinerons d’autres aspects du moteur de recherche.

 

Bibliographie

 

 

FREUD SIGMUND, L'interpretazione dei sogni, in Opere, vol. 3, Torino, Borin-ghieri, a cura di C. L. Musatti, 1966.

FREUD SIGMUND, The Interpretation Of Dreams, translated by A. A. Brill, Lon-don, G. Allen & company, 1913.

GOOGLE, vailable in the world wide web at the address http://www.google.com/, consulted 7 April 2004.


1 Freud 1900: 37.


 



SommairePrécedentSuivant