Logos Multilingual Portal

19 - De zoekmachine (deel één)

HomeTerugVooruit


"Es erübrigte dann noch die Untersuchung, nach welchen Regeln sich die Organreize in Traumvorstellungen umsetzen".1

Daarna zouden we nog moeten onderzoeken volgens welke regels de prikkeling van organen in droomvoorstellingen worden omgezet.

 

In de vorige lessen hebben we gezien hoe elektronische tekstcorpora werken en hoe die kunnen worden gebruikt voor het werk van de vertaler. We hebben daarna geconstateerd dat het internet wemelt van andere telematische hulpmiddelen die vaak kosteloos kunnen worden geraadpleegd door de gebruikers en door de mensen meer in het algemeen.

Een aspect waarbij we nog niet nader stil hebben gestaan is het gebruik van de zoekmachine. Zoals bekend zou de op het internet aanwezige informatie op zich beschouwd van weinig waarde zijn als deze uiterst krachtige toepassingen niet voorhanden waren om het materiaal op het web te rubriceren en daarna zoekopdrachten op het gehele geselecteerde materiaal uit te voeren.

Natuurlijk is geen systeem voor rubricering of indexering uitputtend of volmaakt: alles kan vollediger worden gemaakt of verbeterd. Toch is de op dit terrein geboekte vooruitgang zeer opmerkelijk, en het hele wereldwijde web van telematische sites lijkt dankzij de zoekmachines steeds meer op een kolossaal naslagwerk en, in bepaalde gevallen, op een gigantisch corpus dat op verschillende wijzen kan worden geraadpleegd.

Gewoonlijk weet iemand die zijn weg kent op internet ook hoe hij moet omgaan met een zoekmachine: het is vrijwel onmogelijk enig nut te halen uit het web zonder dat hij met deze faciliteit kan omgaan. Toch hebben weinigen technische kennis omtrent het gebruik van zoekmachines, en soms is die kennis ontoereikend en wel om verschillende redenen. Men vindt ze vervelende en oninteressante instrumenten en heeft geen belangstelling voor de technische kanten ervan, omdat men denkt dat bepaalde details het werkterrein van de technici van de informatica vormen. In dat geval beseft men niet hoe geraffineerd een zoekopdracht kan worden als men goed weet om te gaan met de instrumenten die deze besturen.

De meest gebruikte zoekmachine is Google. Laten we vooropstellen dat er sterk verschillende versies van Google bestaan, ongeveer één voor elk land ter wereld, dus nog veel meer dan één voor elke officiële taal. Om een volledig idee te krijgen van dit verschijnsel moet men een van de sites van Google bezoeken, bijvoorbeeld de hoofdsite, www.google.com, en dan klikken op "Language Tools" dat rechts op het scherm in nogal kleine letters is aangegeven. Zo komt men op de pagina http://www.google.com/language_tools?hl=en, die een lijst toont van de talen die in Google vertegenwoordigd zijn en van de versie van Google in de domeinen van de diverse landen. Om een voorbeeld te geven: voor de Engelse taal bestaan maar liefst negenentwintig verschillende nationale versies naast de reeds vermelde Amerikaanse, die eindigt op .com:

  1. http://www.google.co.uk/ (Verenigd Koninkrijk)
  2. http://www.google.ca/ (Canada: er bestaat ook een Franstalige versie)
  3. http://www.google.com.au/ (Australië)
  4. http://www.google.co.nz/ (Nieuw-Zeeland)
  5. http://www.google.co.in/ (India: er bestaan ook versies in de volgende talen Hindi Bengali Telugu Marathi Tamil)
  6. http://www.google.co.ei/ (Ierland)
  7. http://www.google.com.my/ (Maleisië: er bestaat ook een versie in de Maleise taal Bahasa Melayu)
  8. http://www.google.com.sg/ (Singapore: er bestaan ook versies in de talen 中文(简体) Bahasa Melayu தமிழ்)
  9. http://www.google.com.hk/intl/en/ (Hong Kong)
  10. http://www.google.com.pr (Puerto Rico: er is ook een Spaanstalige versie voorhanden)
  11. http://www.google.com.hk/intl/en/ (Malta: er bestaat ook een versie in het Maltees)
  12. http://www.google.com.fj/ (Fiji)
  13. http://www.google.com.na/ (Namibië: er is ook een versie in het Afrikaans)
  14. http://www.google.vg/ (Virgin Islands)
  15. http://www.google.mu/ (Mauritius: er bestaat ook een Franstalige versie)
  16. http://www.google.mu/ (Samoa)
  17. http://www.google.com.gi/ (Gibraltar: er bestaan ook versies in het español Italiano Português (Portugal) )
  18. http://www.google.com.vc/ (Saint Vincent and the Grenadines)
  19. http://www.google.mw/ (Malawi)
  20. http://www.google.fm/ (Micronesië)
  21. http://www.google.ms/ (Montserrat)
  22. http://www.google.com.nf/ (Norfolk Island)
  23. http://www.google.sh/ (Saint Helena)
  24. http://www.google.gg/ (Guernsey: er bestaat ook een Franstalige versie)
  25. http://www.google.co.je/ (Jersey: er bestaat ook een Franstalige versie)
  26. http://www.google.gm/ (Gambia)
  27. http://www.google.pn/ (Pitcairn Islands)
  28. http://www.google.co.za/ (Zuid-Afrika)
  29. http://www.google.co.im/ (Isle of Man)

Het gaat niet louter om etiketten die op dezelfde Engelstalige zoekmachine worden geplakt: het betreft gelocaliseerde instrumenten, die zijn aangepast aan de specifieke eisen van een bepaald land. Als ik bijvoorbeeld surf naar de site http://www.google.ch/intl/en/, die overeenkomt met de Engelstalige versie van de Zwitserse Google, vind ik onder het zoekvenster de optie "Search the web / Search pages from Switzerland", wat natuurlijk een enorm verschil maakt wanneer ik een onderzoek doe naar het voorkomen van een bepaalde string in het Italiaans, het Frans of het Duits en wil weten of er een verschil bestaat tussen deze frequentie op het web in het algemeen, op puur Zwitserse sites of op alleen Duitse of Franse sites.

Zoek ik bijvoorbeeld naar de letters die samen het woord "emmental" vormen op Zwitserse sites, dan krijg ik 75.900 sites die niet te maken hebben met de beroemde kaas, maar met het Emmental, het dal van de Emmen, en die vooral toeristisch of geografisch gericht zijn. Zoek ik hetzelfde woord op Italiaanse sites met www.google.it en geef daarbij de specificatie "alleen pagina’s in Italië", dan krijg ik 2.560 verwijzingen naar sites die bijna uitsluitend de kaas betreffen (die overigens in de oorspronkelijke taal "Emmentaler" heet); voer ik het woord daarentegen in in de zoekmachine www.google.fr, en klik op de optie "Pages: France", dan krijg ik 12.100 verwijzingen naar sites waarop vooral sprake is van de Franse kaas die een imitatie van de Zwitserse emmentaler is en de naam "Emmental Français" draagt.

Geef ik daarentegen aan de Zwitserse zoekmachine "emmental käse" op en kies daarnaast voor de optie "Seiten auf Deutsch", dan krijg ik maar 21 resultaten, vooral bestaande uit niet-Zwitserse, voor het merendeel Duitse sites (het is niet waarschijnlijk dat een Zwitser de fout zou begaan om de kaas aan te duiden als "emmental" in plaats van "Emmentaler"). Om aan te geven dat ik alleen op Duitstalige Zwitserse sites wil zoeken, moet ik naar de beschikbare opties gaan en kiezen voor "advanced search" (Erweiterte Suche), vervolgens als taal Duits aanwijzen en als "domain" .ch, de suffix die elke Zwitserse site heeft. Het resultaat dat ik krijg is maar één site!

In het schermpje van de zoekmachine verschijnt «"emmental käse" site:.ch», wat neer komt op de syntaxis van mijn opdracht vertaald in begrijpelijke taal door de zoekmachine. Als ik deze string wijzig in «"emmentaler käse" site:.ch», kom ik tot 482 resultaten, hetgeen onmiddellijk aantoont hoe de benaming van de kaas in Zwitserland luidt, anders dan de naam waaronder die in Italië en Frankrijk bekend staat.

De pagina met de "taalhulpmiddelen" is een van de ijkpunten voor het zoeken door vertalers op het internet, en het door mij gegeven voorbeeld is slechts een van honderden mogelijkheden. Waar het om gaat is dat men de voor het opgeven van zoekopdrachten vereiste syntaxis niet hoeft te leren: ze is dan ook eenvoudig, maar als men de diverse formules niet wenst te leren volstaat het gebruik te maken van de pagina’s "geavanceerd zoeken" en "taalhulpmiddelen".

Op de pagina "geavanceerd zoeken" vinden we de volgende opties:

"resultaten die al de volgende woorden bevatten"

"resultaten die de volgende zin bevatten" (dit verschilt van de vorige optie omdat hier ook is vereist dat de woordvolgorde identiek is)

"resultaten die een van de volgende woorden bevatten"

"resultaten waarin de volgende woorden niet voorkomen".

Als ik aangeef dat ik het woord "emmental" wil vinden in sites waarin het woord "kaas" niet voorkomt om te zien wat er dan gebeurt, bijvoorbeeld om te zien of het in Zwitserland toeristisch zeer vermaarde dal ook buiten dat land bekend is, dan krijg ik een teleurstellend resultaat: ik vind inderdaad verwijzingen naar diverse sites die weliswaar spreken over de Emmentaler kaas, maar die het nooit hebben over "kaas".

Als ik kijk naar de inhoud van het zoekscherm, ontdek ik dat daarin "emmental –kaas" staat geschreven, wat de vertaling is van de criteria van mijn opdracht in de taal van Google. Ik ontdek daarmee dat om woorden aan te geven die niet aanwezig mogen zijn het volstaat, als alternatief voor het gebruik van de pagina geavanceerd zoeken, om voor het woord het minteken te plaatsen.

Als ik kijk naar welke sites ik ben doorverwezen, constateer ik dat "-kaas" aangeven niet afdoend is omdat het woord vaak in het meervoud staat en bovendien vaak de woorden "recept" en "recepten" verschijnen. Ik probeer nu mijn zoekopdracht opnieuw op te geven en wel als volgt:

"emmental –kaas -recept –recepten –kazen"

Deze keer kan ik tevreden zijn: ik vind vooral sites die gewijd zijn aan het Zwitserse dal en niet aan zijn beroemde kaas. In de volgende lessen zullen we andere aspecten van zoekmachines onder de loep nemen.

Bibliografische verwijzingen

FREUD SIGMUND The Interpretation Of Dreams translated by A. A. Brill London G. Allen & company 1913.

FREUD SIGMUND, Die Traumdeutung (1902),

Frankfurt am Main, Fischer Taschenbuch Verlag, 1991 (Zwölfte, unveränderte Auflage 2005) ISBN 3-596-10436-X

GOOGLE, beschikbaar op het world wide web all’indirizzo http://www.google.com/, geraadpleegd op 8 november 2006.


1 Freud 1991: 52.



 



HomeTerugVooruit