Logos Multilingual Portal

11 – Andere corpora

HomeTerugVooruit


"Die Aufdringlichkeit, mit welcher dieser Traum seine Absurditäten zur Schau trägt, werden wir nach den letzten Erörterungen nur als Zeichen einer besonders erbitterten und leidenschaftlichen Polemik in den Traumgedanken übersetzen."1

De opdringerigheid waarmee deze droom zijn absurditeiten uit, zullen wij uitgaande van de laatste uiteenzetting slechts als teken van een bijzonder verbitterde en hartstochtelijke polemiek in de droomgedachte vertalen.

We hebben in de vorige lessen kennis gemaakt en leren omgaan met sommige corpora. Om een vollediger beeld te geven van de corpora en soortgelijke hulpmiddelen op het internet, zullen we nu stilstaan bij enkele andere. Sommige hiervan hebben de gedaante van echte corpora, waarop wij dan ook zoekopdrachten kunnen loslaten die het hele corpus aanspreken, zoals bij Wordtheque het geval is. Andere zijn echter verzamelingen teksten die het publiek ter beschikking zijn gesteld zonder dat ze in het samenhangend verband van een corpus zijn ondergebracht en zonder een zoekmachine die ze met elkaar in verband brengt en ons in staat stelt gelijktijdig in alle teksten te zoeken. We beginnen bij de eerste groep.

Het eerste corpus waarover ik het wil hebben is de Alex Catalogue of Electronic Texts die men vindt op het volgende adres:

http://www.infomotions.com/alex/.

Op de homepage van de site kan men kiezen tussen verschillende toegangsvormen. Het gaat om een database die speciaal is ontwikkeld voor een universitaire cursus, en daarom staat er een flinke hoeveelheid verhalende Engels- en Amerikaanse literatuur op, alsook enige Engelstalige filosofische teksten. De criteria waarop ze zijn gekozen zullen dus verschillen van die waarvan een taalkundige zou zijn uitgegaan bij het aanleggen van een corpus.

We kunnen de database raadplegen uitgaande van drie parameters: auteur, datum, titel. Bovendien kunnen we naar de sectie "downloads" gaan, van waaruit de hele database kan worden gedownload, die uit drie delen bestaat. Dit alles is helemaal gratis, conform de democratische geest van samen delen die zo belangrijk is voor het internet.

Laten we doen alsof we klikken op "browse by authors" (zoek op auteurs). Nu verschijnt een lange lijst van de auteurs die in de database zijn opgenomen:

  1. Abbott, Edwin A. (1 items); 2. Alcott, Louisa May (2 items); 3. Alger, Horatio, Jr. (14 items); 4. Anderson, Sherwood (2 items); 5. Anonymous (1 items); 6. Aristotle (28 items); 7. Augustine (1 items); 8. Austen, Jane (4 items); 9. Austin, Mary (1 items); 10. Bacon, Francis (2 items); 11. Barrie, James Matthew (1 items); 12. Baum, L. Frank (5 items); 13. Behn, Aphra (2 items); 14. Berkeley, George (2 items); 15. Bierce, Ambrose (3 items); 16. Bronte, Charlotte (1 items); 17. Bronte, Emily (2 items); 18. Browning, Robert (3 items); 19. Buchan, John (14 items); 20. Bulwer-Lytton, Edward George (1 items); 21. Bunyan, John (3 items); 22. Burke, Edmund (1 items); 23. Burnett, Frances Hodgson (7 items); 24. Burroughs, Edgar Rice (21 items); 25. Burton, Richard Francis (1 items); 26. Butler, Samuel (1 items); 27. Byron, George Gordon (1 items); 28. Carroll, Lewis (3 items); 29. Cather, Willa (3 items); 30. Chaucer, Geoffrey (1 items); 31. Cleland, John (1 items); 32. Coleridge, Samuel Taylor (3 items); 33. Conrad, Joseph (3 items); 34. Crane, Stephen (4 items); 35. Dana, Richard Henry (1 items); 36. Defoe, Daniel (1 items); 37. Dell, Thomas (1 items); 38. Descartes, Rene (2 items); 39. Dickens, Charles (20 items); 40. Douglass, Fredrick (2 items); 41. Doyle, Arthur Conan (13 items); 42. Dreiser, Theodore (1 items); 43. Eliot, George (1 items); 44. Emerson, Ralph Waldo (16 items); 45. Epictetus (3 items); 46. Epicurus (2 items); 47. Fielding, Henry (1 items); 48. Franklin, Benjamin (7 items); 49. Freud, Sigmund (1 items); 50. Gay, John (1 items); 51. Gray, Thomas (1 items); 52. Hamilton, John (1 items); 53. Hardy, Thomas (1 items); 54. Hart, Michael S. (2 items); 55. Hawthorne, Nathaniel (25 items); 56. Henry, O. (1 items); 57. Hobbes, Thomas (1 items); 58. Hubbard, Elbert (1 items); 59. Hume, David (13 items); 60. Hylton, Jeremy (1 items); 61. Irving, Washington (34 items); 62. James, Henry (2 items); 63. James, William (2 items); 64. Jefferson, Thomas (13 items); 65. John, King (1 items); 66. Kant, Immanuel (8 items); 67. Keats, John (34 items); 68. Kennedy, John F. (1 items); 69. King, Martin Luther, Jr. (1 items); 70. Kipling, Rudyard (2 items); 71. Lang, Andrew (1 items); 72. Leibniz, Gotfried Wilhelm (1 items); 73. Lewis, Sinclair (1 items); 74. Lincoln, Abraham (2 items); 75. Locke, John (7 items); 76. London, Jack (8 items); 77. Longfellow, Henry Wadsworth (3 items); 78. Lucretius Carus, Titus (1 items); 79. MacDonald, George (1 items); 80. Machiavelli, Nicolo (1 items); 81. Marx, Karl (2 items); 82. Melville, Herman (4 items); 83. Mill, John Stuart (4 items); 84. Millay, Edna St. Vincent (1 items); 85. Milton, John (30 items); 86. Montaigne, Michel (1 items); 87. Moore, Clement Clarke (1 items); 88. More, Thomas (1 items); 89. Morley, Christopher (1 items); 90. Nietzsche, Friedrich (1 items); 91. Norris, Frank (1 items); 92. Orczy, Emmasku Orczy (1 items); 93. Paine, Thomas (4 items); 94. Pascal, Blaise (2 items); 95. Phillips, David Graham (1 items); 96. Plato (24 items); 97. Plotinus (1 items); 98. Poe, Edgar Allen (124 items); 99. Porter, Eleanor H. (1 items); 100. Prescott, William Hickling (1 items); 101. Rinehart, Mary Roberts (1 items); 102. Rousseau, Jean-Jacques (2 items); 103. Saki (6 items); 104. Sandburg, Carl (2 items); 105. Sauer, Geoffrey (1 items); 106. Scott, Walter, Sir (3 items); 107. Shakespeare, William (39 items); 108. Shelley, Mary Wollstonecraft (1 items); 109. Smith, Adam (1 items); 110. Spenser, Edmund (1 items); 111. Spinoza, Benedict De (4 items); 112. Stevenson, Robert Louis (23 items); 113. Stoker, Bram (2 items); 114. Stratton-Porter, Gene (4 items); 115. Swift, Jonathan (2 items); 116. Tennyson, Alfred (1 items); 117. Thoreau, Henry David (5 items); 118. Trollope, Anthony (1 items); 119. Twain, Mark (19 items); 120. Voltaire (1 items); 121. Wallace, Lew (1 items); 122. Washington, Booker T. (1 items); 123. Wells, H. G. (3 items); 124. Whit e, Andrew Dickson (1 items); 125. Whitman, Walt (1 items); 126. Wilde, Oscar (17 items); 127. Williams, Bill (1 items); 128. Wollstonecraft, Mary (2 items); 129. Wright, Harold Bell (1 items).

Als ik hier Berkeley aanklik, krijg ik de lijst van de werken van deze auteur die in de database zijn opgenomen. Ik kies voor Treatise Concerning The Principles Of Human Knowledge, en ik krijg nu drie mogelijkheden: het werk downloaden als tekst (text formaat), het werk reeds als een boek gepagineerd opvragen (in PDF formaat), of de software gebruiken die de concordanties blootlegt.

Onder "concordantie" verstaat men in traditionele zin een alfabetische lijst van alle in één of meer werken van een auteur gebruikte woorden, vergezeld van een korte co-tekst die aangeeft in welke passages ze voorkomen. In de elektronische versie zijn concordanties geen alfabetische lijsten, die hier niet vereist zijn, maar zoekmachines die als resultaat een lijst van co-teksten opleveren waarvan een "string" in een tekst of corpus voorkomt.

Als ik klik op "use concordance" en in het volgende scherm waarin het veld "word" voorkomt het woord "sign" invoer, krijg ik de volgende resultaten:

...general by being made the sign, not of an abstract general idea, but...

...which taken absolutely is particular, by being a sign is made general.

And as the former owes its generality not to its being the sign of an abstract or general line...

...the relation of cause and effect, but only of a mark or sign with the thing signified.

In like manner the noise that I hear is not the effect of this or that motion or collision of the ambient bodies, but the sign thereof.

Ik kan dus een programma gebruiken voor het raadplegen van de door de site zelf geleverde concordanties en on line over de resultaten beschikken, ook zonder de tekst van Berkeley op mijn computer te laden. Het behoeft geen toelichting dat deze service zeer nuttig is.

Op het adres :

http://www.ruf.rice.edu/~barlow/corpus.html2 bevindt zich de pagina met de naam Corpus Linguistics. Het gaat hier om een metasite, daar hij links bevat naar corpora in de hele wereld. Vanuit deze pagina kan men informatie ontvangen over de op het internet aanwezige corpora, onderverdeeld naar taal. Als we klikken op "English", krijgen we een lijst van Engelstalige corpora. De eerst vermelde is het American National Corpus, dat in opzet is geënt op het British National Corpus, maar zich nog in de fase van opbouw bevindt en waarvan tot nu toe alleen een zogenaamde bèta-versie voorhanden is (een niet beproefde en provisorische versie).

Een van de belangrijkste links is het Project Gutenberg, met als adres:

http://www.promo.net/pg/index.html.

Op de homepage vinden we zoekvensters zowel op auteur als op trefwoord, en bovendien verschillende links naar de pagina’s waarop lijsten van auteurs en werken zijn te vinden. Het repertorium omvat totaal meer dan tweeduizend schrijvers van verschillende nationaliteiten.

Als we bijvoorbeeld de naam "Tolstoy" invoeren (de namen dienen uiteraard in hun Engelse versie te worden gespeld), krijgen we een lijst van negentien werken van Lev Nikolajitsch Tolstoj, alle in het Engels, die u gratis kunt downloaden. Deze site heeft geen zoekmachines die het mogelijk maken om rechtstreeks en on line concordanties te zoeken.

In de volgende les zullen we ons bezighouden met andere hulpmiddelen voor vertalers op het internet.

 

Bibliografische verwijzingen

Alex Catalogue of Electronic Texts is beschikbaar op het world wide web op het adres http://www.infomotions.com/alex/ geraadpleegd op 17 april 2004.

Corpus Linguistics is beschikbaar op het world wide web op het adres

http://www.ruf.rice.edu/~barlow/corpus.html geraadpleegd op 17 april 2004.

FREUD SIGMUND, Die Traumdeutung (1902),

Frankfurt am Main, Fischer Taschenbuch Verlag, 1991 (Zwölfte, unveränderte Auflage 2005) ISBN 3-596-10436-X

FREUD SIGMUND The Interpretation Of Dreams translated by A. A. Brill London G. Allen & company 1913.

Project Gutenberg is beschikbaar op het world wide web op het adres

http://www.promo.net/pg/index.html geraadpleegd op 17 april 2004.


1 Freud 1991: 431.
2 Het is de vertaler niet gelukt deze site op zijn computer te openen. HomeTerugVooruit