"La distinta ordenación adoptada por el material de representaciones en el sueño hace a éste intraducible para la consciencia despierta"1.
En la unidad anterior hemos visto algunas funciones del motor de búsqueda Google. Por encima de todo, he ampliado las posibilidades que ofrecen las herramientas lingüísticas de Google.
Los razonamientos expresados en la unidad anterior tienen en cuenta la frecuencia de uso de determinadas palabras o combinaciones de palabras. Para esto es necesario contemplar Internet como un corpus. Sin embargo, se debe recordar que Internet es un corpus que se crea cada minuto de manera espontánea, gracias a la interacción de todas las personas dispuestas a participar. Por lo tanto, no muestra todas las características de un corpus tal como se entiende en la investigación lingüística, es decir, no está equilibrado, como sucede en casos como el del British National Corpus, no hay incorporación artificial de la palabra hablada, de la palabra escrita, de registros altos, registros bajos, etc. El resultado que se obtiene es del todo improvisado.
Esto no quiere decir que no sea útil. Los registros científicos elevados suelen estar bastante bien representados. No olvidemos que la comunidad científica internacional fue de las primeras en entender las posibilidades de comunicación de Internet y en utilizarlas para anticipar, y a veces sustituir, las publicaciones impresas, acelerando en gran medida el avance del debate científico.
Los registros medios y bajos también están bien representados. Internet tiene la característica de ser un "lugar" en el que se puede publicar sin filtros. Esto confiere al medio un fuerte carácter democrático, ya que tales filtros pueden ser a veces instrumentos de censura. Por otra parte, esto también significa que cualquier persona capaz de leer y escribir disponga de la posibilidad concreta -con independencia de su nivel de instrucción y tipo de formación- de publicar sus escritos sin la mediación de un redactor.
Esto distingue a Internet de cualquier otro medio. Por ejemplo, si un periódico publica las cartas de los lectores, la redacción puede intervenir para corregir la forma, si no el contenido, por lo que no se puede decir que lo que se publica es exactamente lo que se recibió del lector. Además, el lector del periódico suele tener una educación superior a la media. Cuando alguien escribe una carta a un periódico, con la esperanza de que se publique, intenta redactarla de la mejor manera posible.
Por el contrario, es cierto que en Internet uno pone lo que "dice" a disposición de todo el mundo, pero también que es menos visible al estar oculto por millones de otros datos disponibles. El hecho es que quien quiera expresarse se siente muy libre de hacerlo como quiera, incluso recurriendo a la jerga o con expresiones típicas del lenguaje hablado, ya que la utilización del canal escrito suele deberse a la necesidad y no a una elección.
Así pues, tanto por la ausencia de un filtro de depuración (no necesariamente de censura) como de un contexto que obligue a adoptar un estilo formal, en Internet se encuentran expresiones muy heterogéneas que confieren al medio un gran interés en el plano lingüístico.
Es muy importante tener en cuenta, en especial cuando los resultados de la búsqueda son escasos, el sitio en que se encuentra la información, con el fin de atribuir diversos grados de credibilidad dependiendo del caso. Por ejemplo, si busco el nombre científico de una planta, es evidente que un sitio universitario o de un jardín botánico me resultarán más útiles que una página no profesional en la que usuarios normales comparten experiencias y consejos sobre jardinería. Si busco el nombre oficial de una institución, obviamente me fiaré más del sitio de otra institución, y aún más si pertenece al mismo país que el organismo del que busco información.
La presencia en Internet de indicaciones debidas a la espontaneidad con que se forma este corpus también le otorgan características que pueden utilizarse en beneficio de quien realiza la búsqueda. Supongamos que alguien duda sobre el empleo de una preposición, por ejemplo, de la palabra italiana "vicino". Probaré introduciendo la palabra en el motor de búsqueda.
Lo primero que observo al ver los resultados es que debo limitar la búsqueda a los sitios en italiano, ya que los primeros que aparecen son en inglés y situados en Estados Unidos, por lo que carecen de interés para lo que necesito. Por lo tanto, pulso en "Herramientas del idioma" , elijo sitios en italiano y repito la búsqueda.
Mi siguiente problema es que la palabra aparece muchas veces como adjetivo o adverbio, lo cual no me interesa. ¿Cómo puedo eliminar esos casos de mi búsqueda?
Mi duda es que he encontrado, en expresiones de lugar, la palabra "vicino" seguida de "a" y del nombre siguiente. Por ejemplo, "vicino Perugia" y "vicino a Perugia", y deseo averiguar cuál es el caso más utilizado. Introduzco el texto completo incluido el nombre de una ciudad entre comillas en la casilla de búsqueda, que en la sintaxis de Google significa "palabras en este orden exacto". O, si no recuerdo que debo utilizar comillas, escribo el texto en la casilla que indica "Buscar resultados con la frase exacta". En este caso:
«vicino a Perugia» ofrece 307 resultados.
«vicino Perugia» ofrece 277.
A partir de ese resultado podría deducir que las dos versiones se utilizan de manera indistinta. Sin embargo, cuando uno visita Lombardía, casi nunca oye la palabra "vicino" utilizada como preposición, sino la frase preposicional "vicino a". Es posible, por lo tanto, que existan localismos al respecto. Para comprobarlo, improviso una hipótesis. Es más probable que la expresión "cerca de la ciudad X" la utilice la gente que vive cerca de la ciudad X. Para corroborar la hipótesis introduzco cuatro textos distintos en la casilla de búsqueda:
vicino a Milano
vicino Milano
vicino a Roma
vicino Roma
Este es el resultado:
«vicino a Milano» 3110 resultados
«vicino Milano» 1580 resultados
«vicino a Roma» 1750 resultados
«vicino Roma» 3230 resultados
Esos resultados dejan algunos elementos en claro. El primero es que en la zona de Milán, tal como sospechaba, impera la frase "vicino a". La segunda es que en la región de Roma la situación es inversa, prevalece el uso de "vicino" como preposición de lugar. El primer resultado, referido a "Perugia", era una paridad falsa, debida al hecho de que tal vez la zona de Perugia reciba una influencia equivalente del Norte y de Roma.
Es una información mucho más rica que la que puede brindarme un diccionario (que me indica que la preposición "vicino" no existe, que sólo hay una frase preposicional, "vicino a"). Ahora sé que en la zona de Roma (un vistazo a los sitios que se obtienen al buscar "vicino Roma" confirma que se encuentran mayormente en esa zona) tienden a usar con frecuencia esa expresión. La respuesta que ofrece un diccionario no siempre es suficiente para un traductor, en ciertos casos debe saber si una expresión determinada es típica de algunas zonas, y si es posible, de qué zonas.
En la próxima unidad continuaremos analizando las posibilidades de los motores de búsqueda.