Todos los nombres

Sobre la ilimitada capacidad de nombrar y el uso de los nombres propios

Una parte importante de nuestro vocabulario queda fuera del diccionario. Los nombres de personas, lugares, animales, empresas y otros objetos no están en el diccionario porque, en principio, carecen de significado (otra cosa es que el nombre propio coincida con un nombre común, ya sea Zapatero o Bush). No son conceptos genéricos sino nombres de realidades únicas: África, Apple, Chuchi (otra cosa es que pueda haber diferentes realidades únicas con el mismo nombre).

Los diccionarios son muy sensatos al dar solo entrada a los nombres comunes. El genio propio de las lenguas ya se encarga de limitar la creación de palabras a los conceptos que son mínimamente frecuentes o máximamente infrecuentes, como dice aforísticamente Jorge Wagensberg. Existe la palabra huérfano porque no es ni muy frecuente ni muy infrecuente, pero no existe una palabra para designar a quien ha perdido a su abuelo (demasiado frecuente) o a quien todavía no ha perdido a su bisabuelo (demasiado infrecuente). Pero, ¿qué limites hay para crear nombres propios?

Nadie tiene ni idea de cuántos nombres propios puede haber, incluso en una lengua concreta. Existe la hipótesis, no confirmada, de que conocemos más nombres propios que nombres comunes. Pudiera ser. Entre los residentes en España, según del Instituto Nacional de Estadística (INE), hay más de 25.000 nombres de varón y casi otros tantos de mujer (excluyendo aquellos tan raros que los llevan menos de 20 personas). Curiosear por la página web del INE dedicada a los nombres y apellidos de los residentes en España no tiene desperdicio.

Los nombres más frecuentes en España no son ninguna sorpresa: en varones, Antonio (765.138) y José (706.051), y en mujeres, María [del] Carmen (681.108) y María (668.112), aunque si se incluyen los nombres simples y los compuestos, más de la cuarta parte de las mujeres españolas se llaman María (6.424.495). Las perlas aparecen en la zona de los nombres raros: Víctor Jacinto, Venancio Jesús, Victoria Virginia o Ramona Simona, que sólo llevan una veintena de personas.

Entre los nombres más raros hay algunos en vías de extinción, dada la edad media de sus portadores. Hay solo 24 mujeres que se llaman Canuta (con una edad media de 80,9 años), y las 21 que se llaman Decorosa tienen de media 79 años. Entre los varones, por citar sólo un par, hay 32 que se llaman Progreso y 27 Euquerio, ambos con edades medias de más de 70. Abundio, con 702 hombres tocados por este nombre de pila, es otro de los que tienen una edad media más avanzada (72,3).

“Conoces el nombre que te dieron, no conoces el nombre que tienes”, reza la cita ficticia del ficticio Libro de las evidencias que abre la novela Todos los nombres de José Saramago. ¿Qué sabemos de los nombres propios? ¿Cómo se forman? ¿Qué factores determinan el nombre propio que damos a las personas y las cosas? Corre la historia de que en algunos países de Latinoamérica han hecho cierta fortuna nombres como Usnavy, Usmail, Yulaisi o Yulernin, pero sea o no cierta, ilustra muy bien la ilimitada capacidad de crear nombres propios. Y muestra también que toda esta parte importante de nuestro vocabulario sigue siendo una asignatura pendiente para la investigación lingüística y sociolingüística.

Foto: Aguarate / Flickr


Fenómenos TOT

Sobre el desacoplamiento entre sonido y significado de una palabra

Sabemos por qué letra empieza o quizá cuántas sílabas tiene. Podemos incluso invocar otra palabra con un sonido o significado similar, pero la que buscamos se nos ha quedado atascada en la punta de la lengua y no acaba de salir. Esta frustrante situación, conocida en la bibliografía internacional como fenómeno TOT (tip-of-the-tongue), es relativamente habitual y se relaciona sobre todo con nombres propios y palabras que no se pronuncian habitualmente.

El candidato republicano a la presidencia de Estados Unidos Rick Perry se quedó apeado de la carrera presidencial por un triste TOT en un debate televisivo. Estaba explicando ante las cámaras que cuando fuera presidente eliminaría tres agencias gubernamentales: la de comercio, la de educación, y la de… Y ahí se quedó. Lo intentó varias veces durante casi un minuto interminable pero fue incapaz de pronunciar la palabra que su cerebro pretendía recuperar: energía.

Aunque el fenómeno TOT ha sido estudiada durante medio siglo, no acaba de ser entendido completamente por la neurociencia. La investigación experimental indica que, a la hora de pronunciar una palabra, primero recuperamos o activamos su significado y luego recuperamos o activamos su sonido. Lo que ocurre cuando se nos queda encallada una palabra en la punta de la lengua es que tenemos el significado, pero nos falta su sonido. La teoría más plausible indica que esto ocurre porque otros sonidos bloquean el que queremos pronunciar.

¿Qué le pasó entonces al cerebro de Rick Perry? Lo más probable, según la psicolingüista Gail Mauner, es que el bloqueo inicial se agravara cuando su contrincante Mitt Romney le echó un cable sugiriéndole que esa tercera agencia podría ser la EPA (Environmental Protection Agency). Al pronunciar el sonido “EPA” y activar en la mente de Perry otros sonidos similares le resultó imposible llegar hasta el sonido de “energy” que andaba buscando.

Cuando una palabra no se pronuncia habitualmente, la conexión entre significado y sonido puede ser débil. Y como esa palabra o palabras apenas se usan, la conexión entre significado y sonido puede verse interferida fácilmente por la activación residual de sonidos que se han producido recientemente.

Los estudios realizados muestran que el fenómeno TOT ocurre a todas las edades pero es más frecuente en las personas mayores de 50 años que en los jóvenes. Y la única manera de prevenirlo es usar y usar el lenguaje, leer para incorporar palabras nuevas, poner en circulación las que conocemos y jugar con ellas. Por ejemplo, cuaicapeando con el Dr. Cuaicap.

Foto: Geekr / Flickr


La ventajosa ambigüedad de las palabras

La polisemia facilita la comunicación humana pero se atraganta en las máquinas

En un escenario de comunicación ideal no debería haber espacio para la ambigüedad. Cada palabra debería tener un significado y sólo uno. Así, sin los quebraderos de cabeza de la polisemia y otras ambigüedades, cabe imaginar que sería mucho más fácil entenderse. Pero este es un escenario que afecta sólo a las máquinas, que toleran muy mal la ambigüedad. En Google, la Wikipedia y otros artefactos que procesan el lenguaje, ante la primera encrucijada semántica lo primero que hay que hacer es eliminar la ambigüedad (desambiguation), algo que las personas hacemos de forma natural y sin esfuerzo mediante el contexto.

¿Por qué todas lenguas tienen tantas palabras con múltiples significados? Pensemos, por ejemplo, en el verbo “pasar”, en el adjetivo “bajo”, en el sustantivo “pie” y en tantas otras palabras con decenas de significados diferentes. Si tenemos lenguas tan ambiguas es, probablemente, porque esto es lo más eficaz para comunicarse. Al hablante le interesa ser lo más eficaz posible: comunicar con un mínimo de  palabras y de esfuerzo, mientras que el oyente pretende entender correctamente lo que le dice el hablante.

En la comunicación humana, la ambigüedad no sólo no representa ningún problema, sino que es una ventaja. Esto es lo que argumenta un grupo de investigadores en un trabajo recién publicado en la revista Cognition.  En su artículo The communicative function of ambiguity in language sostienen que la ambigüedad del lenguaje es lo permite utilizar y reutilizar las palabras más eficaces, es decir, aquellas que tienen menos sílabas y una pronunciación clara.

Las lenguas, o más bien los cerebros de los hablantes, saben muy bien lo que se hacen, y por eso es mucho más ambiguo el verbo “poner” que el verbo, pongamos por caso, “desvencijar”. Los autores del trabajo de Cognition (Steven Piantadosi, Harry Tily y Edward Gibson) han confirmado en corpus de tres lenguas diferentes (inglés, alemán y holandés) que, efectivamente, las palabras más cortas, más usadas y de más fácil pronunciación son las que tienen más probabilidades de ser ambiguas.

Cognitivamente resulta más económico inferir el significado a partir del contexto que gastar tiempo en largas y complicadas sentencias para precisar lo que se quiere decir. La ambigüedad del lenguaje parece ser, por tanto, una gran ventaja para comunicarse entre personas. El desafío está ahora en que las máquinas sean también capaces de lidiar con el contexto para dominar la ambigüedades del lenguaje.

Foto: kiwaja / Flickr


Diccionarios orales de lenguas en extinción

Photograph by Gurmeet Singh

Muchas de las 7.000 lenguas que se hablan todavía en el mundo nunca han sido grabadas ni recogidas en un diccionario. Apenas tienen hablantes y están en peligro de extinción, como tantas especies animales y vegetales. La mitad de ellas dejarán probablemente de hablarse en 2100 (las matemáticas dicen que cada dos semanas muere una lengua). Son víctimas, por condensarlo irónicamente en una sola palabra, del progreso.

Lamentablemente, no sabemos cómo se pronunciaba el latín del Imperio Romano, pero todavía estamos a tiempo de recoger las voces de los últimos hablantes de las lenguas más amenazadas. El pasado 17 de febrero, en el transcurso de la reunión anual de la American Association for the Avancement of Science (AAAS),  vieron la luz ocho diccionarios orales que recogen en total más de 32.000 palabras, acompañadas en muchos casos de fotografías, y con más de 24.000 grabaciones sonoras de hablantes nativos pronunciando palabras y frases.

Estos diccionarios orales son resultado del proyecto Enduring Voices de National Geographic, dirigido por los lingüistas Gregory Anderson y David Harrison, una ambiciosa iniciativa conservacionista impulsada en colaboración con el Living Tongues Institute for Endangered Languages.

El conservacionismo del patrimonio biológico y el de las lenguas están más relacionados de lo que parece, entre otras cosas porque una parte importante del conocimiento del medio natural está codificado en las lenguas amenazadas. Como el oso polar o el lince, las voces recogidas en estos diccionarios orales tienen la frágil belleza de una criatura viva que puede desaparecer.

Estos son tres de los diccionarios orales presentados, que vale la pena consultar/escuchar:

Diccionario de chamacoco: una lengua del norte de Paraguay, hablada todavía por 1.200 personas. El diccionario tiene 912 entradas y otras tantas grabaciones sonoras.

Diccionario de sora: una lengua tribal de la India (453 entradas y 453 grabaciones).

Diccionario de tuvan: una lengua indígena hablada por nómadas de Siberia y Mongolia. Tiene 7.459 entradas, 2.972 grabaciones y 49 imágenes.

(El proyecto Enduring Voices tiene un canal en YouTube)

Foto: Equipo de Enduring Voices en India con un hablante de aka. / Nationa Geographic / Gurmeet Singh


¿De qué depende la longitud de las palabras?

Sobre la revisión de la ley de Zipf y la comunicación eficiente

Durante muchos años, los lingüistas han mantenido que la longitud de las palabras está relacionada con su frecuencia de uso. Las más cortas tienden a ser las más habituales, y viceversa. Pensemos en los “de”, “a”, “y”, “el”, “que” y en tantos otros cortísimos vocablos que pueblan un texto cualquiera o una conversación. Y reparemos en la rareza de las palabras que tienen más de 15 o 20 letras. Tetrametildiaminodifenilsulfonas, con sus 32 letras, una detrás de otra, pasa por ser la más larga en español, como nos contaba Eumanista en su muy recomendable post Cómo de larga la tenemos, la palabra.

Está claro que utilizamos mucho más las palabras cortas que las largas, pero el primero en darse cuenta –y formularlo matemáticamente– de que existía una asociación entre la frecuencia de uso y la longitud de las palabras fue George K. Zipf. Este lingüista y filólogo de Harvard, que enunció en 1935 la ley empírica que lleva su nombre, sostenía que tendemos a acortar las palabras más usadas para ahorrar tiempo al hablar y al escribir.

El lenguaje es sin duda un buen ejemplo de este principio del mínimo esfuerzo de Zipf , “un principio que –como él decía y sabemos por experiencia– gobierna toda nuestra vida individual y colectiva”.

Quizá por eso durante los últimos 75 años nadie ha cuestionado (con pruebas científicas, se entiende) la ley de Zipf. El año pasado, sin embargo, un grupo de investigadores del Massachusetts Institute of Technology (MIT) publicó un trabajo que mostraba que la longitud de una palabra está más estrechamente relacionada con la cantidad de información que contiene que con su frecuencia de uso.

La publicación de este artículo (Word lengths are optimized for efficient communication) en la prestigiosa revista científica Proceedings of the National Academy of Sciences (PNAS) es todo un aval para el planteamiento de Steven T. Piantadosi, Harry Tily y Edward Gibson, aunque el cálculo de la “cantidad de información” es posiblemente su punto más cuestionable.

¿Cómo se puede medir la “cantidad de información” que contiene una palabra? Los autores asumen que una palabra es tanto más informativa cuanto más impredecible resulta, y utilizan una fórmula matemática para calcular la predictibilidad de las palabras en una decena de idiomas, entre ellos el español.

Los resultados de esta investigación indican que las palabras más cortas no son simplemente las más frecuentes, sino –lo que es más importante– las menos informativas y las más predecibles. El tamaño de las palabras parece estar optimizado para garantizar una comunicación más eficiente. Esto deberá ser estudiado por otros investigadores, pero de momento lo que ya conseguido el grupo de Piantadosi es cuestionar la ley de Zipf y obligarnos a pensar sobre el tamaño de las palabras.

Foto: Andrés Nieto Porras / Flickr


Felices de palabra


A pesar de los pesares, las palabras más usadas son emocionalmente positivas

Un buen termómetro de la felicidad personal y social es el “valor emocional” de las palabras que usamos. Es decir, si predominan palabras negativas como guerra, paro, funeral, depresión o bien positivas, como paz, amor, cooperación, etcétera (por cierto, etcétera sería una palabra neutra). Para aclarar esta cuestión, un grupo de matemáticos de la University of Vermont (EE UU) tuvo la feliz idea de analizar el tono emocional de las palabras (en inglés) empleadas en Twitter, y descubrieron lo que cabía esperar: la felicidad global de los usuarios de esta red social había decaído en los últimos años.

El estudio (Temporal Patterns of Happiness and Information in a Global Social Network), publicado en el número del 7 de diciembre de la revista científica PLoS One, se realizó con nada menos que 46 billones (no billions) de palabras contenidos en 4,5 billones de tweets escritos por más de 63 millones de usuarios entre septiembre de 2008 y septiembre de 2011. Pero esta cantidad de datos no desalienta ni mucho menos a los investigadores, que han querido ir más allá en su análisis de la temperatura emocional de las palabras incluyendo además las contenidas en el periódico The New York Times, en el Google Books Project (con millones de libros que se remontan al año 1520) y en las letras de canciones del último medio siglo.

El análisis de las 5.000 palabras más frecuentes en estas cuatro fuentes muestra que en el idioma inglés hay una clara preponderancia de las palabras más felices y positivas, puntuadas de 1 a 9 por un grupo de voluntarios que participaron en el estudio. Así, por ejemplo, la puntuación media que recibió la palabra risa fue 8,50; comida, 7,44; camión, 5,48; codicia, 3,06 y terrorista, 1,30.  Está por ver cuales serían los resultados de una investigación similar realizada en español o en otro idioma, aunque los autores de este segundo estudio (Positivity of the English Languaje), publicado en el número del 11 de enero de 2012 de PLoS One, creen que este sesgo positivo es universal.

Esta tendencia universal a usar palabras positivas parece que tiene que ver con la naturaleza social del lenguaje, desarrollado a lo largo de un millón de años como vehículo de comunicación, cohesión y cooperación entre los humanos.  Utilizar palabras positivas no quiere decir que la realidad sea maravillosa, ni mucho menos, sino que el lenguaje es un artefacto social y que si uno quiere fomentar los vínculos sociales es mejor ser positivo. Quizá por eso, a pesar de todos los pesares y dificultades, el común de la gente sigue siendo optimista aun en las peores circunstancias. Al menos de palabra.

Imagen: Representación de las palabras de The New York Times en función de su frecuencia y valor de felicidad. / PLoS One (doi:10.1371/journal.pone.0029484)