Diccionarios orales de lenguas en extinción

Photograph by Gurmeet Singh

Muchas de las 7.000 lenguas que se hablan todavía en el mundo nunca han sido grabadas ni recogidas en un diccionario. Apenas tienen hablantes y están en peligro de extinción, como tantas especies animales y vegetales. La mitad de ellas dejarán probablemente de hablarse en 2100 (las matemáticas dicen que cada dos semanas muere una lengua). Son víctimas, por condensarlo irónicamente en una sola palabra, del progreso.

Lamentablemente, no sabemos cómo se pronunciaba el latín del Imperio Romano, pero todavía estamos a tiempo de recoger las voces de los últimos hablantes de las lenguas más amenazadas. El pasado 17 de febrero, en el transcurso de la reunión anual de la American Association for the Avancement of Science (AAAS),  vieron la luz ocho diccionarios orales que recogen en total más de 32.000 palabras, acompañadas en muchos casos de fotografías, y con más de 24.000 grabaciones sonoras de hablantes nativos pronunciando palabras y frases.

Estos diccionarios orales son resultado del proyecto Enduring Voices de National Geographic, dirigido por los lingüistas Gregory Anderson y David Harrison, una ambiciosa iniciativa conservacionista impulsada en colaboración con el Living Tongues Institute for Endangered Languages.

El conservacionismo del patrimonio biológico y el de las lenguas están más relacionados de lo que parece, entre otras cosas porque una parte importante del conocimiento del medio natural está codificado en las lenguas amenazadas. Como el oso polar o el lince, las voces recogidas en estos diccionarios orales tienen la frágil belleza de una criatura viva que puede desaparecer.

Estos son tres de los diccionarios orales presentados, que vale la pena consultar/escuchar:

Diccionario de chamacoco: una lengua del norte de Paraguay, hablada todavía por 1.200 personas. El diccionario tiene 912 entradas y otras tantas grabaciones sonoras.

Diccionario de sora: una lengua tribal de la India (453 entradas y 453 grabaciones).

Diccionario de tuvan: una lengua indígena hablada por nómadas de Siberia y Mongolia. Tiene 7.459 entradas, 2.972 grabaciones y 49 imágenes.

(El proyecto Enduring Voices tiene un canal en YouTube)

Foto: Equipo de Enduring Voices en India con un hablante de aka. / Nationa Geographic / Gurmeet Singh

Anuncios

¿Dónde nos hicimos verbívoros?

Nos alimentamos de palabras que metabolizamos en preguntas y respuestas

Las preguntas se amontonan y empujan unas a otras: ¿Por qué los humanos tenemos lenguaje? ¿Para qué desarrollamos un sistema tan complejo y creativo, sin parangón en el reino animal? ¿Cómo empezó todo? ¿Y dónde? Para quien crea que las respuestas importan más que las preguntas, hay que decirlo pronto y claro: no lo sabemos. Y en este plural hay que incluir a lingüistas, antropólogos culturales y de los otros, etólogos, genetistas y biólogos evolucionistas, científicos cognitivos y neurocientíficos, más otras yerbas raras e híbridos investigadores.

La discusión sobre el origen del lenguaje puede ser de lo más entretenida, y así ha sido desde Grecia. Mucho de lo que se ha escrito sobre estas cuestiones se caracteriza por ser pura especulación, muy elegante en el mejor de los casos, pero carente de pruebas empíricas. El estudio lingüístico de los patrones geográficos de la diversidad lingüística tiene sus limitaciones, y la entrada en escena de otros investigadores, como los estudiosos de los genes o del protolenguaje animal, ha ampliado mucho el campo de trabajo, aunque sin claros beneficios por el momento.

Pongamos un ejemplo. El 11 de abril de 2011, el psicólogo y antropólogo cultural Quentin Atkinson dejó boquiabiertos a científicos y lingüistas al afirmar en la influyente revista científica Science (uno de los dos templos de la ciencia, junto con Nature), que la cuna de la actual diversidad lingüística podría localizarse en el suroeste de África. Sus “pruebas” surgían del análisis comparativo del número de fonemas de 500 lenguas usadas actualmente (Phonemic diversity supports a serial founder effect model of language expansion from Africa).

Como la polémica estaba servida, el pasado 10 de febrero, el grupo de Michael Cysouw, del departamento de Lenguage y Genética de la Ludwig Maximilian University en Munich, criticaba en la misma revista las conclusiones de Atkinson calificándolas de “artefacto” por sus datos poco apropiados, su metodología sesgada y sus suposiciones sin justificar (Comment on “Phonemic Diversity Supports a Serial Founder Effect Model of Language Expansion from Africa”). Aplicando dicha metodología, replicaba, el lenguaje podía haber surgido en el este de África,  en el Cáucaso o en otra parte bien distinta.

El lenguaje es, ciertamente, un hueso muy duro de roer para los investigadores de la evolución humana. ¿Surgió de forma gradual o súbita? ¿Como evolución del lenguaje corporal o como habla propiamente dicha? ¿Cómo consecuencia de la evolución genética o de la evolución cultural?  ¿Cómo adaptación o como mero subproducto?

La evolución, sospechamos, no tiene un plan definido, sino que está gobernada por el azar. El caso es que, sin saber muy bien cómo, cuándo, dónde y por qué, nos hemos hecho verbívoros. Y, claro, quien se alimenta de palabras no puede evitar metabolizarlas en preguntas y respuestas, según las preferencias metabólicas (léase, culturales) de cada cual.

Foto: eyesplash / Flickr


¿De qué depende la longitud de las palabras?

Sobre la revisión de la ley de Zipf y la comunicación eficiente

Durante muchos años, los lingüistas han mantenido que la longitud de las palabras está relacionada con su frecuencia de uso. Las más cortas tienden a ser las más habituales, y viceversa. Pensemos en los “de”, “a”, “y”, “el”, “que” y en tantos otros cortísimos vocablos que pueblan un texto cualquiera o una conversación. Y reparemos en la rareza de las palabras que tienen más de 15 o 20 letras. Tetrametildiaminodifenilsulfonas, con sus 32 letras, una detrás de otra, pasa por ser la más larga en español, como nos contaba Eumanista en su muy recomendable post Cómo de larga la tenemos, la palabra.

Está claro que utilizamos mucho más las palabras cortas que las largas, pero el primero en darse cuenta –y formularlo matemáticamente– de que existía una asociación entre la frecuencia de uso y la longitud de las palabras fue George K. Zipf. Este lingüista y filólogo de Harvard, que enunció en 1935 la ley empírica que lleva su nombre, sostenía que tendemos a acortar las palabras más usadas para ahorrar tiempo al hablar y al escribir.

El lenguaje es sin duda un buen ejemplo de este principio del mínimo esfuerzo de Zipf , “un principio que –como él decía y sabemos por experiencia– gobierna toda nuestra vida individual y colectiva”.

Quizá por eso durante los últimos 75 años nadie ha cuestionado (con pruebas científicas, se entiende) la ley de Zipf. El año pasado, sin embargo, un grupo de investigadores del Massachusetts Institute of Technology (MIT) publicó un trabajo que mostraba que la longitud de una palabra está más estrechamente relacionada con la cantidad de información que contiene que con su frecuencia de uso.

La publicación de este artículo (Word lengths are optimized for efficient communication) en la prestigiosa revista científica Proceedings of the National Academy of Sciences (PNAS) es todo un aval para el planteamiento de Steven T. Piantadosi, Harry Tily y Edward Gibson, aunque el cálculo de la “cantidad de información” es posiblemente su punto más cuestionable.

¿Cómo se puede medir la “cantidad de información” que contiene una palabra? Los autores asumen que una palabra es tanto más informativa cuanto más impredecible resulta, y utilizan una fórmula matemática para calcular la predictibilidad de las palabras en una decena de idiomas, entre ellos el español.

Los resultados de esta investigación indican que las palabras más cortas no son simplemente las más frecuentes, sino –lo que es más importante– las menos informativas y las más predecibles. El tamaño de las palabras parece estar optimizado para garantizar una comunicación más eficiente. Esto deberá ser estudiado por otros investigadores, pero de momento lo que ya conseguido el grupo de Piantadosi es cuestionar la ley de Zipf y obligarnos a pensar sobre el tamaño de las palabras.

Foto: Andrés Nieto Porras / Flickr


La selección sonora

Las palabras que mejor suenan son las que sobreviven

El lenguaje, como los organismos vivos, también parece estar sometido a las fuerzas de la selección natural.  Continuamente se están creando palabras nuevas en todas las lenguas, pero sólo las más aptas sobreviven. Una de las fuerzas principales que selecciona los vocablos que se incorporarán a una lengua y se mantendrán a lo largo del tiempo es la sonoridad. Hay otros factores que influyen, es verdad, como la simple desaparición de los objetos que designan estas palabras (¿quién usa hoy, por ejemplo, magnetofón?), pero las palabras que suenan mejor a los oídos de los hablantes tienen mejor porvenir.

Cada lengua tiene sus propias reglas para la formación de palabras, sus restricciones a la hora de juntar fonemas, y esto se aprecia en el sonido inconfundible de un habla, en su prosodia y musicalidad características. Hay palabras que son, sencillamente, imposibles o muy improbables en un idioma, como está poniendo de relieve la fonotáctica, un área de la lingüística de reciente creación que estudia la frecuencia de las sucesiones fonémicas en las distintas lenguas.

La creación de vocablos compuestos permitiría en principio saltarse las reglas internas de emparejamiento de fonemas, pero a la postre estas palabras acaban condenadas a la marginalidad, ya sea en el inglés o en el navajo, como ha puesto de manifiesto un estudio publicado en el número de diciembre de 2011 de la revista Language, de la Linguistic Society of America (Grammars leak: modeling howphonotactic generalizations interact within the grammar).

Andrew Martin, investigador del Laboratory for Language Development en el Riken Brain Science Institute en Saitama (Japón) y autor de este estudio, muestra en su artículo que los hablantes ingleses tienden a evitar palabras compuestas como bookcase, que juntan en un vocablo dos fonemas /k/, y su análisis confirma que las palabras de este tipo están infrarrepresentadas en el lexicón inglés.

Ya sea en inglés o en español, las palabras que contravienen las reglas de la fonotáctica son más bien raras. La selección sonora va en su contra. Y esto es algo que se debe tener muy en cuenta en el procesamiento del lenguaje natural.

Foto: sergi blog/ Flickr


Los oyentes necesitan los “eeeh”

La presencia de disfluencias en el habla facilita la comprensión y el recuerdo

Las muletillas sonoras sin significado que encontramos en el habla espontánea, como los típicos “eeeh” o “mmmh”, son un recurso habitual para hilvanar el pensamiento con palabras. Estas disfluencias nos permiten ganar tiempo pero parece que afean y ralentizan el discurso. De hecho, cualquier profesor de oratoria abogaría por un discurso fluido y sin interrupciones para ganar eficacia. Sin embargo, parece que esto no es así y que estas pausas ayudan a los oyentes a recordar mejor lo que se ha dicho.

Los resultados de un estudio publicado el año pasado en el Journal of Memory and Language (The disfluent discourse: Effects of filled pauses on recall, doi:10.1016/j.jml.2011.03.004) por Scott H. Fraundorf y Duane G. Watson, de la University of Illinois (EE UU), indican que estas muletillas (speech fillers) facilitan la comprensión y el recuerdo; y de paso, ofrecen algunas pistas para entender mejor el sentido de estas vacilaciones.

En un primer experimento, realizado con la lectura de textos de Alicia en el país de las maravillas salpimentados con interrupciones varias, los autores comprobaron que el beneficio de los “eeeh” y los “mmmh” no parece estar relacionado con la simple ganancia de tiempo: mientras las interrupciones del discurso por estas muletillas facilitaban el recuerdo, las interrupciones por toses lo entorpecían.

¿Por qué, entonces, los “eeeh” y “mmmh” mejoran la transmisión de un mensaje oral? Los resultados de un segundo experimento, en el que se manipuló intencionadamente la ubicación de las muletillas, sugieren que estas pausas podrían potenciar y orientar la atención del oyente. De momento, son sólo hipótesis, pero los oradores, profesores de oratoria y desarrolladores de lenguaje natural para las máquinas deberían tomar buena nota.

Foto: comedy_nose / Flickr


El peso de la lingüística

Los estudios sobre la lengua representan un tercio de la producción española en el área de humanidades

La literatura “científica” sobre artes y humanidades ocupa un espacio menor en el contexto de la producción científica española. En el periodo 2009-2010, los 837 trabajos publicados en este área en revistas indexadas en la base de datos Scopus son muy poca cosa comparados, por ejemplo, con los 15.839 publicados en medicina o los 6.421 en biología.  (El volumen de las circunferencias de las figuras es proporcional al número de documentos).

Ahora bien, de estos 837 documentos, el 30% (255) son estudios de lingüística, lo que indica que esta subcategoría es junto con la historia (259 documentos) la más productiva en el área de las artes y las humanidades. Por número de citas y de citas por documento, la lingüística española es junto con la historia la disciplina más relevante, según los datos generados por el SCImago Research Group.

¿Cómo hay que tomarse estos datos? Como ocurre con todo tipo de estadísticas, los números cantan canciones muy diferentes. Hoy hemos puesto una melodía que a algunos les puede resultar animosa.


¡Coño!


Los tacos son un analgésico lingüístico muy bien preservado en el cerebro humano

La capacidad de decir tacos está selectivamente preservada en nuestro cerebro. Curiosamente, las personas que pierden la capacidad normal de hablar o entender el lenguaje, como consecuencia de un ictus, un traumatismo u otras lesiones cerebrales, a menudo mantienen intacta su capacidad de maldecir. Es como si nuestra disposición a soltar juramentos estuviese más arraigada en el cerebro que la de nombrar. Y es que, para las ciencias de la mente y el lenguaje, las palabras malsonantes son una caja negra o al menos una caja de sorpresas.

Si una lengua es una forma de unir el sonido con el significado, en el caso de los tacos parece haber una conexión especial y especialmente intensa. En mayor o menor medida, todo el mundo dice tacos, tanto cuando está con otros como a solas; de hecho, la afirmación “a veces digo palabrotas” se usa como control en los test de personalidad para ver si un individuo miente.

¿Por qué cuando nos damos un golpe o nos ocurre algún percance las palabras que salen por nuestra boca se centran mayormente en tres temas: sexo, excrementos y dios? La cuestión tiene más espesor del que parece a primera vista, pues los tabúes están incrustados en la complejidad de las relaciones sociales y en los pliegues más recónditos de nuestro cerebro emocional. Su abordaje se puede hacer desde muy diversas disciplinas, pero hay una línea de investigación que ha aportado una respuesta curiosa: soltamos tacos, entre otras cosas,  porque eso nos alivia el dolor.

El psicólogo británico Richard Stephens, de la Keele University, publicó en 2009, en la revista Neuroreport, un trabajo (Swearing as a response to pain) en el que apuntaba que decir juramentos aumentaba la tolerancia al dolor (además de aumentar la frecuencia cardiaca). El experimentó consistió en estudiar el tiempo que un pequeño grupo de voluntarios resistía el dolor causado por meter la mano en hielo, y resultó que los que soltaban tacos y maldiciones aguantaban más y tenían una menor percepción del dolor, en relación con los que aguantaban con la boca cerrada.

En una investigación complementaria, el mismo equipo ha comprobado que este efecto analgésico del taco es más acusado en aquellas personas que normalmente dicen menos palabrotas. Este estudio, publicado en diciembre de 2011 en The Journal of Pain (Swearing as a Response to Pain—Effect of Daily Swearing Frequency), viene a decir que existe un efecto de tolerancia ante este analgésico lingüístico, como ocurre en general con los fármacos contra el dolor.

Soltar tacos nos vuelve quizá más tolerantes al dolor y más agresivos, y nos coloca en una posición favorable para una reacción de lucha o huida, que debían de ser el pan de cada día en la época del hombre de las cavernas cuando despuntaba el lenguaje y quedaban milenios para inventar el pan. Este tipo de interpretaciones hacen sin duda las delicias de los psicólogos y psicolingüistas evolutivos, para quienes la evolución es la clave de todo, pero los tacos y las palabras tabú son actualmente un buen desafío para traductores, lingüistas computacionales y estudiosos del lenguaje en general, por lo que merecen contemplarse desde otras perspectivas. Así que volveré sobre ellas.

Foto: bonus1up / Flickr