El origen del lenguaje humano según Daniel Everett

Fuente de la Imagen de Cabecera: Diario The Times

En un artículo anterior (El lenguaje como la más importante de las construcciones culturales. La crítica de Everett a Chomsky ) resumimos la crítica culturalista que hace Daniel Everett a la teoría de Noam Chomsky sobre el origen del lenguaje como un sistema biológico especializado. En este segundo artículo, resumiremos con mayor detalle la propia teoría de Everett sobre dicho origen, tal como la argumenta en su libro “How Language Began” (Everett 2017).

En este libro, Everett utiliza la división tripartita que propuso Charles S. Peirce de las formas comunicativas (o signos): índices, iconos y símbolos. Un índice sería un signo no arbitrario y no intencional, como por ejemplo una huella de cierta forma en el suelo, que nos informa de que un caballo ha pasado por allí. Un icono sería un signo no arbitrario e intencionado, como el dibujo de una huella del casco para representar a un caballo.

Everett piensa que el Homo Erectus identificaba y daba valor a piedras que se parecían a cosas como un falo o una mujer, puesto que se han encontrado piedras con estas formas en sus lugares de habitación y enterramiento; y tales piedras no pertenecían al lugar geológico, luego habían sido transportadas allí. Esto indica abstracción y “desplazamiento”, en el sentido de que un objeto es identificado y usado para representar algo que no está físicamente presente. Según Everett, es plausible que algunos iconos utilizados por Homo Erectus se convirtieran en “símbolos”. En particular, algunos iconos sonoros se convirtieron en símbolos hablados.

Un símbolo, a diferencia de un icono, es un signo que ha perdido todo parecido con su referente. Un símbolo hablado sería pues un sonido arbitrario emitido por la garganta, para designar por ejemplo a un gato, que no se parece a ningún sonido que emita o acompañe a un gato. El gesto y la entonación habrían sido cruciales para que estos símbolos fueran comprendidos y usados. Mientras tanto, el cerebro y los órganos del habla evolucionaban para manejar expresiones cada vez más complejas. Esto se produjo probablemente acelerado por la presión de selección que introdujeron las nuevas prácticas culturales de comunicación, debido al efecto Baldwin (sobre coevolución genes-cultura, debido a la aparición de nuevos nichos, véase también: Construcción de Nicho).

En su libro, Everett (2017) propone tres etapas en el desarrollo del lenguaje humano. En la etapa G1, los verbos y palabras son colocados en orden lineal de un modo socialmente acostumbrado (por ejemplo, nombre-verbo-nombre), pero donde el significado preciso es ofrecido por el contexto. Por ejemplo, “María golpear Juan” podría significar, dependiendo del contexto, que María ha pegado a Juan, que María ha sido golpeada por Juan, que María ha chocado con Juan, etc. La interpretación de que María “fue chocada” o fue “golpeada” por Juan podría estar impedida por el orden de las palabras, o quizás no, dependiendo del uso social habitual de la expresión. Esta expectativa que crea la interpretación habitual del significado asentaría con el tiempo una gramática (o regla de interpretación estable, más o menos definida). El orden de las palabras, a la vez que la situación presente, lo que el oyente sabe de María y de Juan, y el conocimiento cultural general, determinan la interpretación. Esta clase de lenguaje tiene una estructura muy básica que carece no solo de recursividad sino también de estructuras tipo árbol.

Los lenguajes de tipo G2 usan palabras y frases con estructura (esto es, una sentencia puede aparecer como un elemento de otra sentencia más amplia), pero sin recursividad.

Los lenguajes de tipo G3 usan estructuras jerárquicas Y recursividad. La recursividad permite que una sentencia forme parte de otra que a su vez forma parte de otra, etc. Esto es, hay más de dos niveles de inclusión de una sentencia dentro de otra.

Everett concibe la gramática como un filtro que hace más predecible la interpretación semántica del mensaje, sobre todo para el que lo oye. Esto es, la gramática sería una herramienta útil, pero no esencial comparada con la invención de los símbolos, las bases culturales de sus significados, y del conocimiento de cómo usarlos apropiadamente para construir historias entendibles, conversar, y usar el lenguaje en sus varios modos. Además, sería una manera de dividir la infinidad de situaciones posibles en un número finito de situaciones (piénsese en la frecuente estructura SUJETO-VERBO-OBJETO), lo cual es una mnemotecnia para la memoria de corto plazo.

Para tratar de entender cuándo se originó el lenguaje, Everett resume lo que cabe inferir de los fósiles de nuestros antecesores homínidos. Desde 2 millones de años BP, Homo Erectus fue el primer Homo que domesticó el fuego, el primero que viajó hasta colonizar casi todo el planeta, el primero capaz de navegar, y sus fósiles muestran una mejora continua y rápida de sus utensilios, casas y organización social, como si las innovaciones fueran comunicadas de padres a hijos. Esto sugiere que podría ser la primera especie capaz de imaginar y donde la consciencia primaria (La base neuronal de la consciencia primaria) empezó a ser auto-reflexiva, y capaz de comunicar símbolos a otros, iniciando así la transmisión cultural de conocimientos.

Hace 1,8 millones de años, un grupo de H. Erectus abandonó África, ayudado por la cubierta forestal que entonces cubría todas las zonas hoy desérticas entre el Norte de África, Oriente Medio y Asia Central.

Reconstrucción del posible aspecto de un Homo Erectus macho adulto

En su asentamiento de Gesher Benot Ya’akov, al norte del Mar Muerto, hace 850.000 años, se encuentran evidencias de uso del fuego, herramientas de tipo Achulean y Levallois, cabañas que parecen albergar diferentes tareas sociales, construcción organizada del asentamiento, y otras evidencias de cultura. La colonización de Flores, Creta, Socotra (a 240 km del Cuerno de África) y otras islas por H. Erectus, entre 1.000.000 y 500.000 años BP, sugiere que eran capaces de construir balsas mucho antes que lo hiciera Sapiens. Quizás fueron arrastrados a esas islas por tormentas mientras pescaban con sus balsas, y no intencionalmente, pero la construcción de balsas para el mar requiere planificación.

En poco tiempo tras su salida de África, probablemente unos pocos miles de años, habían alcanzado China y la isla de Java. Grupos de homínidos viajando tan largas distancias mientras  mantienen su cohesión social y sus invenciones en continua mejora… es difícil imaginar tal escenario si esos grupos no llevaban consigo la comunicación lingüística.

Everett sugiere que Homo Erectus pudo ser capaz de utilizar un lenguaje simple del tipo G1. Un lenguaje de tipo G1 es el más simple posible, pero no es un proto-lenguaje ni un conjunto de “gruñidos” como a veces se ha dicho refiriéndose al H. Erectus. No lo es, según Everett, porque el lenguaje de los Pirahã parece también de tipo G1 y sin embargo: (i) permite a sus hablantes hablar de todo lo que su cultura considera relevante, y (ii) permite expresar pensamientos recursivos y ramificados aunque su gramática no sea recursiva ni jerárquica. En esta lengua amazónica, todas las frases son de este estilo: “El hombre está aquí. Él es alto” o “Yo hablé. Tú estás viniendo”, que podrían querer decir: “El hombre que es alto está aquí” y “Yo dije que tú estás viniendo”. Everett cita en el capítulo 9 de su libro el trabajo de Fred Karlsson, quien mostró que las gramáticas de los idiomas del ‘europeo promedio estándar’ no son tampoco recursivas, y esto no les supone ninguna limitación práctica importante.

La teoría de Everett sostiene que el lenguaje comienza con el uso de los símbolos, con lenguajes del tipo G1 sin todavía ninguna gramática. La gramática sería un añadido posterior en estos lenguajes G1. La gramática necesita símbolos, declaraciones y conversaciones previas para aparecer como una normalización y estructuración parcial de esos usos. Tanto los filósofos pragmatistas como el segundo Wittgenstein estarían conformes con esta idea de que las reglas aparecen después del uso, y no a la inversa.

El premio Nobel Herbert Simon demostró en la década de los 60 que las estructuras jerárquicas (esto es, formadas por otras estructuras que están anidadas dentro de ellas, como si fueran sus elementos) son un recurso utilizado en la naturaleza y las sociedades para construir sistemas complejos, a veces de mayor escala, a partir de sistemas más simples y de menor escala. Si aplicamos ese modelo al campo de la cognición encontramos que es mucho más eficiente y económico imaginar a (y hablar de) un grupo de entes mediante las características de uno de sus integrantes típicos, en lugar de tener que memorizar las características individuales de todos ellos. Una comunicación rica en información, sobre todo si debe producirse con cierta rapidez, se beneficia mucho de las estructuras jerárquicas, tanto a la hora de conceptualizar (en géneros, etc.) como de hablar.

Las gramáticas con estructuras jerárquicas y recursivas es probable que surgieran pues, según Everett, como respuesta a una necesidad social de comunicar pensamientos complejos, y no a la inversa. Para dilucidar con detalle la evolución de una lengua particular es necesario estudiar la retroalimentación mutua entre cultura, cognición y gramática.

Irene Pepperberg estudió durante años a un loro llamado Alex que, según ella, llegó a entender estructuras gramaticales inglesas arborescentes y con recursión. El gorila Koko también lo consiguió. Esto no demuestra que la gramática sea instintiva en los loros o gorilas, pues ellos no la usan para comunicarse entre sí. Más bien demostraría que las redes neuronales son tan potentes para identificar pautas sensoriales que hasta un loro es capaz de identificar una pauta gramatical si observa su uso un número suficiente de veces.

La evidencia antropológica da la razón a Peirce, según Everett, en la secuencia Ïndices a Iconos a Símbolos. Primero vinieron los índices: los pueblos cazadores-forrajeros del Amazonas y otros lugares usan índices (huellas, indicios) para saber dónde están, qué flora y fauna no visible habita cada lugar, dónde hay agua, y qué lugares son mejores para cazar. Los índices son una especie de comunicación metonímica con la naturaleza, pero están ligados a la experiencia individual y no constituyen en sí mismos un lenguaje.

El transporte de objetos icónicos por parte de algunos Homo Erectus (piedras en forma de falo o de mujer) muestra una identificación, uso y creación intencional de signos. Algo es identificado a través de una piedra que se le parece. De hecho, el canto (piedra) de Makapansgat, llevado a una cueva de Sudáfrica por un Austrolopithecus Africanus hace 3 millones de años, puede ser uno de los más tempranos ejemplos de ‘manuport‘, objeto natural (no manufacturado) y recogido de una zona distinta a la cueva por homínidos, en este caso debido probablemente a la similitud que la piedra presenta con un rostro humanoide, lo cual implicaría pensamiento simbólico ya en Australopithecus Africanus, el homínido bípedo antecesor probable del género Homo.

Canto (piedra) de Makapansgat

Manuport fálico de Erfoud (300.000 BP)

La figurina de Tan-Tan, también achelense, es más controvertida, pues podría ser una piedra erosionada por procesos naturales hasta una forma similar a la humana, pero incluso si fuera así, hay indicios de modificación artificial de los surcos y de restos de coloración de la figura.

Proto-figurina con surcos modificados del Achelense Medio, encontrada en Tan-Tan, Marruecos (400.000 BP)

Estos objetos implican capacidad simbólica. Además, Everett subraya que el uso de herramientas similares por distintos grupos y generaciones indica objetivos similares y soluciones socialmente compartidos por distintos grupos, y por tanto, también implican capacidad simbólica. Y el uso de herramientas se remonta a Homo Erectus.

Las lanzas de Schöningen pudieron ser utilizadas como herramientas de caza por el Homo Hidelbergensis (350.000 BP)

Una lanza no es una rama recogida y afilada casualmente por un H. Erectus, sino un útil que se traslada de un lado para otro, probablemente para cazar, y significa “caza” incluso si no está siendo utilizada en ese momento. La cualidad crítica que hace a una lanza ser reconocida como tal es la cualidad punzante y cortante de su punta, que es lo que la hace útil para cazar, y tal cualidad sería el “interpretante” (en términos de Peirce) de la lanza considerada como un símbolo. Otras cualidades de la lanza (color, material, longitud…) pueden variar sin que afecten a su conceptualización simbólica como una lanza. Las herramientas referencian conocimientos estructurados que están presentes en la mente de todos los componentes de una cultura. Análogamente, los símbolos de estatus no son meros adornos estéticos, sino que refieren a roles sociales y su valorización social.

Una herramienta tal como una lanza puede ser considerada como un símbolo, pero no es un símbolo lingüístico pues su diseño no es completamente arbitrario, sino que debe tener siempre la punta afilada para poder cumplir su función. La forma de un símbolo lingüístico, en cambio, es una pura convención social.

El tercer paso, el uso de símbolos linguísticos, que son formas físicas comunicativas, intencionales pero arbitrarias (no se parecen a lo que denotan), constituye un salto de gran envergadura. Da nacimiento a los lenguajes.

Tecnología olduvaiense

Desde la aparición de Homo Erectus (unos 2 millones de años BP) hasta la aparición de la tecnología achelense (1.65 millones BP) pasan unos 300.000 años. La tecnología achelense es capaz de tallar bifaces muy afiladas de piedra, hueso y cornamenta, mejorando enormemente la tecnología olduvaiense, que se basaba en romper piedras con otras piedras para obtener filos cortantes. Algunos paleontólogos piensan que esta estasis en la innovación pudo estar relacionada con una transmisión cultural de baja fidelidad, esto es, presencia de pensamiento simbólico pero ausencia de lenguaje. Everett lo considera una posibilidad, pero cree que también pudo deberse al conservadurismo de muchas culturas, que no cambian sus técnicas si disponen de otras que funcionan para sus necesidades.

Bifaces típicas de la Tecnología Achelense encontrados en Cintegabelle (Francia)

Una innovación posterior fue la tecnología de Levallois (500.000 BP). Se basa en un procedimiento de lascado que, por medio de una preparación especial de la cara superior del núcleo (y, opcionalmente, de su periferia y su plataforma de percusión) se consigue preconcebir o predeterminar, total o parcialmente, la forma y el tamaño de la lasca, antes de haber sido extraída. De este modo, la talla lítica sigue unos pasos concretos que dan lugar a unos resultados formales muy específico.

La estabilidad en el uso de una técnica tan sofisticada y la necesidad de feed-back para corregir errores en los que la aprenden debieron de presionar fuertemente hacia mejoras de la comunicación, y es otra de las evidencias que sugieren a Everett que Homo Erectus podía estar ya usando lenguaje de tipo G1 en este periodo.

Tecnología  de Levallois

Los iconos sonoros podrían haber sido fuentes de los primeros símbolos según Greg Urban y Everett.

La construcción de conceptos que hace el cerebro de muchos mamíferos superiores, y un eventual etiquetamiento de esos conceptos que el cerebro homínido habría aprendido a hacer, parecen imprescindibles mediadores en la aparición de los símbolos, generales y linguísticos. El mantener un registro de las relaciones sociales del propio cuerpo presionaría selectivamente sobre esa capacidad cerebral de etiquetar clases de otros individuos. Ejemplos: “madre mía”, “pareja mía”, “pareja de X”, “familia mía”, “grupo mío”, “competidor mío” (por una hembra), “hembra”, “hijo”, “padre de X”.

La aparición del uso de símbolos hablados sería el acontecimiento esencial que da nacimiento al lenguaje. La gramática es una normalización posterior que ayuda a pensar y a entender la simbolización sin apoyarnos tanto en el contexto, pero no es esencial para el lenguaje. La lengua Pirahã, como el Riau de Sumatra, se parecen mucho a una serie de palabras colocadas una detrás de otra sin estructura, como las cuentas de un collar.

Everett piensa que lo que hizo la diferencia en Sapiens respecto a otros homínidos no fue propiamente el lenguaje, que ya debía existir en H. Erectus, sino el exponencial desarrollo de su inteligencia (capacidad de combinar símbolos abstractos). Entre otras ventajas evolutivas, la capacidad de simbolización abstracta compleja permite a las especies que la usan el forrajear o cazar estratégicamente, teniendo en cuenta los hábitos de su comida o presa; las demás especies animales lo hacen en cambio oportunistamente.

El tamaño del cerebro es probablemente un indicador de ese desarrollo de la inteligencia; junto con la posición del surco semilunar, que separa el córtex visual del córtex frontal (supuestamente especializado en pensar). El tercer indicador sería el tamaño del “córtex de asociación posterior”, que supuestamente conecta múltiples áreas del cerebro permitiendo un pensamiento más rápido.

Hace 6-8 millones de años, en la divergencia entre chimpancés y homínidos (Sahelanthropus, Ardipithecus, Orrorin), el cerebro debía medir unos 350-450 cm3. Hace 3,5 millones de años, con la aparición de Australopithecus Africanus y Afarensis, el tamaño del cerebro es de unos 500 cm3, el surco semilunar aparece un poco más hacia atrás a juzgar por las incisiones interiores que presentan los cráneos fósiles, el área de asociación posterior es mayor, y hay signos de reorganización cerebral y de más áreas especializadas. Comienzan a observarse también asimetrías entre ambos hemisferios. Hace 1,9 millones de años, con Homo Habilis y otros homínidos cercanos a H. Erectus, el cerebro está aumentando rápidamente y alcanzará los 1.000 cm3 en los últimos H. Erectus. Las asimetrías hemisféricas y especializaciones han aumentado, y se observan regiones prominentes alrededor del área de Broca, importante para las acciones secuenciales y (plausiblemente) el incipiente habla.

El posible habla de H. Erectus tuvo que ser más limitada que la humana. En primer lugar, porque la forma prognata de la cavidad bucal sugiere que producía menos variedad de vocales que los humanos, y sus vocales debieron ser difíciles de distinguir a cierta distancia, aunque esto puede ser soslayado mediante cambios de tono y gritos. Además, su hueso hioides es arcaico, no parece servir aún para estirar y encoger la laringe (y aumentar la variedad de fonemas), como en H. Sapiens y Neanderthal. Además, el gen FOXP2 es más primitivo en H. Erectus que en H. Sapiens. Este gen aumenta el control y la velocidad de la cognición y de los músculos del habla. Es probable que este gen indujera en H. Erectus una menor plasticidad y creatividad que en H. Sapiens.

El tamaño del cerebro llegó a un máximo hace unos 200.000 años con H. Sapiens (1350 cm3), y no ha variado desde entonces. Tampoco hay evidencias de que se haya especializado durante ese tiempo. Parece que tal cerebro, y el comportamiento cultural que permite, cuidan tan bien de la especie que la mayoría de las mutaciones genéticas ya no mejoran visiblemente la adaptación humana al entorno. Lo crucial para la supervivencia de los fenotipos humanos es, principalmente, que mantengan un comportamiento sociable, capaz de insertarse en la cultura que los rodea. Distintos científicos sociales han llegado a la conclusión de que la selección natural ha especializado al cerebro humano no en la dirección de instintos cada vez más numerosos y especializados, sino en la dirección de una plasticidad y capacidad multi-tarea cada vez mayor, que permite el aprendizaje y la modificación de comportamientos aprendidos colectivamente, mediante prueba y error. Hay unos pocos instintos básicos, pero a ellos se añade la capacidad cerebral de reforzar las interconexiones neuronales que mejor funcionan para producir comportamientos exitosos para satisfacer tales instintos. Tal capacidad es la base de la plasticidad conductual y el aprendizaje.

La cultura y el posible uso de lenguaje son tan importantes para el comportamiento inteligente como el tamaño cerebral. Eso es al menos lo que sugiere el descubrimiento de los fósiles y útiles del Homo Floresiensis en la isla de Flores, Indonesia. Este Homo de sólo 1,10 cm de altura y 400 c.c. de cerebro, parece haber tenido una cultura similar a otros Homo inteligentes, como su antecesor H. Erectus, pese a su pequeño cerebro, lo cual ha llevado a algunos investigadores a pensar que poseían lenguaje, como otros Homo. Sus últimos restos datan de 50.000 años, pero los descubridores sospechan que esta especie pudo haber sobrevivido mucho más tiempo en otras partes de la isla de Flores hasta llegar a ser el origen y fuente de las historias sobre los Ebu gogo contadas entre los lugareños. Se dice que los Ebu gogo eran cavernícolas pequeños, de pelo largo especialmente en la cabeza y torso, con rostro simiesco y de lenguaje pobre, y presentarían el tamaño de H. Floresiensis. Se creía ampliamente en su existencia en la época de la llegada de los holandeses, hace quinientos años.

Reconstrucción del posible aspecto del Hombre de Flores

Everett sugiere varios factores sociales que pudieron presionar hacia fenotipos con mayores cerebros en el género Homo. El primero es el aumento del tamaño de las bandas. Un grupo típico de chimpancés tiene 50 miembros, mientras que una banda cazadora-recolectora humana consta de unos 150. Un tamaño triple implica 9 veces más relaciones sociales entre los miembros, y ello exigiría un cerebro con más capacidad de memoria. Otro factor es la ventaja adaptativa que confiere una cooperación grupal más eficiente a la hora de cazar, recolectar o cuidarse mutuamente. Un cerebro capaz de detectar con precisión quienes están aportando adecuadamente al grupo y quienes no, y cómo lo hacen, proporciona ventajas adaptativas. Pero el factor más importante fue probablemente el uso social de símbolos, en forma de fonemas, gestos y cabeceos, para comunicarse.

La producción del lenguaje necesita de la colaboración de muchas partes del cerebro. Una de ellas, es la de los ganglios basales, perteneciente al llamado “cerebro reptiliano” o parte más antigua del cerebro. El daño de esta región produce varios tipos de afasia, y sin embargo, sus funciones son mucho más variadas que el solo lenguaje: aprendizaje de rutinas y hábitos, funciones emocionales, movimientos del ojo, y control motor voluntario. Análogamente, el área de Broca, es un área involucrada en actividades procedimentales motoras en general, no sólo en actividades motoras lingüísticas. Esto parece dar la razón a la teoría microgenética, que afirma que funciones complejas como la comprensión del lenguaje ponen en movimiento procesos motivacionales y emocionales, procesos simbólicos no lingüísticos y procesos más específicamente lingüísticos.

Por otra parte, hay múltiples observaciones que demuestran que casi todas las regiones del cerebro tienen la capacidad de especializarse, que el daño severo de regiones enteras del cerebro hace que otras vecinas se especialicen en las funciones que realizaban sus vecinas; y que el aprendizaje de una habilidad provoca una especialización neuronal, que a veces está muy distribuida y otras veces está más localizada en ciertas regiones. Por ejemplo, el área de Broca puede resultar destruida sin afectar al lenguaje si el individuo es lo suficientemente joven. Y esta área se activa cuando uno escucha o toca música, observa sombras de animales moviéndose, y con la cognición de otras actividades motoras.

Esto es, el que varias áreas cerebrales (Broca, Wernicke, circunvoluciones supramarginal y angular; ínsula anterior, el polo, las circunvoluciones segunda y tercera de ambos lóbulos temporales y los ganglios basales) suelan activarse al entender el habla no quiere decir que el lenguaje requiera un órgano o sistema anatómico específico. Otras actividades sociales aprendidas activan similares redes de regiones neuronales interconectadas, sin que se diga que esa red constituye un sistema genéticamente programado para esa actividad. El cerebro está programado para aprender, así que muchas funciones aprendidas no necesitan una programación genética previa. Aunque la forma como están interconectadas las neuronas en ciertas áreas parecen permitir a estas áreas aprender mejor ciertas funciones que otras.

Hay muchos genes que facilitan el que ciertas costumbres aprendidas se puedan realizar mejor, y esto lo que induce a pensar es que se ha producido un “efecto Baldwin” entre la costumbre cultural y los genes que mejoran dicha práctica. No induce a pensar que cualquier costumbre cultural ha surgido porque ha habido una mutación genética que la programó instintivamente. Pero esto es lo que está ocurriendo entre los defensores de la teoría chomskiana del lenguaje, según Everett. Cualquier evidencia de que un gen mejora alguna capacidad lingüística la toman como una prueba del origen genético del lenguaje. Lo cual no es sino un sesgo de confirmación de quien ya ha llegado a una conclusión previamente a los hechos, pues una cosa no implica la otra. Hay máquinas (o conjuntos de genes coordinados) para construir el ojo humano, sin los cuales el ojo humano no se forma; pero no hay conjuntos de genes para decirnos cómo usar culturalmente la capacidad de ver. Algo análogo ocurre con el lenguaje según Everett: hay sistemas de genes que construyen la enorme plasticidad, multi-funcionalidad y capacidad de identificar pautas (entre ellas los significados) que tiene el cerebro humano; pero no hay máquinas genéticas para obligarnos a estructurar los significados en forma de sintaxis recursivas y hablarnos unos a otros con esa sintaxis tan específica, como pretende Chomsky. La sintaxis de las lenguas es una práctica ensayada tradicionalmente que encaja con los valores de la cultura, y hay demasiada variedad de sintaxis en las lenguas humanas como para afirmar que derivan todas de una máquina genética. Es más sencillo suponer que derivan del uso cultural de la o las máquinas genéticas que permiten el pensamiento simbólico.

Everett interpreta la evolución del lenguaje como una selección gradual de rasgos biológicos que cada vez posibilitaban un mejor acoplamiento de las intenciones de los homínidos pre-sapiens, facilitada por efecto Baldwin. Evidencias como que la memoria a corto  plazo (o “memoria de trabajo”) humana está mejor preparada para recordar sonidos, fonemas o palabras que imágenes o sensaciones táctiles, sugieren también un efecto Baldwin entre lenguaje incipiente y regiones cerebrales, según Everett. Por el contrario, la escuela de Chomsky propone una evolución saltacionista para el lenguaje, un conjunto de mutaciones repentinas que habría permitido la aparición de una máquina lingüística perfectamente ensamblada hace unos 65.000 años. La evolución gradualista sugerida por Everett habría generado unas prácticas sociales lingüísticas suficientemente buenas para acoplar los comportamientos de los individuos, aunque inicialmente (con H. Erectus) de una forma más simple que posteriormente (con H. Sapiens), en que habría ido adquiriendo cada vez más sofisticación en sociedades complejas. El cerebro no está más especializado para el lenguaje que lo que lo está para la construcción de herramientas, aunque con el tiempo ambas actividades han afectado a la evolución del cerebro, por la presión de selección que provocan.

Si el lenguaje fuera una capacidad como la visión, que tiene sistemas nerviosos específicos  asociados, algunas enfermedades del lenguaje se heredarían, lo cual nunca se ha observado.  La llamada “Discapacidad Específica del Lenguaje” (SLI en Inglés) es un supuesto síndrome que algunos partidarios de la teoría chomskiana han afirmado se hereda. Pero otros investigadores no han encontrado evidencia estadísticamente significativa de su existencia (lo que parece heredarse son desórdenes cognitivos más generales que el solo lenguaje).

Por otra parte, el desarrollo cerebral no está tan íntimamente ligado a los aparatos vocales del habla como para hacer inviables otros canales como el lenguaje de signos. Más bien, el cerebro parece estar bien adaptado para interpretar pautas y señales de distintas modalidades, y las producidas por las manos y el aparato vocal son las más fáciles de generar para un cuerpo humano.

Algunos autores han defendido que la universalidad del uso de los gestos o de las señalizaciones demuestra el origen innato de las capacidades lingüísticas. Everett encuentra una explicación más fácil: estas formas de comunicación emergen en casi todas las sociedades porque son muy útiles para aumentar los canales, la claridad y la rapidez de la comunicación.

El conocimiento del contexto social permite dar sentido preciso a lo que se dice en todas las lenguas, hasta en las de sintaxis más desarrollada, y esto es algo que casa mejor con la teoría de Everett que con las teorías chomskianas. Las dificultades lingüísticas que experimentan muchos autistas derivan precisamente de su incapacidad para entender el contexto y presupuestos sociales en que se están usando las expresiones verbales.

La doble articulación es el gran invento cultural que caracteriza al lenguaje humano. Hay en primer lugar una estructuración vertical: una lista de fonemas de donde podemos extraer cualquier combinación para formar un potencial símbolo. Normalmente, la combinación que constituye el símbolo está formada por 1, 2 … N sílabas (normalmente, 1, 2 o 3). Una sílaba es una manera de facilitar al oído la identificación del símbolo. No cualquier combinación de N fonemas vocales y consonantes suena igual de identificable y distinguible de otros. Una sílaba suele  estar constituida por dos fonemas (habitualmente [consonante-vocal]) la más simple, y [tres fonemas consonantes-un fonema vocal-tres fonemas consonantes], los más complicados, como en la palabra inglesa “strength” (fonemas: STRENKZ). La facilidad de identificación de la sílaba se llama sonoridad, y se consigue habitualmente poniendo un fonema de mayor volumen sonoro rodeado de otros con menor volumen. Las consonantes tienen menos volumen que las vocales, esto es, son menos sonoras.

Hay una segunda articulación que es la horizontal o sintagmática: consiste en la ordenación serial de símbolos para producir sentencias con significado.

Los lingüistas han descubierto que sólo hay cuatro tipos de lenguas según la manera como hacen la articulación sintagmática de fonemas para formar palabras. (i) En las lenguas aislantes, o analíticas (como el chino estándar) los distintos significados se expresan con palabras distintas. (ii) En las lenguas aglutinantes (como el turco), los distintos significados se expresan mediante morfemas distintos, y éstos se juntan para formar palabras. (iii) En las lenguas fusionantes (como, en cierto grado, el latín) un mismo morfema puede transmitir información (por ejemplo) de persona, número o género, como si hubiese fundido en un solo morfema tres morfemas distintos de una antigua lengua aglutinante. (iv) En las lenguas no-concatenativas las vocales y las consonantes expresan distintas clases de significados y son agregadas para formar palabras. La mayoría de las lenguas utilizan varios de estos 4 principios de ordenación, aunque uno de ellos puede ser predominante.

Si analizamos ahora la ordenación de las palabras para producir sentencias, Everett identifica tres tipos de gramáticas en las lenguas humanas: lineales, jerárquicas y jerárquicas recursivas.

Una gramática lineal con símbolos, entonación y gestos es todo lo que un lenguaje G1 requiere. Las lenguas actuales Pirahã y Riau de Indonesia parecen ser ejemplos de esto. En una lengua de este tipo, las palabras son colocadas una detrás de otras como cuentas de un collar. Lo más fácil es que la primera palabra que aparezca en la sentencia sea aquella que trae información antigua, o compartida entre el hablante y el oyente, como en la frase “Juan es una buena persona”. El nombre “Juan” refiere a una persona que ambos hablantes conocen. Esto facilita la acción de la memoria de corto plazo, y por tanto la comprensión rápida de la frase. Luego suele haber una palabra verbal verbo y una palabra para el objeto de la acción, si lo hay. Pero el orden de estas palabras es culturalmente establecido. Por ejemplo, en el inglés antiguo el orden era SUJETO-OBJETO-VERBO, pero debido a la influencia del  francés de los conquistadores normandos, cambiaron al orden SUJETO-VERBO-OBJETO.

Por otra parte, para funcionar, el lenguaje necesita usar el conocimiento tácito de la situación que proporciona la cultura; y parte de este conocimiento tácito lo proporcionan los gestos. Muchas veces, esos gestos sirven para resaltar la importancia o la intención de unos elementos concretos de la sentencia. Sin esos enfatizadores la gramática suele ser incapaz de generar el mismo significado en el oyente que el pretendido por el hablante.

Una gramática jerárquica es la que permite que una sentencia aparezca dentro de otra, como en: “Juan dijo que Pepe dijo que María era guapa”, y una gramática recursiva es la que permite que una sentencia aparezca dentro de otra que está a su vez dentro de otra, etc., esto es, permite un anidado tan profundo como se quiera, y superior a una simple jerarquía, o anidado de dos niveles. Fred Karlsson afirma que ninguna lengua europea estándar (la que se habla en la calle, fuera de círculos especializados) es recursiva; esto es, todas serían lenguas G2, pero no G3. Sin embargo, las necesidades profesionales o específicas de círculos especializados de hablantes pueden llevar al uso de estructuras de este tipo entre ellos, pues el pensamiento las puede usar y las usa a veces.

Según Everett, en la evolución del lenguaje es perfectamente aplicable la frase de Voltaire de que “lo mejor es enemigo de lo bueno”, la de K. L. Pike de que “no todo lo que vale la pena hacer, vale la pena hacerlo bien”, y la idea del Nobel de economía H. Simon de que las soluciones preferidas en los negocios son las primeras que satisfacen la necesidad, no las que la satisfacen perfectamente. Lo mismo ocurre en la evolución biológica. En el lenguaje, las gramáticas y los sistemas de sonidos nunca son óptimos, sólo funcionales.

Según el filósofo Paul Grice hay cuatro principios culturales que rigen la comunicación humana en casi todas las culturas: máxima calidad, máxima cantidad, máximo de relevancia y máximo de estilo. El primero presupone que el hablante no está mintiendo la mayor parte del tiempo, y utiliza correctamente los modos, sufijos o modificadores que indican el grado de verosimilitud, realidad o certeza de lo que se afirma.

El segundo requiere que no demos más información de la que la interacción requiere; pero tampoco información tan escasa que haga inútil la interacción.

El tercero demanda que la información sea relevante para el oyente.

El cuarto demanda que seamos claros al expresarnos.

Solemos además interpretar el significado de las afirmaciones “caritativamente” o “inclementemente”, según la confianza que nos merezca el hablante.

Sperber y Wilson, desarrollaron el planteamiento de Grice. Como todos los participantes en una conversación suponen que lo que alguien dice es relevante para el contexto en el que se desarrolla tal discusión, si la sentencia emitida parece transmitir sólo información trivial, los oyentes buscan un posible significado tácito, indirecto o metafórico de la sentencia, que sea más relevante para el contexto que la interpretación literal habitual.

Un ejemplo de cómo la cultura y el contexto (con la ayuda de las expectativas no verbales de relevancia y otras) son imprescindibles para entender una frase lo proporciona la siguiente sentencia en lengua Pirahã, para decirle a alguien que le regalas una banana:

Ti gí hoagá poogáíhiaí baagáboí

Cuya traducción literal sería: Yo tú contraexpectativa banana doy.

O bien: Yo, contra tus expectativas, te doy una banana.

Para entender la frase es necesario saber que, en la cultura Pirahã, cada regalo que uno hace lleva la expectativa de que le será devuelto mediante un regalo futuro del homenajeado. De manera que dar algo es una forma de establecer lazos de reciprocidad habituales. Por eso, si doy algo sin expectativas de devolución hay que añadir esa palabra equivalente a “contraexpectativa”. También se observa que el Pirahã no usa el acusativo “a ti” (o “te”) para designar a quien le estoy dando la banana, con la palabra “tú” y el contexto de la situación es suficiente para saber que no puede ser otro el receptor. A la frase anterior, una respuesta habitual sería:

Xigíai (De acuerdo).

Para la correcta comprensión de esa respuesta uno debe saber que en la cultura Pirahã nadie dice “gracias” a otro por recibir algo, pues el dar a todos y recibir presentes de todos es la norma, no la excepción, y un presente no tiene por qué producir sorpresa.

El antropólogo y lingüista Daniel Everett con varios pirahã cerca del río Maici, afluente del Amazonas

 

Everett piensa que el primer lenguaje, en H. Erectus, pudo ser similar a una lengua G1 como el Pirahã. Esto es, una lengua lineal con un número limitado de palabras, donde el significado era obtenido en gran parte del contexto y los hábitos culturales. Y que podía ser enriquecida mediante gestos, entonación y posturas corporales.

Siempre debe haber conocimiento del contexto y una cultura para poder interpretar un mensaje. A veces el conocimiento de la cultura no basta y hace falta también atender al contexto. Por ejemplo, en nuestra propia cultura europea-occidental, la frase “deberíamos de comer juntos en algún momento” podría interpretarse como que deberíamos los dos, en este momento, planear el ir a comer ambos a un restaurante. O bien, podría querer decir ‘me tengo que ir; no tengo tiempo para esta conversación’. El significado no está basado nunca solamente en las palabras que aparecen en la frase.

¿Cómo emergen las culturas? Everett sugiere que las practicas humanas, que son instintivamente grupales, generan familiaridad, valores compartidos, roles sociales y conocimiento estructurado. Esto último serían conjuntos de conceptos y las expectativas de cómo se suelen relacionar unos conceptos con los otros.

Edelmann y Tononi sugieren que algunos conceptos surgirían casi espontáneamente en el bebé debido a la forma como se ha estructurado evolutivamente los órganos sensoriales y las estructuras neuronales asociadas. Esto haría que todos los humanos nazcamos con la fuerte tendencia a identificar objetos que se mueven manteniendo su forma y color (y no aparecen y desaparecen continuamente), veamos esos objetos distribuidos en un espacio tridimensional, ocultándose unos detrás de los otros, actuando unos sobre otros, en el tiempo, etc. Pero más allá de estos pre-conceptos basados en aprioris corporales las prácticas compartidas con las que jugamos a interaccionar con las cosas se encargan de crear la mayoría de los conceptos en cada cultura.

A medida que la cultura cambia, cambian los valores, los roles y los contenidos sobre los que los sujetos necesitan comunicarse, y con ello cambian los significados, las palabras, y el lenguaje. Hablamos como aquellos con los que hablamos, del mismo modo que razonamos como aquellos con quienes razonamos.

Si consideramos a una cultura como un conjunto de creencias, conocimientos y valores, y a la sociedad como un conjunto  de roles y relaciones estructurales entre esos roles, con los individuos ocupando las posiciones disponibles en los distintos roles, entonces cada sociedad se puede caracterizar mediante una especie de gramática. Es lo que hace, de alguna manera, la antropología estructuralista. Es una perspectiva algo simplificada, pero útil como punto de partida. Uno puede considerar las herramientas como cultura congelada.

El lenguaje es la herramienta cultural más importante para Everett, introducida aparentemente por H. Erectus hace 60.000 generaciones. Las estructuras biológicas perceptuales y cognitivas del cuerpo y el cerebro humano serían la base según Edelman y Tononi de los primeros pre-conceptos. Según Everett, también restringen y guían en un sentido amplio la evolución cultural del pensamiento, y con ello de los símbolos compartidos y del lenguaje. Pero la estructuración en roles concretos de una sociedad es en gran parte un producto del ensayo y error en el medio, y está indeterminado biológicamente. Este juego con el entorno hace evolucionar la cultura y provoca la aparición de nuevos significados e innovaciones lingüísticas.

Referencias

Everett, D. No duermas, hay serpientes. Vida y Lenguaje en la Amazonia. Turner, Madrid, 2014.

Everett D. How Language Began. The Story of Humanity’s Greatest Invention. Profile Books, London, 2017.

Zugasti, E. (2012). Daniel Everett: El lenguaje es una herramienta, no un instinto. Tercera Cultura. http://www.terceracultura.net/tc/daniel-everett-el-lenguaje-es-una-herramienta-no-un-instinto/