TEMA 1: LENGUAJE Y PSICOLINGÜÍSTICA.
1. Introducción.
Hace años, en 1967, el naturalista Desmond Morris escribió un libro titulado El mono desnudo. El libro, destinado al gran público, pretendía mostrar cómo los humanos somos una especie característica del grupo zoológico de los primates y, cómo, para un observador imparcial, apenas nos diferenciamos de otros primates más que en nuestra visible desnudez o ausencia de pelo. Sin embargo, si prestamos atención a los aspectos cognitivos y no a los meramente anatómicos o epidérmicos, creemos que sería preferible describir al primate humano como el mono parlante. Efectivamente, el ser humano habla, utiliza el lenguaje, y esto ha sido así a lo largo de TODA la historia y en TODAS las culturas, desde las más “primitivas” hasta las más “avanzadas”. A pesar de las diferencias tecnológicas entre las diversas sociedades, todas las lenguas son igualmente sofisticadas, de modo que no existen lenguas más “primitivas” ni más “avanzadas” que otras. Por otra parte, el mono parlante aprende su lengua materna desde que es niño, sin necesidad de que reciba ningún tipo de instrucción formal.
¿ Qué es el lenguaje y por qué es tan importante para la especie humana ?. Básicamente, podemos hablar de las siguientes razones:
a) El lenguaje es un rasgo distintivo de nuestra especie, y es
universal para todos los grupos humanos.
b) No se conoce ninguna sociedad que NO tenga lenguaje. Además,
no podemos hablar de lenguas más primitivas o más evolucionadas,
sino que todas revisten una notable complejidad.
c) El lenguaje nos permite la comunicación interpersonal
y la transmisión de conocimientos de unas personas a otras.
d) Está relacionado con otros procesos mentales (percepción,
memoria,...).
e) Es muy accesible como objeto de estudio. El lenguaje es el
mejor “espejo de la mente” que se posee.
f) El lenguaje es un tema central para cualquier teoría
de la mente o de la cognición.
g) Es un tema tratado de forma interdisciplinar.
El lenguaje es algo cotidiano en nuestra especie y forma parte de la gran mayoría de actividades que un ser humano realiza durante un día cualquiera. Esta familiaridad hace que no nos preguntemos qué mecanismos subyacen en dicho proceso. Para el lego, el lenguaje es algo relativamente sencillo de aprender y cree que los mecanismos que lo producen son sencillos. Sin embargo, como señala Pinker (1.994), nos resulta tan natural que tendemos a pasar por alto lo asombrosa que es esta capacidad: con sólo emitir unos ruidos con nuestra boca somos capaces de formar ideas en el cerebro de otra persona con exquisita precisión. Gracias al lenguaje podemos beneficiarnos de todo lo que otras personas, vivas o muertas, han aprendido sobre el mundo y sobre nuestra especie. De este hecho se deriva uno de los aspectos más salientes del ser humano: la cultura. Efectivamente, la formación de las diferentes culturas está íntimamente ligada al lenguaje, ya que gracias a éste, podemos perpetuar los conocimientos y habilidades que adquiere la especie humana.
El hecho de que el lenguaje nos sea tan familiar, que sea tan intrínsecamente humano, contrasta también con su complejidad. Comprendemos multitud de palabras y frases con increíble eficacia y rapidez, sin ningún esfuerzo consciente; nuestros pensamientos fluyen a nuestro sistema articulatorio a veces casi sin quererlo. Es verdad que existen ocasiones en las que nos damos cuenta de la extrema complejidad del lenguaje. Un ejemplo lo tenemos cuando comenzamos a aprender otro idioma, cuando se nos desliza un “lapsus linguae”, ...El ser humano ha logrado que los ordenadores simulen y mejoren muchas de las tareas que antes eran exclusivamente humanas pero, sin embargo, nadie ha logrado simular las capacidades lingüísticas del ser humano. Nadie ha conseguido programar un ordenador que comprenda y/o produzca el lenguaje. Cuando nos percatamos de estos hechos es cuando el lenguaje pierde toda su naturalidad, su aparente sencillez, su transparencia, y comienza a ser patente su extrema complejidad y riqueza.
Es impresionante los logros alcanzados por el ser humano en la comprensión del universo que nos rodea, los avances en las ciencias físicas y la tecnología derivada de ellas, probablemente la prueba definitiva de la certidumbre de dicho conocimiento. Pero, paradójicamente, qué pequeños han sido nuestros logros en la comprensión científicamente de nuestra propia mente, de nuestra conducta y, por tanto, de nuestra capacidad lingüística.. El problema radica en que la mayor parte de nuestra conducta lingüística está compuesta por procesos inconscientes, automáticos. El tomar consciencia de esta complejidad del lenguaje, unido a formulaciones que han hecho posible el estudio científico de la mente, ha dado lugar a espectaculares avances desde el nacimiento de la Ciencia Cognitiva, hace unos cuarenta años, hasta la actualidad. Pero antes de abordar estos avances de la Psicolingüística como ciencia cognitiva es necesario delimitar qué llamamos lenguaje y qué características lo diferencian de otros sistemas de comunicación.
1.2. El lenguaje y los sistemas de comunicación.
El término “lenguaje” tiene muchos significados posibles. Se habla de “lenguajes informáticos”, “lenguaje de los delfines”, “lenguaje de las flores”,... Si pretendemos hallar un denominador común de todas estas concepciones de lenguaje, podríamos asumir que el lenguaje, en sentido amplio, es un sistema de símbolos y reglas (este rasgo sería opcional, puesto que no todos los lenguajes citados lo compartirían) que sirve para comunicar. Esta definición tan simple parece intuitivamente apropiada, pero no es correcta, ya que entiende que es lo mismo lenguaje que comunicación, creencia que está muy extendida en la sociedad. En esta asignatura se va a considerar otra definición distinta. Si hacemos un repaso por algunas de las definiciones formales o científicas del lenguaje, así como por las definiciones de los diccionarios o por las de la gente de la calle, nos daremos cuenta de que existen pocos rasgos en común. El término lenguaje, además de la definición anteriormente dada, se emplea para referirse a “habla”, a idioma concreto, a gramática,...Quizás el único atributo que nos quede al final y que compartan todas las acepciones sería el de COMUNICACIÓN.
A pesar de esta polisemia que presenta la palabra lenguaje, para lingüistas y psicolingüísticas el lenguaje es algo mucho más concreto y no debe ser confundido con comunicación o con sistema de comunicación. Es un sistema mucho más sofisticado y cualitativamente diferente a otros sistemas de comunicación. Es un sistema mucho más sofisticado y cualitativamente diferente a otros sistemas de comunicación, como los empleados por otras especies animales.
Para Bickerton (1996), el hecho de que se confundan lenguaje y (forma de) comunicación se debe a dos factores relacionados:
1) Confusión entre un objeto y su uso. El lenguaje sirve para comunicarse pero no es comunicación.
2) Los sistemas de comunicación difieren del lenguaje en que no pueden hacer otra cosa que comunicar. El lenguaje, en cambio, tiene capacidades adicionales, como las de estar implicado en los procesos mentales y almacenar información: el lenguaje es un sistema representacional que representa el mundo. Los signos del lenguaje pueden combinarse y recombinarse para expresar o representar cualquier cosa, sin limitación de espacio o tiempo. Por contra, los sistemas de comunicación de otras especies sólo pueden indicar lo que el animal quiere o siente.
Diversos autores han optado por definiciones operativas, estableciendo una serie de rasgos para definir y reflejar la naturaleza esencial del lenguaje. De los propuestos, destacaríamos los siguientes:
- Rasgos fisiológicos: La laringe humana está desplazada hacia abajo, en contraste con la posición habitual en los mamíferos. Esta característica permite que haya más espacio de resonancia para pronunciar las vocales, pero tiene el inconveniente de que las personas, a diferencia de los chimpancés o los gorilas, no podemos respirar y tragar al mismo tiempo. Esta aparente desventaja adaptativa se vería compensada por las enormes ventajas adaptativas de un lenguaje articulado.
- Arbitrariedad: Empleo de símbolos neutrales, que no tienen
relación con el concepto que simbolizan.
- Semanticidad: Empleo de signos para “significar” o referirse
a objetos y acciones reales.
- Transmisión cultural: La formación de las diferentes
culturas está íntimamente ligada al lenguaje, ya que gracias
a éste, podemos perpetuar los conocimientos y habilidades que adquiere
la especie humana.
- Dependencia de estructura: La estructura del lenguaje no se
puede captar en su forma superficial y el lenguaje responde a unas reglas
que son muy complejas. Dichas reglas determinan la mencionada estructura.
- Productividad o creatividad: A partir de un número
discreto de signos podemos construir infinitos mensajes.
Algunos de estos rasgos son compartidos por otros sistemas de comunicación animales y humanos. Sin embargo, los dos últimos (dependencia de estructura y productividad) son, a nuestro modo de ver, los más representativos y definitorios del lenguaje. Probablemente son los que lo diferencian drásticamente de otros sistemas de comunicación humanos o animales.
La dependencia de estructura hace referencia a que la producción de enunciados no se rige por reglas lineales o lógicas, no existen procedimientos mecánicos que permitan explicar la sintaxis; ésta no consiste en insertar palabras según reglas invariantes. Para poder entender el funcionamiento interno del lenguaje hay que examinar la estructura interna de las frases, que es inaudible. El número de palabras es irrelevante: lo importante es la estructura de la frase que ha de ser comprendida.
El rasgo de creatividad o productividad es quizás el más propiamente lingüístico, no siendo compartido por otras formas de comunicación, y su enunciado se remonta a la demoledora crítica de Chomsky en 1959 sobre la explicación conductista de la adquisición del lenguaje. Chomsky puso de relieve que resulta difícil explicar, en términos de puro aprendizaje, cómo los niños adquieren el lenguaje. Para empezar, la mayor parte de la conducta lingüística no está controlada por estímulos externos: utilizamos el lenguaje de forma innovadora continuamente. No tenemos ningún problema en producir y comprender frases que no hemos oído nunca. Además, los niños pequeños, a partir de una experiencia limitada con el lenguaje, son capaces de emitir enunciados completamente nuevos.
Para concluir podríamos afirmar que, si bien existen comunalidades entre el lenguaje y otros sistemas de comunicación, las diferencias son también acusadas. Además, estas diferencias son cualitativas, no cuantitativas: el lenguaje no es un sistema de comunicación más complejo que el de otras especies, sino que es un sistema diferente. Desde este punto de vista, es una de las características más distintivas del ser humano, una de las conductas más representativas como especie. No es de extrañar, pues, que desde los albores de la Psicología hasta la Psicolingüística actual, se haya perfilado como uno de los objetivos centrales de reflexión y estudio.
1.3. Breve historia sobre los orígenes de la Psicolingüística.
El conductismo surge a principios del siglo XX en Estados Unidos, y alcanza su apogeo durante los años 30 y 40. La filosofía conductista está influida por las tradiciones asociacionista, empirista y positivista. Su principal figura, J.B. Watson, defiende que el lenguaje no se diferencia en esencia de cualquier otra conducta humana o animal: es adquirido a través de un proceso de aprendizaje mediante los principios del condicionamiento clásico y operante. No hay nada innato ni exclusivo del ser humano en el lenguaje. Estos supuestos básicos son asumidos por todos los autores que comienzan a desarrollar explicaciones del lenguaje dentro del marco conductista. Se caracterizan por el rechazo a la idea de lenguaje como expresión de procesos mentales; rechazan asimismo la noción de símbolo, y abogan por la utilización de términos como estímulo y respuesta.
Sin embargo, a pesar de estas aproximaciones, el lenguaje fue prácticamente relegado al olvido hasta los años 50 cuando, en medio de un optimismo general, los conductistas se decidieron a abordar su estudio sistemático. En este sentido, por ejemplo, el significado de las palabras se explicó por condicionamiento clásico: las palabras no son más que estímulos condicionados a objetos y eventos, de tal forma que producen respuestas condicionadas similares a las que tienen lugar ante los propios objetos o eventos que simbolizan. Sin embargo, en estos desarrollos neoconductistas se introduce un nuevo concepto que tiene ciertas connotaciones mentalistas y que permitió al conductismo ampliar el rango de fenómenos explicados: la idea de la mediación. De acuerdo a este concepto, existen cadenas de asociación estímulo-respuesta que no son directamente observables, sino encubiertas, y que permiten explicar los signos, el significado de éstos,...
Para los planteamientos neoconductistas, el otro mecanismo que daba cuenta de la conducta lingüística era el condicionamiento operante; era el responsable de muchos de los procesos de adquisición del lenguaje. Aunque otros autores le precedieron, Skinner fue sin duda quien ofreció la explicación más elaborada dentro de este enfoque, la más radical y la que más repercutió en el cambio de enfoque dentro de la Psicología del lenguaje. En su libro Verbal Behaviour (1957) se ofrece una visión completa de cómo las personas usan y adquieren el lenguaje en base a unos pocos principios de aprendizaje y reforzamiento: los niños aprenden a hablar por aproximaciones sucesivas al modelo del adulto. Estas aproximaciones son reforzadas por los padres de forma diferencial, de modo que las conductas verbales más aproximadas o correctas son las que más refuerzo obtienen. En palabras del propio Skinner, el aprendizaje de la conducta verbal no difiere en nada de los mecanismos que explican cómo las ratas o las palomas aprenden determinadas conductas en el laboratorio.
Sin embargo, en los años de la publicación de la obra de Skinner, algo estaba cambiando dentro de la hegemonía conductista estaba próximo. Y en el caso particular del lenguaje, una figura que no provenía de la Psicología fue decisiva en ese cambio: la del joven lingüista Noam Chomsky, quien en 1959, publicó una revisión teórica del libro Verbal Behaviour de Skinner.
Chomsky no se conformó con criticar la teoría skinneriana del lenguaje, sino que rechazó el paradigma conductista y sus principios básicos de forma global. Sus críticas se dirigieron principalmente a la imposibilidad de extrapolación de conceptos como estímulo-respuesta-refuerzo a la explicación de la conducta lingüística, y a la inadecuación de estos principios para explicar cómo los niños adquieren el lenguaje.
Skinner consideraba que su teoría del lenguaje era más científica que ninguna otra por su carácter objetivo, porque se basaba en nociones observables y había sido desarrollada a partir de trabajos en laboratorio. Chomsky criticó este punto de vista afirmando que la extrapolación al lenguaje humano de las nociones desarrolladas en el laboratorio con animales era científicamente absurda. Por tanto, la teoría del lenguaje de Skinner era una simple metáfora de lo obtenido en el laboratorio.
Las críticas de Chomsky no fueron menos devastadoras en lo concerniente a la adquisición del lenguaje. Si, como propone Skinner, el lenguaje es una conducta aprendida, como montar en bicicleta, los niños que aprenden un lenguaje deberían limitarse a repetir lo que oyen en su entorno. Sin embargo, esto no ocurre. Un niño con pocos años de edad es capaz de comprender y producir frases que no ha oído nunca en su vida. Es capaz de recombinar palabras de forma totalmente novedosa. En este sentido, el lenguaje es una actividad creadora, innovadora, libre del control de estímulos externos y que se adapta a situaciones nuevas y cambiantes. Además, a pesar de la complejidad que encierra la gramática de cualquier lengua, el niño la adquiere sin esfuerzo aparente y en período sorprendentemente breve. Para Chomsky, estos hechos no pueden explicarse a menos que se asuma que venimos al mundo con unos conocimientos innatos específicos, dotados con una gramática universal que sólo tiene que sintonizarse con la lengua del entorno. El lenguaje sería al hombre como el volar a los pájaros.
Como puede comprobarse, Chomsky no se limitó a criticar los postulados conductistas sobre el lenguaje. Además de afirmar que el lenguaje es innato y que la visión conductista estaba equivocada, su postura implicaba cambios más profundos:
1) Su teoría era claramente mentalista. El lenguaje no podía ser visto como una conducta sino que era mucho más importante lo que no se podía observar directamente: lo que se tiene que estudiar es la competencia lingüística, no su conducta manifiesta.
2) El lenguaje tiene una estructura interna compleja, no es una cadena lineal de palabras, como lo veían los conductistas. El lenguaje sólo puede explicarse por referencia a reglas. Además, dicha estructura es extremadamente compleja, jerárquica, y no existen indicios externos que permitan detectarla. Aún así, los niños la detectan y la utilizan con notable facilidad. Este hecho, para Chomsky, sólo se puede explicar si aceptamos que existe un esquematismo innato, una gramática universal con la que nacemos.
3) Chomsky desarrolló su propia teoría lingüística: la gramática generativa-transformacional.
Aunque el momento fundacional de lo que hoy entendemos por Psicolingüística suele situarse en Chomsky, tal afirmación es un tanto reduccionista. Aunque los postulados de Chomsky constituyeron piedras angulares para el nacimiento de la Psicolingüística, probablemente su impacto no hubiera sido tan grande sin los cambios que ya estaban produciéndose dentro de la Psicología y también de otras disciplinas.
Los hechos anteriormente citados y otros que veremos más adelante sugieren que el lenguaje es un rasgo biológico específico de nuestra especie. Es más un “instinto” (como la eco-localización del delfín, la habilidad tejedora de la araña o la visión estereoscópica de los primates) que una invención cultural. Esta concepción biologicista del lenguaje como producto de la selección natural está muy arraigada en la Psicolingüística moderna, de modo que merece la pena revisar brevemente algunas de las evidencias y argumentos en los que se basa:
1) Universalidad. No se conoce ninguna civilización humana, actual o no, que no haya tenido lenguaje. No obstante, hay un aspecto que parece contradecir el carácter biológico del lenguaje: la diversidad de lenguas. Existen centenares de lenguas en la actualidad y seguramente varios miles de ellas se habrán extinguido a lo largo de la historia. Además, el estudio diacrónico nos permite comprobar que las lenguas están en continuo cambio. La diversidad y el dinamismo parecen más propios de la invención y evolución de los artefactos culturales que de las destrezas innatas que, al ser gobernada por genes, deberían estar rígidamente determinadas.
La respuesta tradicional al problema de la variedad es que lo que es innato es el dispositivo de adquisición del lenguaje, no los idiomas.
2) Surgen antes de que sean necesarias. Cuando una función cognitiva emerge muy tempranamente y con una secuencia de desarrollo uniforme en todas las culturas, es muy probable que se trate de una capacidad innata. Los estudios experimentales muestran que los bebés de pocos meses de edad realizan las mismas discriminaciones fonéticas que los adultos. Por otra parte, los bebés se familiarizan muy pronto con los fonemas de su lengua, hasta el punto de que con una semana de vida ya prefieren su lengua materna a otras e, incluso, discriminan dos lenguas extranjeras entre sí. Sin embargo, a los dos meses, aunque mantienen la preferencia por la lengua propia, la discriminación entre lenguas extranjeras desaparece.
3) Hablar no es una decisión voluntaria del niño. Además, no está determinado por los estímulos externos. Esto lo demuestra el fenómeno llamado “la pobreza del estímulo” (Chomsky), del que hablaremos más adelante.
4) Los niños no requieren de instrucción formal para empezar a hablar.
5) Como acabamos de decir, existe un período crítico para aprender la lengua.
6) Los procesos lingüísticos son modulares y autónomos.
7) El desarrollo del lenguaje (al menos el oral) es similar en todos los niños, independientemente de la cultura en la que se encuentren. Además, el lenguaje es independiente de otros factores relacionados con factores socio-culturales.
Además de estas razones, se han utilizado otras para apoyar el innatismo del lenguaje:
1) Creatividad. Han existido momentos en la Historia en los que se han inventado lenguas nuevas. Algunas de estas lenguas nuevas han sido las denominadas lenguas “pidgin”. Las lenguas pidgin se caracterizan por su escasez de palabras-función (preposiciones, pronombres, verbos auxiliares,...) y la imperfección de su gramática. Lo más notable es que los hijos de los emigrantes no heredan el pidgin de sus padres ni las otras lenguas de su entorno. En cambio hablan una lengua criolla, que es una lengua uniforme (convencionalizada) y con una gramática completa y bien estructurada. En opinión de Bickerton (1990), la gramática de las lenguas criollas es una creación espontánea de los niños, pues no se parece a ningún modelo lingüístico de su entorno, lo cual indica que la capacidad de crear un lenguaje convencional y gramatical es un rasgo genérico y no ligado exclusivamente al canal audio-vocal.
2) En conjunto, los estudios que se han venido realizando durante las últimas décadas nos muestran interesantes capacidades de comunicación y una rudimentaria teoría de la mente en algunos monos. Pero sigue existiendo un gran abismo entre la facilidad “instintiva” con que los bebés humanos aprenden a hablar , y el penoso entrenamiento al que hay que someter a los monos para conseguir una competencia lingüística modesta. Esto último apoya la idea que las características específicas del lenguaje humano constituyen una adquisición filogenética específicamente humana y, por tanto, muy reciente.
3) En el cerebro contamos con áreas especializadas en diversos
aspectos del lenguaje. La gran mayoría de estas áreas se
encuentra situada en la zona adyacente a la cisura de Silvio izquierda
(área perisiliviana).
LA POBREZA DEL ESTÍMULO (CHOMSKY).
Los estudios de desarrollo temprano indican que el bebé viene predispuesto para fijar inmediatamente los parámetros fonológicos de su lengua a partir de su simple exposición al entorno lingüístico de los adultos. Pero el desarrollo posterior nos ofrece otros datos que sugieren la misma predisposición innata. El argumento de la pobreza del estímulo (Chomsky, 1959) es ilustrativo: el niño parece aprender más de lo que cabría esperar dada la escasa estructura de las situaciones (hay más información en la respuesta que en el propio estímulo). Ciertamente los padres no son completamente insensibles a las necesidades comunicativas de los bebés, sino que emplean una forma de lenguaje que se ha denominado “MATERNÉS”. Así, le hablan despacio, con frases cortas y exagerando mucho la entonación de las cláusulas, incluso antes de que los niños hablen por sí mismos. Sin embargo, los padres no suelen corregir los errores gramaticales de los niños, ni los someten a programas escalonados de refuerzos sobre pautas repetitivas; incluso hay padres o grupos humanos que prácticamente no se comunican con los bebés y, sin embargo, éstos aprenden a hablar. Otro problema que los niños parecen resolver muy bien a pesar de la pobreza del estímulo es el establecimiento del referente de palabras. ¿Cómo descubre un niño que la palabra “conejo” se refiere a una categoría particular de seres vivos?. Este problema admite respuestas. En primer lugar, el bebé humano viene cognitivamente “ajustado” para percibir ciertas invarianzas que tienen valor adaptativo y, en segundo lugar, la vinculación específica entre los objetos y sus nombres se facilita por un conjunto de índices deícticos que utilizan los adultos: las miradas y gestos de señalamiento de los adultos, coincidentes con sus palabras, orientan la atención de los bebés hacia los referentes.
Compárese la facilidad con que aprende un niño su lengua materna “a partir de cero” y sin ningún entrenamiento formal, con la dificultad que supone para un adulto el aprendizaje de una segunda lengua, generalmente ayudado por agentes educativo. Además, la primera lengua tiene una dominancia que nunca alcanzará una lengua aprendida en época adulta. La adquisición de la primera lengua se asemeja a un proceso de maduración, con un período crítico de desarrollo. Si se excede ese período como en el salvaje de Aveyron, u otros casos de privación extrema de experiencias, el niño no adquirirá un lenguaje pleno.
Evidencias a favor y en contra del argumento de la pobreza del estímulo:
Pruebas a favor:
-Los niños adquieren los principios abstractos del lenguaje.
-El desarrollo del lenguaje es similar en todos los niños,
independientemente de la cultura. La gramática se desarrolla,
aproximadamente, a la misma edad y con el mismo ritmo.
- Las lenguas, a pesar de sus diferencias, están basadas
en los mismos mecanismos.
Pruebas en contra:
- Brown y Hanion (1970) estudiaron las relaciones entre lo que el niño dice y las correcciones que realizan los padres. Encontraron que, en general, los padres no suelen corregir la gramática de los niños, pero sí la semántica:
Ejemplo: Un perro está bebiendo:
- “El perro bebiendo” => No se corrige.
- “El perro come”
=> Sí se corrige.
- Hirsh-Pasek et al. (1984). Los padres no corrigen la gramática de los niños entre tres y cinco años.
- McNeill (1965). Los niños de su estudio no eran receptivos a las correcciones de sus padres.
- Incluso, según los trabajos de Braine, Cazden,... las correcciones pueden ser negativas.
- Berko (1958). Inventó palabras (“wug” y “ricar”) y se las enseñó a los niños. Al construir frases, los niños utilizaban las reglas que habían aprendido en el lenguaje “normal” en las palabras “nuevas” => Para hacer el plural de “wug”, decían “wugs”.
- Ervin (1964). Los niños hipergeneralizaban las reglas
lingüísticas.
No obstante, y a pesar de las evidencias en contra, las pruebas
siguen apoyando el argumento de la pobreza del estímulo de Chomsky.
Bases genéticas del lenguaje.
Si el lenguaje, con sus propiades sintácticas, fuese una destreza innata cabría esperar que su desarrollo en el individuo estuviese gobernado por genes específicos. De momento existen algunas pruebas indirectas que favorecen la idea de un substrato genético del lenguaje. Así el llamado “Transtorno Específico del Lenguaje” (TEL) se observa en algunas familias cuyos miembros muestran un déficit selectivo en la aplicación de reglas morfológicas (p.ej. singular/plural), mientras que sus demás capacidades cognitivas son normales o superiores a la media. Por el contrario, los niños con Síndrome de Williams tienen déficits cognitivos muy específicos: tienen intactos el lenguaje y el reconocimiento de caras, pero padecen déficits severos en la aritmética, en la resolución de problemas, tareas espaciales, planificación,... y en Inteligencia CI (CI=50). Ello contrasta con el rendimiento de los niños con Síndrome de Down (con el mismo CI que los niños con síndrome de Williams), que manifiestan déficits cognitivos más generalizados , y rinden mucho peor en el lenguaje. Estos datos sugieren que el lenguaje es una destreza específica y no una manifestación de la “inteligencia general”; sin embargo, la prueba definitiva a favor de esta tesis, es decir, el hallazgo de los “genes de la sintaxis” o “los genes de la fonología”, todavía no se ha alcanzado.
Disociaciones entre el lenguaje y otras habilidades cognitivas.
¿Qué es una disociación? Es un fenómeno que se produce cuando una persona tiene dañado un proceso cognitivo (p.ej. sus mecanismos de Memoria a Corto Plazo) pero no tiene dañado otro (p.ej. la atención). Una disociación simple no garantiza que los procesos cognitivos sean independientes. No obstante, si existiese una disociación doble (encontrar dos personas: una con un proceso intacto y otro dañado y otra persona con síntomas inversos) quedaría demostrada la independencia de ambos procesos.
Ejemplos de disociación simple lo tenemos en :
- Síndrome de Turner: Se produce al poseer un cromosoma X menos. Las personas que lo sufren tienen déficits viso-espaciales, pero tienen el lenguaje intacto.
- Síndrome de Klinefelter: El sujeto tiene un cromosoma X más. Se producen déficits en el lenguaje, pero la Inteligencia General es normal.
Damasio y Damasio (1.992) Realizan un estudio y concluyen que la maduración de los procesos conceptuales y la del lenguaje son diferentes.
Los Transtornos Específicos del Lenguaje (TEL o Disfasia Evolutiva), mencionados más arriba, es un grupo heterogéneo de transtornos que tienen rasgos opuestos al Síndrome de Williams, ya que los afectados por estas enfermedades presentan graves problemas de lenguaje, pero tienen un CI normal.
Gopnik (1990-1994) estudió una familia que presentaba TEL (dieciséis miembros de una familia de treinta) y observó que los afectados cometían errores gramaticales. En base a sus resultados, Gopnik postuló que los TEL pueden deberse a la herencia de un gen dominante.
Estudios con lesiones cerebrales: Existen lesiones cerebrales
que afectan a otras capacidades y no al lenguaje, y otras lesiones que
afectan al lenguaje y no a otras capacidades.
1.2. LOS TEMAS DE LA PSICOLINGÜÍSTICA.
La Psicolingüística adopta una perspectiva psicológica en el estudio del lenguaje humano, ya que considera que el lenguaje no puede desvincularse de los organismos que lo poseen. Esta es, por lo tanto, una perspectiva centrada en el sujeto.
El lenguaje es una capacidad resultante de la constitución física y mental humana. Dicha capacidad se manifiesta en la conducta lingüística concreta.
El lenguaje es objeto de estudio psicológico por dos razones:
1) El lenguaje constituye una parte del repertorio de capacidades y comportamientos naturales del ser humano.
2) Posibilita formas particulares de relación/acción sobre el medio.
A la Psicología no le interesa el estudio del lenguaje como un producto acabado, en sí mismo, sino cómo se adquiere, se usa y resulta funcional para la especie humana. Por lo tanto, la Psicolingüística, como rama de la Psicología, tiene cometidos y contenidos diferenciados claramente de los de otras disciplinas. En concreto, persigue tres objetivos:
1) El estudio de las actividades de comprensión y producción. Interesan las dos modalidades de lenguaje: la oral y la escrita. Obviamente, la Psicolingüística se interesa por ambos tipos de lenguaje pero, paradójicamente, se ha investigado mucho más el lenguaje escrito que el oral. La razón de este desfase es sobre todo metodológica, ya que es más fácil preparar experimentos en los que los estímulos se presenten por escrito en la pantalla del ordenador que aquellos en los que haya que presentar estímulos orales. No debemos olvidar que hay diferencias importantes entre el lenguaje oral y el escrito que pueden determinar procesos específicos en ambas modalidades. Algunas de estas diferencias son:
- Velocidad y controlabilidad del input: El lenguaje oral tiene una limitación temporal, y el control reside en el hablante, mientras que en el lenguaje escrito el control está en la persona que recibe la información.
- Modalidad del input: El mensaje oral consiste en un patrón de ondas acústicas mientras que el mensaje escrito es un patrón de formas visuales.
- La segmentación de las unidades lingüísticas: En el lenguaje escrito las palabras aparecen segmentadas de modo explícito, pues están separadas por espacios en blanco. En cambio, en el lenguaje oral no hay tal separación.
- Rasgos prosódicos del habla: En el lenguaje oral existen varios indicios prosódicos que están ausentes en la escritura.
- El contexto comunicativo: Una de las funciones básicas del lenguaje, la comunicación, es más propia del lenguaje oral que del escrito.
Como consecuencia de estas diferencias, los resultados que se obtienen al investigar el lenguaje escrito no se pueden generalizar sin más al lenguaje oral (y viceversa).
2) El estudio de las funciones cognitivas y comunicativas.
3) El estudio de los procesos de adquisición del lenguaje y de deterioro del mismo.
1.3. PSICOLINGÜÍSTICA Y OTRAS CIENCIAS DEL LENGUAJE.
1.3.1. La Lingüística.
La Lingüística es la ciencia del lenguaje por antonomasia,
y aquella que tiene una mayor tradición histórica, pues se
remonta a la época de los griegos. A su vez, tiene multitud de especialidades
que tratan los aspectos más concretos del lenguaje, tales como la
fonética, la prosodia, la sintaxis,... En general, el objeto de
la Lingüística es el análisis de los elementos formales
que constituyen una lengua y las reglas y principios que rigen la
relación entre estos elementos.. Por su parte, a la Psicolingüística
le interesan más bien los procesos cognitivos que posibilitan la
comprensión y producción del lenguaje. Obviamente, los conocimientos
lingüísticos pueden tener un gran valor para las investigaciones
psicolingüísticas. No obstante, los conocimientos lingüísticos
no son suficientes para desvelarnos cómo se procesa el lenguaje.
La Lingüística, con su metodología descriptiva, nada
nos dice sobre las características funcionales del sistema cognitivo
que ejecuta los procesos del lenguaje ni sobre los mecanismos y estrategias
de los que se vale. Por su parte, la Psicolingüística utiliza
el método empírico, centrado en el sujeto REAL, en el uso
cotidiano del lenguaje, al contrario que la Lingüística, que
estudia el lenguaje IDEAL, la COMPETENCIA lingüística.
1.3.2. La Neuropsicología
El lenguaje ha sido muy estudiado en las Neurociencias. Algunos de los datos obtenidos en la Neuropsicología son ya de dominio público. Por ejemplo, el papel de las estructuras perisilvianas (el área de Broca y el área de Wernicke) del hemisferio cerebral izquierdo en las funciones lingüísticas ha sido constatado en multitud de investigaciones. Sin embargo, este modelo “clásico” de la organización neuronal del lenguaje ha sido considerablemente matizado en los últimos años, y el panorama es bastante más complejo de lo que inicialmente se pensó.
Tanto los estudios con patología cerebral como los que
utilizan el cerebro sano han arrojado datos que han servido para avanzar
en los conocimientos psicolingüísticos.
1.3.3. La Ciencia Cognitiva.
La Psicolingüística, como rama de la Psicología Cognitiva, se basa en el supuesto de que las funciones del lenguaje se pueden describir como si se tratase de programas de ordenador, es decir, en términos de representaciones simbólicas y reglas de cómputo aplicadas a esos símbolos. La fundamentación teórica de la Psicolingüística está próxima, por tanto, a la “metáfora del ordenador” o paradigma simbólico-computacional. Esta proximidad a las ciencias computacionales ha propiciado, en algunos casos, que los psicolingüistas desarrollen simulaciones de la comprensión o de la producción del lenguaje. Esta metodología resulta especialmente útil, no tanto como método empírico, sino más bien como instrumento para depurar teorías. Sin duda, las simulaciones que están teniendo más influencia en la Psicología Cognitiva actual son las basadas en los principios conexionistas. Los modelos conexionistas están formados por redes compuestas de un gran número de unidades o nodos interconectados, similares a las neuronas. Su atractivo reside en esta similitud abstracta con la organización y el funcionamiento del sistema nervioso. Para el conexionismo no existen representaciones localizadas en la memoria, sino patrones de activación distribuidos; el procesamiento no es serial sino paralelo; además, las redes conexionistas pueden “aprender” por sí mismas. Para el conexionismo, la “metáfora del ordenador” debe ser sustituida por la “metáfora del cerebro” como modelo de la mente.
1.4. ARQUITECTURA FUNCIONAL. Día 19/11/99
El lenguaje es una función mental como lo son la memoria, la atención o la conceptualización. Pero, además, el lenguaje es una función mental particularmente compleja, que implica el trabajo cooperativo de varios mecanismos. Por ello se suele hablar de la "arquitectura funcional" del lenguaje que incluye un conjunto de niveles de procesamiento., acerca de cuya existencia existe un gran consenso. Si nos limitamos a los procesos de comprensión, por ejemplo, podremos hablar de:
1) mecanismos responsables del procesamiento ortográfico y fonológico
(análisis sensorial),
2) mecanismos responsables del procesamiento léxico,
3) mecanismos responsables del procesamiento sintáctico,
4) mecanismos responsables del procesamiento semántico o del
discurso.
Como acabamos de decir, hay una aceptación general entre los psicolingüistas de la "realidad" psicológica de estos niveles de procesamiento y del interés de los temas subsiguientes de investigación. Sin embargo, la comprensión de la arquitectura funcional del lenguaje es algo más que la identificación de los procesos: supone, además, que debemos explicar su organización temporal y el modo en que se comunican entre ellos. En este sentido hay dos nociones de arquitectura funcional bien diferenciadas en Psicolingüística. En primer lugar, las teorías modulares que, a veces, postulan un funcionamiento serial de los niveles de procesamiento o módulos y, sobre todo, una comunicación unidireccional de "abajo arriba" entre ellos: cada módulo envía información al módulo siguiente, pero no recibe información de éste, de modo que cada módulo es autónomo. Por el contrario, las teorías interactivas consideran que los mecanismos de procesamiento pueden funcionar simultáneamente y el flujo de información discurre en ambas direcciones.
El marco teórico de las teorías modulares ha sido claramente sistematizado por el filósofo Jerry Fodor (1.983), en relación a los procesos de comprensión del lenguaje. Algunas características importantes de los módulos son las siguientes:
1) Los módulos son específicos de dominio, es decir, están
especializados en un tipo particular de estímulos.
2) Los módulos funcionan de forma obligatoria; una vez presentado
el estímulo apropiado, no podemos evitar procesarlo o comprenderlo.
3) La información procesada por los módulos es poco accesible
a la conciencia, de modo que las representaciones intermedias producidas
por los módulos (fonemas, forma ortográfica,...) se desvanecen
sin apenas consciencia de ellos.
4) Los módulos son rápidos, sus procesos se desarrollan
en el rango de pocos milisegundos ( por ejemplo, el acceso al significado
de las palabras ocurre en menos de 100 ms.).
5) Los módulos están encapsulados, es decir, la información
entre módulos adyacentes fluye de abajo-arriba, pero nunca de arriba-abajo.
El encapsulamiento o autonomía de los módulos es la propiedad
más distintiva de la concepción modular y la más debatida.
6) Los módulos tienen una arquitectura neuronal fija, de modo
que cabe esperar circuitos neurales que corresponden a los diversos niveles
de procesamiento del lenguaje.
7) El desarrollo ontogenético de los módulos sigue una
secuencia (generalmente temprana) fija o madurativa, lo cual es compatible
con una concepción innatista del lenguaje.
Las ventajas de una concepción modularista son obvias. Dada la autonomía funcional de los módulos, los investigadores pueden ser también "modulares" en su estrategia metodológica. La "metodología modularista" proporciona beneficios importantes, pues puede investigarse acerca de un módulo soslayando los demás. No obstante, cabe preguntarse si la modularidad del procesamiento del lenguaje es "real" o es, por el contrario, una propiedad convenida por un grupo de autores. La evidencia empírica señala que los primeros pasos (fonológico, ortográfico, léxico y quizá sintáctico), más tempranos y periféricos, pueden funcionar de esta forma, pero la noción de modularidad pierde fuerza en los niveles superiores del procesamiento. Así, la comprensión no implica no sólo la representación de los fonemas, las palabras o las estructuras sintácticas a partir de un mensaje lingüístico, sino también la representación de la situación a la que se refiere el mensaje, y esto ya no lo hace un módulo sino el procesador central, que es exactamente lo contrario de un módulo: es de propósito general (no especializado), no es automático, es accesible a la conciencia, es flexible, multimodal, etc.
Como contraposición a la postura de los teóricos modularistas
está el enfoque denominado arquitectura interactiva, la cual asume
que los mecanismos de procesamiento (el equivalente a los módulos)
tienden a funcionar simultáneamente o en paralelo y, además,
el flujo de información entre ellos es bidireccional. Los efectos
contextuales descritos en multitud de investigaciones favorecen la noción
de interacción, aunque las teorías modulares también
tratan de explicar este efecto atendiendo más a una propiedad derivada
del funcionamiento interno de los módulos que a una retro-alimentación,
tal y como defienden las teorías interactivas. Cabe destacar, no
obstante, que los efectos contextuales han sido mejor explicados por las
teorías interactivas que por las modulares.
TEMA 2: LA PERCEPCIÓN DEL HABLA.
Capítulo 2 del Manual de Manuel de Vega y Fernando Cuetos (1.999).
1.- CARACTERÍSTICAS FÍSICAS DEL HABLA. Día 19/11/99
-Percibir el habla no requiere esfuerzo consciente.
-Este sistema es muy eficaz en todo tipo de condiciones que distorsionan
la señal.
-Es un sistema flexible, adaptativo y automático.
Estas propiedades que acabamos de formular acerca del lenguaje pueden enmascarar la increíble complejidad del lenguaje. Normalmente, creemos que somos capaces de percibir el habla sin distorsiones, sin fallos. Esta creencia (falsa, ya lo veremos) es perfectamente extrapolable a otras funciones perceptivas que desarrollamos cotidianamente. Efectivamente, puede suceder con cierta frecuencia que nuestros sentidos nos engañen. El caso de la percepción del habla no es una excepción, siendo, incluso, uno de los casos más representativos de este fenómeno, tanto por la complejidad de los procesos implicados como por el escaso nivel de correspondencia entre la experiencia subjetiva de los hablantes y las características físicas de los estímulos. Es decir, la onda acústica del habla no corresponde exactamente a los segmentos de las palabras que percibimos.
El habla es una onda sonora provocada por las vibraciones producidas en un medio; en este caso, el aire. Estas vibraciones provocan cambios de presión en el aire que son captados por el oído humano. Estas ondas sonoras pueden diferir en diversas variables como tamaño o amplitud (volumen), rapidez (o frecuencia) o duración.
La onda fundamental y los armónicos de dicha onda fundamental están producidos por la vibración de las cuerdas vocales y la modificación- modulación del grupo fonador, que funciona haciendo resonar o amortiguando algunos armónicos.
La característica física del habla que más sobresale es, sin duda, su versatilidad, ya que la variedad de fonemas que puede emitir el ser humano es infinito, ya que hay fonemas que existen en unas lenguas y no en otras.
2.2. DE LA SEÑAL AL CÓDIGO LINGÜÍSTICO.
Se suele considerar la percepción del lenguaje como el
conjunto de mecanismos que nos permiten pasar de la señal acústica
(del habla) a una representación mental del significado de las palabras
que encierra dicha señal. Podemos considerar que estos mecanismos
van a consistir en el cómputo, a partir de la señal, de las
unidades lingüísticas relevantes (fonemas, sílabas,
morfemas,...) que van a permitir el acceso al léxico mental.
* La manera en que solemos concebir el lenguaje está viciada por la escritura. Por esta razón, tendemos a creer que de la misma forma que las letras se siguen las unas a las otras, de forma más o menos clara, en los textos, las unidades lingüísticas (los fonemas, las sílabas,...) se siguen las unas a las otras en el habla. No solamente es falsa esta afirmación, sino que además, a diferencia de las letras, que siempre se escriben de la misma manera independientemente de donde se encuentren, los fonemas pueden sonar de forma totalmente distinta, en función de su contexto
* El habla es el resultado final de una compleja interacción entre diferentes partes de nuestro organismo: el sistema respiratorio, la laringe y el grupo fonador, que será el encargado de modular el sonido que generan las cuerdas vocales, de manera que se produzcan las diferentes unidades del habla. Al variar las partes móviles de este grupo obtendremos los diferentes fonemas, y de este modo, pequeñas modificaciones darán origen a distintas palabras.
Aquí existe un problema, ya que la percepción humana no posee mecanismos asociativos unívocos entre claves acústicas y elementos mentales. Esto es, los sonidos del habla no están organizados como eslabones de una cadena, no son lineales. Una consecuencia importante de la ausencia de linealidad del habla es que no existe una delimitación clara entre las distintas unidades lingüísticas en la señal acústica (no hay espacios “en blanco” entre las palabras) y, por lo tanto, otra de las tareas que tendrá que resolver el sistema de percepción del habla es la segmentación: cómo pasar de una señal que varía de forma continua a unidades lingüísticas discretas.
No son éstos los únicos aspectos de la señal del habla que inciden sobre el fenómeno de la falta de correspondencia entre la señal acústica y los fonemas, siendo otra característica relevante la ausencia de invarianza. Esto se refiere a que existe una falta de correspondencia biunívoca entre fragmentos de la señal y los segmentos fonéticos. No hay conjuntos invariantes de patrones acústicos iguales a unidades lingüísticas discretas.
Por tanto, a modo de resumen, diremos que existe una falta de correspondencia entre la señal acústica y el fonema, lo cual plantea problemas muy relacionados:
? Ausencia de linealidad.
? Ausencia de invarianza.
? Segmentación.
Estos problemas tienen su origen en la coarticulación. Esto es, los fonemas no se articulan por separado, sino que los órganos fonadores ajustan su posición para emitir la configuración (el fonema) siguiente.
Más características relacionadas con la variabilidad son:
? La variación entre los diferentes interlocutores (los
fonemas dependen del hablante).
? Hay variaciones en el TONO, es decir, en la frecuencia fundamental
de la voz.
? Existen efectos de la velocidad sobre las claves acústicas.
? Existe una contribución de las claves visuales. Esto
se demuestra con el denominado “Efecto McGurk” , que toma su nombre de
un trabajo de McGurk y McDonald en 1.976 en el cual se presentaba a los
sujetos un vídeo sin sonido que presentaba a una persona emitiendo
la pronunciación de la sílaba “BA”, más un sonido
(la sílaba “GA”). Los sujetos decían oír “DA”, ni
“BA” (percibido visualmente), ni “GA” (sonido oído realmente).
La percepción categórica.
El problema de la traducción de la señal continua en representaciones lingüísticas discretas ha sido resuelto en el ámbito teórico de dos formas. En primer lugar, la mayoría de los modelos sobre la percepción del habla ha presupuesto que la falta de invarianza y la segmentación se solventa en un nivel pre-léxico, esto es, que la señal se estabiliza en un formato canónico antes de que se produzca el acceso a la información léxica. En segundo lugar, otros modelos han presupuesto que no existe tal nivel de procesamiento pre-léxico y que la señal se proyecta más o menos directamente en el léxico (véase la figura siguiente).
HIPÓTESIS PRE-LÉXICA
LÉXICO MENTAL <== UNIDADES PRE-LÉXICAS <== HABLA
(fonemas, sílabas,...)
HIPÓTESIS DEL ACCESO DIRECTO
LÉXICO MENTAL <===== HABLA
El primer tipo de modelos, agrupados bajo la hipótesis
pre-léxica, va a ubicar la resolución de los problemas de
variación y falta de segmentación fuera del léxico;
mientras que el segundo tipo de modelos, defensores de la hipótesis
del acceso directo, va a tener que presuponer un léxico más
rico en información que pueda resolver los problemas que plantea
la señal.
2.3.1. La hipótesis pre-léxica.
* Dada la naturaleza variable de la señal del habla, para este tipo de modelos no parece absurdo presuponer que el sistema perceptivo va a emplear “ventanas” de procesamiento en las que estabilizaría dicha información. Se han propuesto diversas unidades (fonemas, sílabas, morfemas,...), y los resultados en favor de una u otra unidad dependen tanto del tipo de material, como de la tarea que esté llevando a cabo el sujeto. Una postura conciliadora sería la de proponer que en el camino hacia el léxico se computan diversas unidades, que van a ser más o menos accesibles según las demandas de la tarea, aunque en este caso quedaría por explicar el cómo y el porqué de las diferencias en la accesibilidad.
* Uno de los aspectos más importantes a la hora de determinar la accesibilidad de las diferentes unidades de procesamiento tiene que ver con las características fonológicas de la lengua del hablante. Si bien es cierto que los aspectos atencionales juegan un importante papel, también lo es que en situaciones experimentales totalmente comparables los hablantes de distintas lenguas parecen tener disponibles, de forma diferenciada, distintas unidades de procesamiento. Este punto será tratado con mayor detalle más adelante.
* Para los modelos preléxicos, la percepción del habla implicaría dos estadios de procesamiento:
A) Los procesos pre-léxicos, encargados de transformar la señal
acústica en una representación lingüística pre-léxica.
B) El acceso al léxico propiamente dicho.
Dentro de este grupo estarían modelos como la teoría motora de la percepción del habla, el modelo de rasgos invariantes,...
2.3.1.1. La teoría motora de la percepción del habla.
* Tras observar que la señal del habla era variable y que no existía una correspondencia unívoca entre especificaciones físicas y unidades lingüísticas, Liberman y sus colaboradores (Liberman et al., 1967) propusieron que la percepción del habla no se realizaba directamente a partir de la señal acústica, sino a partir de su producción (articulación). Mientras que las características físicas de consonantes como /d/ varían considerablemente según se encuentren en las sílabas /di/ o /du/, la forma en la que posiciona la lengua tras los dientes es la misma, por lo que estos autores propusieron que en la percepción del habla los oyentes hacen referencia a sus propios códigos articulatorios (motóricos). Dado que somos capaces de producir el habla, conocemos, de forma implícita, las consecuencias que en la señal tiene la coarticulación y la correspondencia entre unidades lingüísticas y gestos articulatorios; así, para percibir el habla haríamos uso de este conocimiento implícito.
* La teoría motora de la percepción del habla también presupone que percibir el habla no es igual a percibir cualquier otro tipo de sonidos y que el funcionamiento básico de este mecanismo perceptivo está determinado por nuestro patrimonio genético. A nivel anatómico está realizado por áreas específicas del cerebro (en áreas del hemisferio izquierdo, propias del lenguaje) y a nivel funcional muestra efectos que también le son específicos, y que no se observan ni cuando otras especies perciben el lenguaje, ni cuando los seres humanos percibimos otro tipo de sonidos no-lingüísticos.
* Ya hemos visto que la realización precisa de una unidad lingüística (en este caso, un fonema) en la señal del habla es muy variable, pero que la experiencia fenomenológica que tenemos los hablantes es totalmente contraria, esto es, que las unidades lingüísticas son estables. De hecho, si no fuera porque el análisis físico de la señal muestra que las ondas acústicas que correponden a las consonantes iniciales de las sílabas /di/ y /du/ son distintas, tan sólo a partir de nuestra experiencia consciente sería imposible saberlo. Sin embargo, si escuchamos por separado las porciones de la onda que distinguen ambas consonantes, no tenemos ningún problema para darnos cuenta de que se trata de sonidos distintos. Por lo tanto, la imposibilidad de percibir estas diferencias no puede deberse a limitaciones de nuestro sistema sensorial, sino a que el habla es percibida de un modo distinto a como percibimos cualquier otra onda sonora.
LA PERCEPCIÓN CATEGÓRICA.
Otro efecto que tradicionalmente también se ha considerado que muestra la especificidad de la percepción del habla y que por consiguiente respalda la teoría motora es el de la percepción categórica. La percepción categórica suele definirse como la imposibilidad de discriminar sonidos mejor que identificarlos. En otras palabras, una vez que un sonido se ha categorizado como perteneciente a una determinada categoría fonética, es muy difícil distinguirlo de otros ejemplares de la misma categoría; así, por ejemplo, aunque debido a diferencias en la velocidad de pronunciación dos sílabas /ba/ pueden ser físicamente bastante diferentes, un oyente puede no ser capaz de percibir las diferencias; mientras que en el caso de dos sonidos que se hayan clasificado como /ba/ y /pa/, aunque sean físicamente muy similares, un oyente no tendrá ningún problema para discriminarlos.
En un estudio clásico de percepción categórica, se sintetizan estímulo que constituyen un continuo desde una determinada categoría (por ejemplo, /pa/) a otra diferente (/ba/). Las tareas que suelen llevarse a cabo son dos: una tarea de identificación ("¿Has escuchado /ba/ o /pa/?")y una tarea de discriminación (Se presenta un estímulo, /da/ por ejemplo, y se pregunta con qué sílaba (/ba/ o /pa/) se parece lo que acaba de oír).
La teoría motora del habla defiende que las diferencias entre los distintos fonemas son cuantitativas, no cualitativas. La variable que determina las diferencias entre los fonemas es el TIV o Tiempo de Inicio de la Verbalización. Expliquemos esto con un ejemplo: la diferencia entre las consonantes sonoras y las sordas está en el TIV, más concretamente, en el desfase temporal entre la emisión del sonido y la oclusión:
TIV < 25 milisegundos ? "B" ?
TIV > 25 milisegundos ? "P"
No obstante, Liberman y sus colaboradores realizaron un experimento en 1.957 donde se presentaban pares de estímulos:
? Si se presentaban dos estímulos, uno a los 10ms y otro a los
40ms, la "B" y la "P" eran
percibidas como iguales.
? Si se presentaban dos estímulos con la misma diferencia temporal
que los anteriores (30ms), pero uno se presentaba a los 20ms y el otro
a los 50ms, ya no se percibían "B" y "P" como iguales, sino que
los sujetos diferenciaban "B" y "P".
La conclusión principal que se extrae es la siguiente: percibimos el habla categóricamente, aunque los límites entre las diferentes categorías no se encuentran en la señal acústica. Es decir, categorizamos los sonidos como un fonema, pero esta categorización no está determinada por las características físicas de la señal.
* Estos y otros datos empíricos han apoyado la teoría motora del habla pero, no obstante, tanto el presupuesto de especificidad de la especie humana como el de que la percepción categórica tan sólo ocurre para estímulos lingüísticos han sido cuestionados, puesto que se ha verificado su existencia en estudios con otros mamíferos. Por otra parte, los estudios con músicos profesionales han mostrado que los humanos también perciben de forma categórica estímulos no-lingüísticos, en concreto, notas e intervalos musicales.
* Sin pecar de exagerados podemos afirmar que esta teoría ha
sido y es el punto de referencia básico, tanto para defenderla como
para rebatirla, de la gran mayoría de estudios sobre la percepción
del habla. Como acabamos de mencionar, algunos de los datos en los que
se basaba la teoría fueron cuestionados con posterioridad,
especialmente los datos originales sobre la percepción categórica.
Investigaciones posteriores han mostrado que, contrariamente a lo que se
consideró en un primer momento, las categorías fonéticas
tienen una estructura interna, con una gradación en términos
de buenos y malos ejemplares, que puede caracterizarse en términos
de prototipos. De todos modos, incluso aceptando que el fenómeno
de la percepción categórica puede ser explicado por medio
de un mecanismo auditivo general, ello no supondría tener que descartar
por completo el presupuesto de la especificidad del procesamiento del habla.
2.3.1.2. El modelo TRACE. Día 26-11-99
A diferencia de la teoría motora de la percepción del habla, el modelo TRACE no pretende tan sólo explicar cómo se pasa de la señal acústica a una señal lingüística, sino que también pretende ser un modelo de cómo se identifican las palabras en el léxico mental. Sin embargo, aunque de hecho asume algún tipo de procesamiento previo que permite la identificación de los rasgos articulatorios en la señal (que a su vez permiten identificar los fonemas), el impacto que TRACE ha tenido en los estudios de la percepción del lenguaje se ha basado sobre todo en su hipótesis sobre el modo en que ocurre la identificación de las palabras. Desde el punto de vista de la arquitectura, tiene una estructura característica de los modelos interactivos, conexionistas (redes neuronales) localizacionistas de expansión de la activación. En la figura 2.6. se muestra una representación esquemática de este modelo.
Según este modelo, un conjunto de detectores de rasgos se encargaría de identificar directamente en la señal del habla información que correspondería de una forma bastante aproximada a lo que los lingüistas han descrito como rasgos distintivos. Aunque Elman y McClelland no tienen, en principio, ninguna preferencia teórica por la elección de una unidad lingüística frente a otra en el nivel superior al de los detectores de rasgos , emplean nodos que representan los fonemas. Así, pues, la información procedente del nivel de los detectores de rasgos, emplean nodos que representan los fonemas. Así, pues, la información procedente del nivel de los detectores de rasgos converge en el nivel fonético, que a su vez envía información al nivel de las palabras (retroalimentando al mismo tiempo el nivel de los rasgos y siendo él mismo retroalimentado por el nivel de las palabras). Los diferentes niveles de nodos están altamente interconectados bidireccionalmente, mediante conexiones de tipo activador entre niveles y de tipo inhibidor intranivel. Los nodos correspondientes a cada uno de los niveles se disparan cuando la activación alcanza un umbral determinado y, en este punto, la activación se expande a los nodos con los que se encuentra conectado, a través de conexiones ponderadas según el valor de ciertos pesos.
Figura 2.6. Representación del modelo TRACE.
Uno de los mayores atractivos de TRACE es su capacidad para representar (y explotar) la falta de invarianza de los fonemas en función del contexto. Esta característica de la señal del habla se implementa en TRACE por medio de conexiones ponderadas entre los nodos de los rasgos de las vocales y los de las consonantes que las anteceden. Estas conexiones ponderadas hacen que cuando, por ejemplo, se activa el fonema /p/ perteneciente a la sílaba /po/ se active al mismo tiempo la vocal /o/, dando lugar a un patrón de activación distinto de cuando se activa contexto el fonema /p/ en el contexto de la sílaba /pa/.
A pesar de que TRACE, tal y como fue descrito por Elman y McClelland
en 1986 y 1989, puede considerarse un prototipo, ya que no aborda buena
parte de las cuestiones fundamentales de la percepción del lenguaje
(la variabilidad interlocutores, ...), posee un vocabulario muy reducido
(tan sólo palabras monosilábicas) y no trata con señales
del habla real, sino precodificadas, su impacto en los estudios de psicolingüística
ha sido enorme. Por lo tanto, al evaluar la plausibilidad de TRACE como
modelo de percepción del habla hay que ser cuidadoso.
2.3.2. La hipótesis del acceso directo.
En contra de la hipótesis de que es necesario un código
de acceso al léxico se encuentra la hipótesis de que la señal
del habla se proyecta de forma continua en el léxico mental. Por
lo tanto, no existiría una diferenciación entre los procesos
pre-léxicos y los de acceso al léxico, sino que la percepción
del habla se resolvería en un mismo estadio de procesamiento. En
este grupo se encuadran entre otros el modelo LAFS, el modelo de Cohorte
II, o las recientes propuestas de la teoría de la percepción
directa.
Estos modelos suelen solventar el problema de la segmentación
de la señal asumiendo que el sistema perceptivo humano toma muestras
de la señal cada n milésimas de segundo y que esta información
es la que contacta directamente con el léxico. Dentro de este tipo
de modelos hay que distinguir entre aquellos que, a pesar de no plantear
proceso alguno de normalización previa al léxico, asumen
que la información que en él se encuentra almacenada tiene
una forma canónica, de aquellos que presuponen que en el léxico
se encuentra almacenada toda la información de todas las instancias
de cada una de las palabras que hemos oído a lo largo de nuestra
vida y que es sobre la base de esta información como se produce
el reconocimiento de las palabras.
2.3.2.1. El modelo de Cohorte II.
De entre los distintos modelos que aparecieron en la década
de los setenta y principio de los ochenta para explicar el proceso de reconocimiento
de palabras, el único que fue diseñado específicamente
para tratar el lenguaje oral fue el de Cohorte (Marslen-Wilson y Welsh,
1.978,...). Según este modelo, el reconocimiento de palabras ocurre
básicamente de “izquierda a derecha”, es decir, que la selección
en el léxico mental está determinada sobre todo por el inicio
de la palabra. De hecho, según esta teoría, el principio
de las palabras selecciona un conjunto de unidades del léxico (las
que empiezan de dicha manera), que va a constituir un espacio de decisión
dentro del cual va a encontrarse la palabra que estamos percibiendo (a
este espacio de decisión se le denomina cohorte). A medida que vamos
escuchando la señal acústica, la información entrante
va desestimando elementos de la cohorte, hasta que tan sólo queda
un único candidato. En ese momento, se habrá reconocido la
palabra. En la mayoría de los casos, el reconocimiento de las palabras
ocurrirá antes de que éstas finalicen. El momento concreto
en el que se produce el reconocimiento de la palabra se llama punto de
identificación, esto es, el momento en el que una palabra se convierte
en única, porque no hay ninguna otra posible en el análisis
de izquierda a derecha.
Ejemplo de reconocimiento de palabras según el modelo de Cohorte:
Palabra: claxon (/klakson/) El análisis que se realiza es:
/kl/ => /a/ => /k/ => /s/ => /o/ => /n/
Paso 1: Se seleccionan las palabras que comiencen por /kl/.
Paso 2: Se seleccionan las palabras que comiencen por /kla/.
Paso 3: Se seleccionan las palabras que comiencen por /klak/.
Paso 4: Se seleccionan las palabras que comiencen por /klaks/.
Aquí sucede el punto de identificación, pues no hay otra
palabra posible que empiece
por esa configuración fonética (/klaks/).
Si bien la primera versión del modelo Marslen-Wilson propone que las unidades que se computan inicialmente para contactar el léxico mental son los fonemas, en la segunda versión esta etapa del reconocimiento de palabras se ve modificada de forma importante de dos maneras. En primer lugar, considera que la información acústica es evaluada de forma continua, y no sobre la base de ventanas de procesamiento (unidades pre-léxicas). Sin embargo, aunque Marslen-Wilson recoge la propuesta de Klatt, según la cual se llevaría a cabo un análisis espectral de la señal cada 30 milisegundos y que ésta sería la información con la que se contactaría el léxico, la realidad es que presupone un nivel de procesamiento pre-léxico en el que esta información espectral se proyectaría en unidades que corresponderían a los rasgos articulatorios. A partir de las activaciones relativas de estas unidades se activarían las palabras en el léxico mental. Esto nos lleva a la segunda modificación del modelo, es decir, ahora se presupone que las palabras forman parte de la cohorte inicial de acuerdo con una función de activación, en lugar de ser de todo o nada, como ocurría en la primera versión.
A pesar de tener muchas cualidades atractivas, el modelo sigue
padeciendo la limitación que impone la gran importancia que se asigna
a las porciones iniciales de las palabras: un error en la percepción
de os fonemas iniciales debería comportar la práctica imposibilidad
de reconocimiento de una palabra, cosa que no ocurre.
2.3.2.2. La teoría de la percepción directa (Fowler, Pisoni et al.,...).
Pisoni y sus colaboradores han propuesto un modelo de percepción del habla según el cual el léxico mental no estaría compuesto de representaciones lingüísticas (abstractas) correspondientes a las diferentes palabras que conocemos, sino que estaría formado por el conjunto de las diferentes ocurrencias de cada palabra que hemos percibido a lo largo de nuestra vida; esto es, cada vez que oímos una palabra se crearía una nueva huella de memoria que expandiría nuestro léxico mental. Por lo tanto, no sería necesaria ninguna mediación cognitiva para que se produjera la percepción del habla. Según esta teoría, la percepción del habla no se lleva a cabo por medio de mecanismos específicos del lenguaje, sino a partir de los mecanismos generales de la percepción auditiva y el léxico mental formaría parte de la memoria episódica general del sujeto.
La base empírica se encuentra en una serie de estudios que muestran que el reconocimiento de palabras se ve afectado por variables que tradicionalmente se han considerado propias de la memoria episódica y no del léxico mental. Por ejemplo, Goldinger (1.992) encontró que la memoria implícita para palabras es función del número de locutores en la lista (2, 6 o 10) y del intervalo entre la fase de estudio y la de prueba (5 minutos, 1 día o 1 semana). En este experimento la tarea que tenían que realizar los sujetos fue la de identificación de palabras sobre un fondo de ruido. Goldinger observó que la identificación de las palabras era mejor cuando el locutor escuchado en la fase de prueba coincidía con el locutor de la fase de estudio.
Aunque se trata, sin lugar a dudas, de una propuesta atrevida,
no está exenta de críticas. En concreto, tal vez la más
importante sea la de que su fundamento empírico se basa en pruebas
típicamente de memoria (recuerdo libre, ...), en las que es innegable
que variables de memoria van a jugar un papel relevante. Otra crítica
importante es la de su pobreza para explicar las diferencias translingüísticas.
2.4. INFLUENCIAS INTERLINGÜÍSTICAS.
Es evidente que un modelo sobre el procesamiento del lenguaje en general, y sobre la percepción del habla en particular, tiene que dar cuenta de los mecanismos que subyacen al procesamiento del lenguaje en todos los seres humanos. Hasta aquí hemos estado revisando cuáles son las características generales tanto del estímulo como del procesamiento, que serían de aplicación para cualquier ser humano hablando cualquier lengua. Ahora bien, la investigación en el campo de la percepción del lenguaje ha mostrado que existen diferencias en la manera precisa en la que los problemas que hemos subrayado más arriba se resuelven, y que estas diferencias parecen estar condicionadas por las características fonológicas de la lengua del hablante.
Estas diferencias pueden observarse a distintos niveles de procesamiento y vamos a revisarlos en orden “creciente” desde el punto de vista del tamaño de la unidad de procesamiento: los fonemas, las sílabas y los grupos acentuales.
2.4.1. ¿Por qué los japoneses no distinguen “cara” de “cala”?.
Existen importantes diferencias en el inventario fonético de las distintas lenguas; sin ir más lejos, el número de fonemas es un parámetro que oscila entre 20 y más de 140. El inventario fonético de cada lengua se aprende en los primeros años de vida y determina de forma importante nuestra capacidad para percibir y producir los sonidos del habla, de manera que los contrastes fonéticos que no se producen en nuestra propia lengua nos resultan difíciles de distinguir y de pronunciar. De hecho, siguiendo el ejemplo que encabeza esta sección, los bebés japoneses de menos de ocho meses de edad sí pueden distinguir los fonemas /r/ de /l/, pero hacia el final del primer año de vida, el sistema de percepción de fonemas está especializado de forma que tan sólo se pueden distinguir aquellos que pertenecen a la propia lengua.
Janet Werker y sus colaboradores observaron que bebés anglófonos de ocho meses podían discriminar dos tipos de /t/ que pertenecen al inventario fonético hindú. Cuando se analizó la conducta de los mismos bebés dos meses más tarde, se constató que ya no podían distinguir dichos fonemas (al igual que los adultos anglófonos); mientras que los bebés hindúes sí podían hacerlo, indicando que hacia el final del primer año de vida se produce una “sintonización” del aparato perceptivo hacia las consonantes de la lengua materna (es un APRENDIZAJE POR OLVIDO). Este ajuste perceptivo sería el responsable de que un adulto tenga problemas para percibir determinados contrastes fonéticos, tal y como se demuestra, por ejemplo, en los estudios realizados con adultos japoneses en una tarea de discriminación del contraste /l/-/r/. Sin embargo, la investigación interlingüística ha puesto de manifiesto que no todos los contrastes que no se producen en la lengua del oyente son igualmente difíciles de percibir. De hecho, se ha demostrado que la pérdida de capacidad discriminativa se produce para fonemas que son físicamente similares a los de nuestra lengua, pero no para aquellos que son muy diferentes. Para explicar este fenómeno, Best propuso el concepto de “asimilación” : en el caso de sonidos similares a alguna categoría fonémica del hablante, esta categoría asimilaría el sonido similar; sin embargo, si el sonido es suficientemente distante, ninguna categoría de la propia lengua lo atraerá y podrá ser discriminado. La imposibilidad de los hablantes japoneses para distinguir estímulos como cala y cara estaría causada por la asimilación de estos dos fonemas (/l/ y /r/) a uno de los existentes en su propia lengua (/l/).
* En el campo de la percepción de las vocales hallamos efectos parecidos de sintonización a la lengua materna. Kuhl y sus colaboradores han encontrado que, hacia los 6-7 meses de vida, los bebés dan muestras de una organización interna de las categorías vocálicas que es específica de la lengua a la que están expuestos y que se asemeja a la estructura observada en adultos. Particularmente, se ha observado que , de forma análoga a lo que ocurre con otras categorías mentales, los fonemas están organizados alrededor de valores prototípicos. Según esta concepción, ciertas realizaciones físicas de un determinado fonema serían más representativas (prototípicas) de una categoría fonémica, mientras que otras serían consideradas menos y menos representativas de dicha categoría, a medida que nos alejáramos del valor prototípico. Estos valores dependerían de la lengua, de manera que un ejemplar que fuera considerado un buen representante para una cierta lengua no tendría por qué serlo para otra. En una serie de experimentos, Kuhl y cols. Han descrito lo que han denominado el efecto imán en la percepción de vocales: los sujetos muestran una capacidad discriminativa menor en regiones cercanas al valor prototípico de una vocal, que en regiones físicamente igual de cercanas a un ejemplar no prototípico; en otras palabras, los hablantes tienen más problemas para discriminar ligeras variaciones físicas de una vocal prototípica que de una vocal no prototípica para una categoría. Evidentemente, los valores prototípicos son característicos de cada lengua y, al igual que lo que ocurría con las consonantes, un estímulo puede ser un valor prototípico en una lengua y uno no prototípico en otra.
Estos resultados muestran que el inventario fonético y su estructura juegan un papel muy importante en la forma en la que percibimos el habla y que este papel va más allá que la simple discriminabilidad de sonidos. Otra de las unidades lingüísticas que parecen ser procesadas de formas diferentes por los hablantes de las distintas lenguas son las sílabas.
2.4.2. ¿Dónde están las fronteras silábicas para los ingleses (de-mon, dem-on, dem-mon)?.
Los sonidos del habla (los fonemas) se estructuran en unidades más complejas y tal vez en cierto sentido más elementales que ellas. Una de las unidades en la que los lingüistas agrupan los fonemas es la sílaba. Aunque según la teoría lingüística la sílaba es una unidad fundamental a la hora de describir cualquier lengua, no parece ser igualmente accesible a los hablantes de las distintas lenguas.
Si pedimos a un anglófono que nos segmente en sílabas palabras inglesas como demon o erase, nos puede sorprender que probablemente dude, o que dé una respuesta que nos parezca “extraña” (“er-ase”). Este ejemplo nos pone de manifiesto que las lenguas también se distinguen las unas de las otras unidades de procesamiento distintas de los fonemas.
En una serie de experimentos, Mehler, Dommergues y colaboradores (1981) encontraron que los sujetos franceses eran más rápidos en detectar sonidos en posición inicial de palabras cuando el sonido coincidía con la sílaba inicial de la palabra que cuando no coincidía. Estos autores compararon los tiempos de reacción en detectar sonidos Consonante-Vocal (como por ejemplo /pa/) en palabras francesas como PALAIS y PALMIER con los tiempos de detección de sonidos Consonante-Vocal-Consonante (como /pal/) también en estímulos como los anteriormente descritos. Los resultados mostraron que los sujetos tardaron menos tiempo en detectar una secuencia cuando ésta coincidía con la primera sílaba de un estímulo que cuando no coincidía y que el tiempo de respuesta no era función del número de fonemas que componen el estímulo a detectar (en promedio, se tardaba lo mismo en detectar secuencias CV que secuencias CVC. Los autores interpretaron estos resultados como indicativos de que los sujetos segmentan la señal del habla en unidades que corresponden a las sílabas.
Sin embargo, Cutler, Mehler, Norris y Seguí (1983, 1986) no consiguieron reproducir los resultados de Mehler et al. (1981) cuando se estudiaron sujetos anglófonos. ¿Cuál podría ser la causa de que no se reprodujeran los resultados encontrados en el francés en este experimento con anglófonos?. Cutler et al. propusieron que los sujetos tan sólo van a emplear una estrategia de silabificación cuando su propia lengua sea fácilmente segmentable en sílabas: y éste no es el caso del inglés. El inglés es una lengua con límites silábicos poco claros y que muestra el fenómeno de la ambisilabicidad, es decir, que un mismo fonema puede pertenecer a dos sílabas al mismo tiempo. Por consiguiente, la falta de reproductibilidad del patrón silábico en inglés podría deberse a que ciertas propiedades de los procesos de segmentación del habla dependieran de la estructura fonológica de la lengua del sujeto. Además, estos autores constataron que los sujetos “exportan” las estrategias de segmentación de su propia lengua cuando escuchan otra que no es la suya.
Otake, Hatano, Cutler y Mehler (1993) encontraron que los sujetos japoneses, cuando llevan a cabo esta tarea, muestran un patrón de resultados que difiere del de los sujetos franceses (y españoles, catalanes y portugueses) y del de los ingleses. En el análisis de los tiempos de reacción los sujetos japoneses mostraron una ventaja general en la detección de sonidos CV (consonante-vocal), comparados con los CVC (consonante-vocal-consonante). Otake et al. consideraron que este y otros resultados encontrados en su estudio indicaban un “efecto moraico”, en el sentido de que los sujetos eran capaces de detectar cadenas de sonido que correspondían a moras , pero cuando los sonidos no correspondían a una mora, era prácticamente incapaces de llevar a cabo la tarea. Ello explicaría el alto porcentaje de errores en la detección de sonidos CVC en palabras con sílabas iniciales CV.
El patrón de resultados observado por Mehler et al. También se ha encontrado en hablantes del español, catalán y portugués. La existencia de este efecto silábico se ha puesto de manifiesto en una amplia variedad de tareas experimentales.
Pitt y Samuel (1990) publicaron un trabajo que aporta datos en
favor del fonema como unidad primigenia de segmentación del habla,
frente a la hipótesis silábica. Estos autores emplearon una
variante de la tarea de detección de fonemas en la que intentaban
focalizar la atención del sujeto en una posición determinada,
con el fin de analizar la precisión de la atención selectiva
en el proceso de percepción del habla. Para ello, aumentaron la
probabilidad de aparición del fonema a detectar en la posición
que deseaban inducir. Utilizaron palabras del tipo CVC-CVC, en las que
los sujetos debían encontrara el fonema en una de las cuatro posiciones
consonánticas posibles. Si, por ejemplo, querían focalizar
la atención del sujeto en la segunda posición consonántica,
el número de palabras de la lista experimental (o target) en cvC-cvc
era sustancialmente más elevado que en cualquiera de las otras tres
posiciones. Según Pitt y Samuel, si el fonema fuese la unidad básica
de percepción, los sujetos habituados a una posición determinada
obtendrían tiempos de reacción más cortos en las palabras
con el target en la posición inducida que en las restantes. Pero
si la unidad de percepción fuese la sílaba, la inducción
del fonema en una cierta posición se debería generalizar
a toda la sílaba y, por consiguiente, también se deberían
obtener tiempos más bajos para los fonemas que ocuparan otra posición
consonántica dentro de la misma sílaba. Los resultados mostraron
una clara ventaja para la posición inducida, pero no se obtuvo ningún
efecto de generalización a otras posiciones dentro de la misma sílaba.
No obstante, este trabajo presenta dos problemas. En primer lugar, con
el diseño empleado es difícil concluir si los efectos de
facilitación observados son meramente posicionales fonémicos
(como ellos concluyen) o bien implican un análisis más fino
de la estructura silábica, cuya posible generalización no
se ha estudiado. En segundo lugar, la lengua empleada (inglés) ha
resultado no ser la más adecuada para el estudio del rol de la sílaba
en la percepción del habla.
Los estudios que hemos visto hasta ahora no responden a la pregunta
de cuál es la unidad básica de percepción del lenguaje
que emplean los sujetos anglófonos. Cutler y colaboradores han mostrado
que los sujetos anglófonos emplean una estrategia de segmentación
del habla basada en las propiedades métricas (Metrical Segmentation
Strategy), que, conjuntamente con un mecanismo de competición en
el acceso al léxico, describirían cómo los hablantes
del inglés (y de otras lenguas, como el holandés) identifican
las palabras en el habla continua. Cutler y Carter (1987) han encontrado
que la mayoría de las palabras del inglés empiezan por una
sílaba fuerte (strong), categoría que se distinguiría
de una sílaba débil, que sería la que contendría
una vocal débil (weak); el español carece de este contraste
y el concepto más similar es el de sílaba acentuada y no
acentuada, que, aunque no se corresponde exactamente, al menos permite
al lector hacerse una idea. Para apoyar o rechazar esta idea, Cutler y
Norris (1988) realizaron un trabajo que, según su opinión,
defiende que el proceso de percepción del habla en los sujetos anglófonos
sería el resultado de la interacción entre un proceso de
segmentación de la señal del habla (la estrategia de segmentación
métrica), que sí dependería de las características
específicas de la lengua, y de un proceso de competición
léxica, que sería de tipo universal. En esta línea,
cabe señalar los resultados de Sebastián y Costa (1997),
quienes han encontrado en español un patrón de datos consistente
con la estrategia de segmentación métrica basado en las diferencias
entre sílabas acentuadas y no acentuadas.
2.4.3. ¿ Por qué los franceses no saben determinar la posición del acento en las palabras (Buenós diás Antonió)?.
Una tercera dimensión en la que las lenguas difieren y que los hablantes de las distintas lenguas parecen tener en cuenta a la hora de percibir el habla es la del acento. El acento es una característica lingüística que puede expresarse mediante la variación de una o más de las siguientes dimensiones: duración, intensidad y tono/timbre. Así, las sílabas acentuadas tienden a ser más largas, más intensas y más agudas que las no acentuadas. Sin embargo, las distintas lenguas codifican de diferente manera el acento. Una lengua como el español se caracteriza por dar una especial importancia a la dimensión de intensidad, siendo la diferencia en duración entre las sílabas acentuadas y no acentuadas menor que en otras lenguas. Por el contrario, el inglés es una lengua en la que existen importantes diferencias en la duración entre las sílabas acentuadas y no acentuadas; mientras que las diferencias en intensidad no son tan importantes. Por último, en otras lenguas, como por ejemplo el euskera, la diferencia entre sílabas acentuadas y no acentuadas también se codifica de forma importante en un cambio del tono. Además de diferir en la forma en la que las distintas lenguas codifican el acento, también existen diferencias en relación a si el acento es un parámetro que varía o no según su posición en las palabras. El francés es una lengua en la que el acento siempre recae sobre la última sílaba de las palabras; el inglés y el español son lenguas que tienen el acento móvil, aunque en el caso del inglés un porcentaje extremadamente alto de palabras tiene el acento en la primera sílaba; mientras que para el español la tendencia es a estar situado en la penúltima sílaba.
Dupoux, Christophe, Sebastián y Mehler (1997) investigaron estos aspectos utilizando una tarea de tipo ABX con sujetos hispano y franco-parlantes, siendo los estímulos pseudopalabras con una estructura CVCVCV pronunciadas por tres hablantes holandeses (de manera que los materiales tuvieran un acento extranjero para ambas poblaciones). Estos estímulos formaban pares mínimos y variaban o bien en un fonema, como por ejemplo lumisa-ludisa, o en su patrón de acento, como lumísa-lumisá, o en ambas dimensiones al mismo tiempo, como lumísa-ludisá. Los resultados mostraron que los sujetos franceses tenían problemas para llevar a cabo la tarea cuando la única diferencia entre los estímulos A y B era solamente el acento, y sus resultados eran idénticos cuando A y B diferían tan sólo en un fonema que cuando diferían en un fonema + acento. Por el contrario, los sujetos españoles no tuvieron ningún problema con la condición de solo acento, y fueron mucho más rápidos en la condición de diferencias en acento + fonema que en las otras dos condiciones. Sin embargo, en otro experimento en el que los sujetos también tenían que llevar a cabo una tarea ABX, pero esta vez teniendo en cuenta tan sólo la información segmental e ignorando completamente la información acentual, los sujetos franceses no tuvieron ningún problema para llevar a cabo la tarea, mientras que los sujetos españoles fueron más despacio y cometieron muchos errores cuando la información segmental y acentual estaba en conflicto (como, por ejemplo, en el par lumísa-lumisá, donde, a pesar de ser distintos los estímulos, la respuesta de los sujetos tenía que ser la de “igual”). Estos experimentos muestran que los sujetos franceses son “sordos” a los correlatos lingüísticos del acento léxico, mientras que los españoles no. La razón de esta divergencia debe buscarse en que, tal y como hemos indicado al principio de esta sección, en español existen pares mínimos de palabras que tan sólo difieren en el patrón de acento (como, por ejemplo, caso y casó), mientras que este contraste no se encuentra en francés. Es probable que en el proceso de la adquisición del lenguaje de los sujetos españoles y franceses hayan desarrollado distintos procedimientos para analizar las propiedades prosódicas de las palabras.
.+9
TEMA 4: PROCESAMIENTO SINTÁCTICO.
La ambigüedad es una característica inherente al lenguaje, que está presente en varios niveles de procesamiento lingüístico, como el léxico, el sintáctico, el semántica o referencial, etc. Fenómenos como la polisemia y la homografía, son una clara muestra de la ambigüedad del lenguaje a nivel léxico. Asimismo, las ambigüedades de adjunción de constituyentes son otro ejemplo palmario en el nivel sintáctico. En este caso, el procesador se ve sometido a una incertidumbre momentánea sobre las relaciones formales entre elementos de una oración durante el proceso de decodificación de un mensaje lingüístico.
LA AMBIGÜEDAD SINTÁCTICA: LAS AMBIGÜEDADES DE ADJUNCIÓN
En 1926 el poeta Fernando Pessoa introdujo una interesante variación en unos versos suyos compuestos dos años antes. En el poema Lisboa revisitada, escrito originalmente en 1924, se podía leer hasta 1926: «Otra vez te vuelvo a ver / ciudad de mi infancia pavorosamente pasada». Sin embargo, a partir de 1926 lo que leemos en estos versos es: «Otra vez te vuelvo a ver / ciudad de mi infancia pavorosamente perdida.» Evidentemente, en la primera versión lo pavorosamente pasado era únicamente la infancia del autor; mientras que en la segunda lo pavorosamente perdido puede ser tanto la ciudad como la infancia. El poeta introduce de este modo una ambigüedad con fines poéticos que enriquece notablemente el texto original. Examinemos más de cerca en qué consiste esta ambigüedad y en qué difiere realmente la versión de 1926 de la de 1924. El predicado adjunto de 1924 -pavorosamente pasada- contiene un rasgo temporal que le permite modificar a un sustantivo de características también temporales como es infancia, mientras que es implausible que modifique a un sustantivo que carece de esta característica como ciudad. Por otra parte, el predicado adjunto de la versión definitiva -pavorosamente perdida-, al carecer de ese rasgo temporal (y de cualquier otro que favorezca una adjunción u otra), puede ser modificador tanto de ciudad como de infancia .
Nos encontramos así ante las llamadas ambigüedades de adjunción. La cuestión a dilucidar en casos como éste es a cuál de los dos elementos se adjunta -o a qué modifica- un determinado constituyente. En este caso concreto se trataría de si el predicado adjunto modifica a ciudad o a infancia.
Cuando hablamos de frases que contienen ambigüedades de adjunción nos referimos tanto a las frases completamente arnbiguas, como las de nuestro ejemplo extraído de los versos de Pessoa, como a las localmente ambiguas (de hecho va a ser este último tipo de frases el que mayoritariamente se emplee en los experimentos). Una frase localmente ambigua es aquella en la que una ambigüedad de adjunción queda finalmente resuelta. Supongamos que el verso de Pessoa de nuestro ejemplo hubiera sido ciudad de mi pasado pavorosamente perdida. En este caso, al sustituir infancia por pasado, cuando se lee la última palabra -perdida-, ya está claro que lo perdido es la ciudad, debido a que perdida sólo concuerda en género con ciudad. Sin embargo, la frase es ambigua (localmente ambigua) hasta el momento en que se alcanza esa última palabra. En concreto, la ambigüedad radicaría en la palabra pavorosamente, que puede adjuntarse inicialmente a uno de los dos sustantivos.
Podría parecer ocioso dedicar un tema a examinar lo que aparentemente
no es más que un caso particular que acontece en contadas ocasiones
en algunas oraciones; algo que casi podríamos tomar como una rareza
del lenguaje. Pero esta ociosidad es sólo aparente. Como pone de
manifiesto Pinker (1994), las ambigüedades conmstituyen más
la norma que la excepción en cualquier idioma, siendo ésta
una característica importante tanto del lenguaje oral como del lenguaje
escrito. Por tanto, el procesador sintáctico tiene que estar preparado
para afrontar este fenómeno.
Esta razón ya justificaría por sí misma su investigación;
pero, además, observar el procesamiento de las oraciones con ambigüedades
de adjunción nos permite disponer de una «ventana» al
procesador sintáctico.
A continuación analizaremos cuál es el tipo de información del que puede disponer el procesador durante la comprensión, para centrar luego nuestra atención en algunos de los modelos de procesamiento sintáctico actualmente en boga.
2. TIPOS DE INFORMACIÓN DISPONIBLES DURANTE EL PROCESAMIENTO SINTÁCTICO
Retomemos ahora el ejemplo de los versos de Fernando Pessoa. En un inciso del primer párrafo apuntábamos que al modificar sus versos en 1926 el poeta había hecho más evidente una ambigüedad ya presente en la primera versión. Efectivamente, como se puede observar en la figura 5.1, las dos versiones del ejemplo admiten, desde un punto de vista puramente sintáctico, las dos interpretaciones. De hecho, la diferencia entre ambas reside en la presencia o ausencia de rasgos temporales en los diferentes constituyentes oracionales, una característica semántica. En la figura 5.l tanto lo pavorosamente pasado como lo pavorosamente perdido es la infancia del autor, mientras que en la figura 5.1 es la ciudad. Por tanto las dos versiones del verso son igualmente ambiguas, ya que ambas admiten los dos posibles análisis sintácticos; si bien alguna de las interpretaciones resultantes es pragmáticamente implausible.
A.- B.-
SN SN
N SP N SA
P SD N SP
D
SN P
SD
N
SA
D N
Ciudad de mi infancia pavorosamente pasada,
Ciudad de mi infancia pavorosamente pasada,
Ciudad de mi infancia pavorosamente perdida,
Ciudad de mi infancia pavorosamente perdida,
Figura 5. 1. Análisis sintáctico de las dos versiones
de los versos de F. Pessoa.
El lector tiene disponibles dos tipos de información para la interpretación de un texto y, en ocasiones como la que nos ocupa, esos dos tipos de información pueden entrar en conflicto. Por una parte está la información sintáctica, que en nuestro ejemplo permitiría cualquiera de las interpretaciones del verso tanto en su primera como en su segunda versión; y por otra parte tenemos la información semántica o pragmática (podríamos hablar en general de información extrasintáctica), que favorece una de las interpretaciones en la primera versión mientras que permite las dos en la segunda. La pregunta que surge inevitablemente en este punto es la que ya introducíamos con anterioridad. ¿qué tipo de información será la que influya en la primera construcción que realice el lector del marcador sintagmático? . Va a ser precisamente la respuesta a esta pregunta la que trace una línea divisoria importante entre los modelos teóricos que analizaremos más adelante. Todos los modelos coinciden en que ambos tipos de información van a jugar algún papel, mayor o menor, en el resultado final: la comprensión última de la oración. La cuestión con respecto a la cual difieren es en el momento en que entran en juego cada uno de los tipos de información.
Los modelos teóricos de procesamiento sintáctico se pueden clasificar en dos grandes grupos según su respuesta a la pregunta formulada previamente: en un primer grupo cabe incluir aquellos para los que únicamente la información sintáctica determina el establecimiento inicial de adjunciones. Los dos modelos de este tipo que más influencia han tenido son. el modelo de vía muerta (garden path) y su heredero el modelo construal. Para estos modelos, de características netamente seriales y modularistas, la influencia de la información extrasintáctica se dará en un estadio posterior al acceso de la información sintáctica. La información de tipo sintáctico será la que guíe la construcción del marcador sintagmático. En un segundo grupo cabe incluir aquellos modelos que consideran que la información extrasintáctica es la que prima en el establecimiento de lazos de adjunción entre los componentes oracionales, o la colocan en pie de igualdad con la información sintáctica a la hora de elaborar la interpretación de una oración. Tendremos dentro de este grupo, por una parte, el modelo de ajuste lingüístico. Por otra parte, hay una serie de modelos, de corte interactivo, según los cuales otros tipos de información extrasintáctica (léxicosintáctica, léxico-semántica, morfológica, contextual, etc.) juegan un papel más o menos determinante en la construcción de la representación sintáctica. Estos modelos se conocen con el nombre genérico de modelos de satisfacción de restricciones.
En suma, analizaremos exclusivamente cuatro modelos; aquellos que más investigaciones han generado y que más influencia han ejercido dentro de este campo.
3. EL MODELO DE VÍA MUERTA
El modelo de vía muerta, propuesto por Lyn Frazier y sus colaboradores, considera que la única información a la que se tiene acceso al construir el marcador sintagmático es de tipo sintáctico. Cuando el procesador encuentra una palabra sólo accede inicialmente a su categoría gramatical (artículo, sustantivo,...) y ésa será la única información que utilice en una primera fase del procesamiento para construir el árbol sintáctico. Por razones de economía cognitiva, con el fin de mantener en la memoria operativa la menor cantidad posible de datos, se supone que esa información mínima necesaria será la única que guiará el establecimiento de los lazos de adjunción. Sólo más adelante, durante la siguiente fase de procesamiento, entrarán en juego los demás tipos de información. Como vemos, la inspiración modularista de este modelo es evidente. Propone la existencia de un procesador sintáctico modular responsable de la construcción del marcador sintagmático y un analizador temático, al que se le ha asignado no sólo responsabilidad sobre las relaciones temáticas, sino también sobre la información del discurso y contextual en general. Este modelo presta una atención especial a lo que sucede en el módulo sintáctico: la construcción de la representación sintáctica de la oración antes de que entre en juego cualquier consideración semántica o pragmática; y, en particular, cuando son posibles dos o más representaciones sintácticas de una oración. Cuando esto ocurra se seguirá aplicando la máxima de potenciar la economía del proceso; de las dos construcciones sintácticas se elegirá la más sencilla, la que menos nodos contenga su marcador sintagmático (estrategia de adjunción mínima). Pero en el caso de que ambos marcadores sean igualmente complejos (si contienen el mismo número de nodos) lo que se postula es que el procesador adjuntará el nuevo material a la cláusula o sintagma que se esté procesando en ese momento (estrategia de cierre tardío). En definitiva, lo que se está planteando con estas estrategias se puede resumir en el postulado "adoptar el primer análisis disponible". El procesamiento sintáctico de las oraciones supone un gasto en recursos de memoria, con lo que todas las estrategias van encaminadas a minimizar los recursos empleados y a maximizar la eficiencia. Además, dichas estrategias son de aplicación universal; es decir, el procesador habrá de usarlas en los distintos casos de adjunción de constituyentes, así como en todos y cada uno de los lenguajes naturales. La razón de esta pretendida universalidad es que obedecen a principios psicológicos generales de optimización de recursos en la comprensión.
Al enunciar el principio de adjunción mínima se afirma
que, ante la necesidad de construir la representación sintáctica
de una oración que admite más de una, ésta se realizará
de la forma más sencilla posible. La complejidad de una construcción
viene dada por el número de nodos que resulta de su análisis
sintáctico, por consiguiente se elegirá aquella opción
«que postule el menor número posible de nodos sintácticos».
Por ejemplo, la oración (2) -cuyos dos posibles análisis
se pueden ver en la figura 5.2- tiene dos interpretaciones alternativas:
una en la que es el policía quien lleva los prismáticos (figura
5.2a) y otra en la que es el espía (figura 5.2b). Debido a que en
la figura 5.2b el segundo SP está incluido en el primero, se tiene
que postular un nodo SN (espía con unos prismáticos) que
no hay que postular en 2a, lo cual hace que este último análisis
sea más sencillo que 2b.
(2) El policía vio al espía con unos prismáticos.
O
SD SV
V SP SP
P SD P SD
D N
El policía
vió a el
espía
con
unos prismáticos
Figura 5.2.a. Marcadores sintagmáticos de la frase ambigua (2)
en la versión de adjunción mínima.
O
SD SV
V
SP
P SD
D SN
N
SP
P
SD
El policía
vió a el
espía
con
unos prismáticos
Figura 5.2.b. Marcadores sintagmáticos de la frase ambigua (2)
en la versión de adjunción no mínima.
La estrategia de cierre tardío se aplica cuando las interpretaciones alternativas de una frase son de la misma complejidad, en lo que a número de nodos se refiere. Como puede observarse en la figura 5.3, las dos alternativas de la oración (3) tienen el mismo número de nodos, con lo cual la aplicación del cierre tardío sería pertinente en este caso. Según este principio no se dará comienzo a una cláusula nueva mientras se puedan seguir añadiendo componentes a la anterior, es decir, que los sintagmas y cláusulas de una frase se cerrarán lo más tarde posible. Por ejemplo, en la frase (3) -y en sus análisis sintácticos alternativos expuestos en la figura 5.3- se ve que la cláusula de relativo que había tenido un accidente puede adjuntarse tanto al primer SN del SN compuesto -la hija- como al segundo -del coronel-.
(3) El policía entrevistó a la hija del coronel que tuvo
un accidente.
O
SN SV
V
SP
P
SD
D SN
N SP
P
SD
D
SN
N
SC
a)El policía
entrevistó a la hija de
el coronel
que tuvo un accidente
O
SN SV
V SP
P
SD
D
SN
N
SP
P
SD
D
SN
N
SC
b) El policía entrevistó a la hija de el coronel, que tuvo un accidente
Figura 5.3. Análisis alternativo de la oración incluida en (3); a) según cierre tardío; b) según cierre temprano.
En este experimento se observaron efectos de preferencia por la versión de subjuntivo, tanto en el tiempo acumulado de lectura en la región siguiente a la desambiguación como en el número de regresiones hacia afuera de esa misma región. Además, es preciso aclarar que estos efectos no pueden achacarse a la diferencia de frecuencia léxica de los dos tipos de desambiguación, ya que el modo indicativo es más frecuente que el modo subjuntivo.
4. LA HIPÓTESIS CONSTRUAL
La hipótesis construal (Frazier y Clifton, 1996), un desarrollo del modelo de vía muerta, postula que el procesador utiliza de forma temprana información sintáctica, aunque no siempre, para configurar el marcador sintagmático. Precisamente, como veremos luego, la diferencia con el modelo de vía muerta radica en que no siempre se utiliza en primera instancia información exclusivamente sintáctica.
Una de las razones del surgimiento de este modelo proviene de la incapacidad del modelo de vía muerta para explicar los resultados sobre la adjunción de las cláusulas de relativo con doble antecedente obtenidos en español. Cuctos, Mitchell y sus colaboradores, así como otros investigadores, han encontrado en diferentes lenguas que las cláusulas de relativo con doble antecedente no obedecen al principio de cierre tardío. Dada la pretensión de universalidad de tal principio, el que se encontrara un solo caso en el que éste no se cumplía ponía en serios aprietos sus postulados.
La principal divergencia entre el modelo de vía muerta y la hipótesis construal consiste en la diferenciación general que esta última establece, dentro de cualquier idioma, entre dos tipos de estructuras o relaciones: las primarias y las secundarias, y en la forma en que se procesarían cada una de ellas. Las relaciones primarias incluirían las relaciones argumentales de los constituyentes oracionales, como son las de los verbos con sus argumentos. Por su parte, las relaciones o estructuras secundarias incluirían los adjuntos, los modificadores, los predicados secundarios y las series no iniciales de sintagmas coordinados (Frazier y Clifton, 1996).
Simplificando bastante, se puede decir que las relaciones secundarias son aquellas de las que se puede prescindir sin que sufra la gramaticalidad ni cambie el significado de la oración. Por ejemplo, una cláusula de complemento circunstancial como cuando llegó su madre en (5),
(5) Pedro se puso muy contento cuando llegó su madre,
establece una relación secundaria en el predicado, porque es un complemento circunstancial que no es argumento del verbo y, por lo tanto, se puede eliminar sin que sufra en su gramaticalidad el resto de la oración.
Por otra parte, las estructuras que establecen relaciones primarias son, por lo general, imprescindibles para mantener la gramaticalidad. No se cumple esta regla cuando se trata de argumentos opcionales de los verbos. Por ejemplo, un argumento obligatorio del verbo dijo como que estaba despedida en el ejemplo (6a) establece una relación primaria con el predicado y no puede ser eliminado sin romper la gramaticalidad de la oración. Sin embargo, en (6b) esa misma cláusula (que sigue estableciendo una relación primaria con el verbo) puede ser eliminada, ya que no es un argumento obligatorio del verbo gritó.
(6a) El alcalde le dijo a la secretaria que estaba despedida.
(6b) El alcalde le gritó a la secretaria que estaba despedida.
El postulado básico de la hipótesis construal consiste en afirmar que las estrategias de procesamiento sintáctico propuestas por la teoría de vía muerta (adjunción mínima y cierre tardío) se aplicarán únicamente a las relaciones primarias. Por otra parte, y ésta es la diferencia fundamental entre la teoría construal y la de vía muerta, las relaciones secundarias se procesarán mediante la aplicación del llamado principio construal :
Principio construal:
(i) Un sintagma SX, que no puede ser analizado de forma que establezca
una relación primaria, se asociará al dominio temático
actualmente en proceso.
(ii) Se interpretará el sintagma SX dentro de ese dominio usando
principios (interpretativos) estructurales y no estructurales.
Según este principio, los sintagmas o cláusulas que establezcan relaciones secundarias no se adjuntarán al resto de la frase, sino que simplemente se asociarán al último asignador temático (un verbo, un sintagma nominal, una preposición o cualquier elemento capaz de otorgar papeles temáticos). En otras palabras, las relaciones secundarias no establecen lazos tan fuertes como la adjunción, sino que establecen una especie de pseudoadjunción dentro del dominio temático que se está procesando en el momento. Una vez asociada al último asignador temático, si persiste la ambigüedad, la interpretación que se haga de la estructura dependerá de la influencia de factores extrasintácticos, como el contenido semántica, la frecuencia de uso, el contexto previo, el conocimiento pragmático o la aplicación del principio de referencialidad (10) que presentaremos más adelante.
Veamos a continuación qué sucede con un caso paradigmático como es el de las cláusulas de relativo con doble antecedente, como en la oración (3), mencionada anteriormente. En este tipo de oraciones, la teoría construal postula que si el segundo sustantivo es argumento del primero, como sucede si están unidos por la preposición de, todo el SN complejo será el último asignador temático anterior a la cláusula de relativo. Por lo tanto, la cláusula de relativo se asociará a todo en el SN complejo.
5. EL MODELO DE AJUSTE LINGÜÍSTICO
El modelo de ajuste lingüístico establece que la frecuencia de uso de las estructuras de un idioma es la información clave que tiene en cuenta en primer lugar el procesador para formar una representación sintáctica de la oración. Este modelo arranca de un primer hallazgo en el que se puso de manifiesto que la estrategia de cierre tardío no operaba en la adjunción de cláusulas de relativo con doble antecedente en español. Este hallazgo fue corroborado posteriormente en numerosos trabajos realizados en varias lenguas. Estas investigaciones demostraron que en frases como las del ejemplo (3) los hispanohablantes tienden a aduntar la cláusula de relativo al primer SN. Es decir, parece como si el procesador empleara más bien una estrategia de cierre temprano, antes que la postulada por la teoría de vía muerta de cierre tardío .
La primera explicación que ofrecieron Cuctos y Mitchell (1988) de sus resultados consistió en asumir que los lectores aplicaban una estrategia de “saltar sobre el modificador” al enfrentarse a oraciones de este tipo. Suponían que en idiomas como el español, en los que los modificadores suelen ir después de los sustantivos, se podría tomar el segundo antecedente de la cláusula de relativo (del coronel, en nuestro ejemplo) como modificador del primero. De esta manera, el primer sustantivo sería el “principal”, al que se debería adjuntar la cláusula de relativo. Así pues, la estructura de la oración no sería considerada como SN-V-Nl-de-N2-CR, sino más bien como SN-V-N-modificador-CR, con lo que la cláusula de relativo tendría que adjuntarse necesariamente al N y no al modificador. Siguiendo este razonamiento se debería encontrar el mismo efecto de adjunción alta en cláusulas de relativo con doble antecedente en todos los idiomas en los que el modificador sigue al sustantivo (español, italiano, francés), mientras que el efecto de adjunción baja en los idiomas en los que el modificador precede al sustantivo (inglés, holandés, alemán).
6. MODELOS LEXICALISTAS 0 DE SATISFACCIÓN DE RESTRICCIONES
Los modelos de satisfacción de restricciones, llamados también lexicalistas pretenden ofrecer una alternativa a los modelos «clásicos» del procesamiento sintáctico. Los enfoques de satisfacción de restricciones enfatizan representaciones léxicas ricas como enfoque a la resolución de la ambigüedad y el uso rápido de restricciones correlacionadas. La resolución de la ambigüedad es vista como un proceso de satisfacción de restricciones múltiples, que implica la competición entre alternativas incompatibles. Uno de sus principales supuestos es considerar el procesamiento de las oraciones como libre de recursos; es decir, que el procesamiento léxico-sintáctico no consume recursos cognitivos (de memoria, atencionales, etc.). Basándose en el hecho, puesto de manifiesto entre otros por Swinney (1979), de que el acceso automático a todos los significados de una palabra ambigua no supone un gasto real en recursos de memoria, proponen un acceso automático a toda la información que contienen los ítems léxicos de una oración. El procesamiento de las oraciones se desarrollará en paralelo: ante una estructura ambigua el procesador tendrá disponibles todas las alternativas posibles y la decisión de cuál es la adecuada se tomará en base a la frecuencia de uso de las mismas. Según este modelo, no se construye la representación sintáctica de la oración de forma independiente del contenido de las palabras -tal como pretende la teoría de vía muerta-, sino que, según señala Igoa, ésta surge «como un epifenómeno o producto emergente del procesamiento de los ítems léxicos". Así, en contraste con los modelos seriales, como el modelo de vía muerta, los modelos de satisfacción de restricciones no distinguen de forma clara entre una primera etapa de construcción de estructuras y una segunda etapa de evaluación y revisión, proporcionando una visión diferente de cómo varios tipos de información pueden ser utilizados durante el procesamiento de oraciones. La medida en que se utiliza un determinado tipo de información (léxica, sintáctica, pragmática, etc.) y cuándo se utiliza, no está gobernada por dos etapas en el procesamiento sintáctico, sino por cómo la información constriñe la interpretación.
Las ambigüedades de adjunción provienen de la intersección
de varios tipos de ambigüedades, incluyendo ambigüedades de estructura
argumental, ambigüedades de categoría sintáctica, ambigüedades
morfológicas de varios tipos, etc. junto al significado de las palabras
también se accede, entre otras, a las siguientes informaciones:
los papeles temáticos que llevan asociados, la categoría
léxico-sintáctica, la estructura sintáctica que los
papeles temáticos implican, la estructura argumental, la morfología
y la fonología. Dado que las palabras pueden ser ambiguas en cualquiera
de estos niveles, las diferentes alternativas de interpretación
de cada palabra en cada uno de ellos tendrá, necesariamente, una
frecuencia de uso a la que también se accede inmediatamente. Por
lo tanto, la ambigüedad sintáctica será un producto
de la ambigüedad léxica de las palabras en uno o más
de esos niveles. De hecho para los teóricos de este modelo no existe
diferencia entre el procesamiento léxico y el sintáctico.
El procesamiento sintáctico tiene las mismas propiedades generales
que el procesamiento léxico. Por ejemplo, la palabra vino es ambigua
a cuatro niveles.semántica, léxico-sintáctico, morfológico
y de estructura argumental. En el nivel semántico esta palabra puede
significar una bebida o una acción; en el nivel de categoría
léxico-sintáctica puede ser tanto un sustantivo como un verbo;
en el nivel morfológico puede ser tercera persona del singular del
pretérito indefinido del verbo venir -él vino- o segunda
persona del singular del mismo tiempo verbal en su forma cortés
-usted vino-; y en el nivel de estructura argumental puede llevar un solo
argumento. el sujeto -Juan vino- o dos: el sujeto y un complemento circunstancial
con papel locativo -Juan vino a mi casa-. La ambigüedad en uno o más
de estos niveles puede producir ambigüedad en la adjunción
de los constituyentes oracionales. La frecuencia de uso de la palabra ambigua
en cada una de sus alternativas en cada nivel determinará qué
versión es la preferida. Obsérvese que no será únicamente
la frecuencia de uso de cada alternativa en un nivel específico
lo que determinará la elección, sino que ésta vendrá
dada por la interacción de las frecuencias de uso en todos los niveles
de la ambigüedad. Los diferentes niveles a los que una palabra puede
ser ambigua estarán interrelacionados, con lo cual la frecuencia
de uso en uno de los niveles puede influir en la elección que se
tome en otro de los niveles. Siguiendo con la múltiple ambigüedad
de la palabra vino, presentamos en (7) un caso un tanto extremo de ambigüedad
léxico- sintáctica. La adjunción que se produzca en
esta oración dependerá de] contenido semántica de
la palabra vino y de su estructura argumental en su acepción de
verbo.
(7) Cuando estábamos empezando a beber vino a casa llegó
la portera.
Según el modelo lexicalista, en cuanto se lea la palabra vino se accederá a toda la información sobre sus múltiples ambigüedades y a todas las posibles alternativas, así como a sus correspondientes frecuencias de uso. Según este modelo, no sólo va a ser la frecuencia de uso en un sentido u otro lo que determinará la elección, sino que el contexto en el que la palabra ambigua esté incluido puede influir decisivamente. En este caso concreto, el contexto puede ayudar a que el primer contenido semántico al que se acceda sea el de vino como bebida. De esta forma, la primera adjunción elegida será la de esta palabra al verbo anterior como objeto directo de éste. Sin embargo, al aparecer el locativo a casa es posible que se tenga que reconsiderar esta primera interpretación, así como la adjunción correspondiente. Supongamos que el verbo venir, o en concreto la forma vino, es más frecuente con dos argumentos que con uno. En tal caso el hecho de que aparezca el locativo haría que, hablando en términos conexionistas, la acepción de esa palabra como verbo recibiera una activación que no recibiría en el caso de que el verbo fuera más frecuente con un solo argumento.
Aparte de la frecuencia de uso en los diferentes niveles de ambigüedad, otro de los factores que va a modular, según el modelo lexicalista, la elección de la interpretación preferida va a ser el contexto en el que se encuentre la palabra ambigua. Si una palabra ambigua se encuentra en un contexto neutro -que no sesgue su interpretación en ningún sentido- la interpretación preferida vendrá dada, como hemos visto, únicamente por su frecuencia de uso. Duffy, Morris y Rayner (1988) encontraron que en el caso de que la palabra ambigua tenga sus significados equilibrados en frecuencia de uso y sea presentada en un contexto que favorezca uno de ellos, se accederá con mayor facilidad al significado favorecido por el contexto. Por otra parte, también encontraron que si la palabra ambigua tiene un significado dominante y es presentada en un contexto que favorece el significado no dominante, ésta se comportará como si sus significados estuvieran equilibrados en frecuencia de uso, es decir, no habrá una preferencia clara por ninguna de las dos interpretaciones. Estos resultados sugieren, en opinión de MaeDonald, Pearlmutter y Seidenberg, (1994b), la importancia tanto de la frecuencia de uso como del contexto en el acceso al léxico de las palabras ambiguas.
MacDonald (1994) distingue entre dos tipos de efecto que puede ejercer el contexto sobre la decisión que se tome ante una palabra ambigua: «preambigüedad» y «postambigüedad». La influencia preambigüedad se daría cuando el contexto previo sesga el sentido de la palabra ambigua posterior hacia una determinada acepción. En el ejemplo (7) la presencia de] verbo beber antes de la palabra ambigua vino constituye un contexto «preambigüedad» que sesgará la interpretación de esta palabra hacia su acepción de bebida. Por otra parte, una vez que se ha introducido la palabra ambigua -y por consiguiente todas sus acepciones han sido activadas- el contexto anterior a la desarnbiguación puede restringir cuál de las acepciones será la preferida. Así, en el ejemplo (8) la presencia de un largo complemento circunstancial hace que el verbo corrí -amnbiguo en el nivel de estructura argumental- sea entendido preferentemente como intransitivo y que no se espere ya la aparición del objeto directo un kilómetro.
(8) Ayer corrí con un antiguo amigo al que no había visto desde hacía mucho tiempo un kilómetro.
Vemos así que, en este caso, el complemento circunstancial constituye un caso de contexto «postambigüedad» que, antes de que la ambigüedad se resuelva, va a facilitar que se elija como más plausible una de las dos estructuras argumentases del verbo. Lógicamente, según MacDonald (1994), el contexto únicamente modulará la elección realizada en base a la frecuencia de uso. Sólo será determinante en la elección en el caso de que las alternativas de la palabra ambigua estén equilibradas en su frecuencia de uso, como probablemente suceda en el ejemplo (8).
SOBRE EL AJUSTE DE LOS MODELOS CON LOS DATOS EMPÍRICOS.
La gran cantidad de resultados obtenidos con varios tipos de ambigüedades
de adjunción parecen decantar la balanza a favor de los modelos
de tipo modular basados en principios estructurales. No obstante, ninguno
de los modelos propuestos para explicar el procesamiento sintáctico
puede acomodar por completo la evidencia empírica de que disponemos.
Además todos los modelos tienen, en último término,
una puerta falsa, una escapatoria que les permite «escurrir el bulto»
ante un resultado comprometedor. Así, los efectos no deseados desde
los modelos de tipo modular -vía muerta y construal- pueden ser
fácilmente achacables a que se producen en etapas tardías
de procesamiento, y por tanto, no ser considerados efectos sintácticos,
sino provocados por un reanálisis iniciado por el procesador temático.
Por su parte, los modelos que giran en torno al recuento de frecuencias
siempre pueden argumentar que no se ha realizado el recuento de frecuencias
de la estructura correcta en el corpus, puesto que ninguna lo especifica
con claridad. Necesitamos de modelos más específicos y más
constreñidos, con menos puertas traseras. Además, en cualquier
caso, la investigación futura deberá dilucidar, entre otras
cuestiones, en qué medida el procesador sintáctico considera,
y cuándo, tanto la información léxica como la estructural,
y si los principios de procesamiento sintáctico son universales
o específicos de cada lengua.
** Apuntes de clase de la asignatura obligatoria de tercer curso de carrera Psicolingüística I, impartida por Carlos Álvarez, Manuel Carreiras y Enrique Messeguer.