Fuente: Bloghemia
Link de origen:
https://www.bloghemia.com/2024/09/el-lenguaje-y-la-inteligencia.html
"Cuando analizamos la IA y la ciencia,
surgen preguntas muy diferentes. En este caso, es necesario actuar con cautela
debido a las afirmaciones exageradas e imprudentes que suelen amplificarse en
los medios de comunicación." Noam Chomsky
Entrevista a Noam
Chomsky realizada por CJ Polychroniou, donde habla sobre la inteligencia
artificial y los Grandes Modelos de Lenguaje.*
La inteligencia artificial (IA) está arrasando en todo el mundo. Está
transformando todos los ámbitos de la vida y, en el proceso, planteando
importantes preocupaciones éticas para la sociedad y el futuro de la
humanidad. ChatGPT, que domina las redes sociales, es un chatbot impulsado
por IA desarrollado por OpenAI. Es un subconjunto del aprendizaje
automático y se basa en lo que se denomina modelos de lenguaje a gran escala
que pueden generar respuestas similares a las humanas. El potencial de
aplicación de esta tecnología es, de hecho, enorme, por lo que ya hay llamados
a regular la IA como ChatGPT.
¿Puede la IA superar en inteligencia a los
humanos? ¿Representa amenazas públicas? ¿Puede la IA convertirse en una amenaza
existencial? El lingüista más destacado del mundo, Noam Chomsky, y uno de
los intelectuales públicos más estimados de todos los tiempos, cuya estatura
intelectual ha sido comparada con la de Galileo, Newton y Descartes, aborda
estas inquietantes preguntas en la entrevista que sigue..
CJ Polychroniou (CJP): Como disciplina
científica, la inteligencia artificial (IA) se remonta a la década de 1950,
pero en las últimas dos décadas ha ido incursionando en todo tipo de campos,
incluidos la banca, los seguros, la fabricación de automóviles, la música y la
defensa. De hecho, se ha demostrado que el uso de técnicas de IA supera en
algunos casos las capacidades humanas, como en una partida de ajedrez. ¿Es
probable que las máquinas se vuelvan más inteligentes que los humanos?
Noam Chomsky (NC): Sólo para aclarar la
terminología, el término “máquina” aquí significa programa, básicamente una
teoría escrita en una notación que puede ser ejecutada por una computadora, y
un tipo de teoría inusual en formas interesantes que podemos dejar de lado
aquí.
Podemos hacer una distinción aproximada entre
la ingeniería pura y la ciencia. No hay una frontera clara, pero es una primera
aproximación útil. La ingeniería pura busca producir un producto que pueda
tener alguna utilidad. La ciencia busca la comprensión. Si el tema es la
inteligencia humana o las capacidades cognitivas de otros organismos, la
ciencia busca la comprensión de esos sistemas biológicos.
Según tengo entendido, los fundadores de la IA
(Alan Turing, Herbert Simon, Marvin Minsky y otros) la consideraban una
ciencia, parte de las ciencias cognitivas que entonces estaban surgiendo, que
utilizaba nuevas tecnologías y descubrimientos en la teoría matemática de la
computación para avanzar en la comprensión. Con el paso de los años, esas
preocupaciones se han desvanecido y han sido desplazadas en gran medida por una
orientación ingenieril. Las preocupaciones anteriores ahora se descartan
comúnmente, a veces con condescendencia, como GOFAI (buena IA a la antigua
usanza).
Siguiendo con la pregunta, ¿es probable que se
diseñen programas que superen las capacidades humanas? Tenemos que ser
cuidadosos con la palabra “capacidades”, por razones a las que volveré. Pero si
tomamos el término para referirnos al desempeño humano, entonces la respuesta
es: definitivamente sí. De hecho, existen desde hace mucho tiempo: la
calculadora en un ordenador portátil, por ejemplo. Puede superar con creces lo
que los humanos pueden hacer, aunque sólo sea por falta de tiempo y memoria.
Para sistemas cerrados como el ajedrez, se comprendió bien en los años 50 que
tarde o temprano, con el avance de las capacidades informáticas masivas y un
largo período de preparación, se podría diseñar un programa para derrotar a un
gran maestro que está jugando con un límite de memoria y tiempo. El logro años
después fue más bien una estrategia de relaciones públicas para IBM. Muchos
organismos biológicos superan las capacidades cognitivas humanas de maneras
mucho más profundas. Las hormigas del desierto que viven en mi patio trasero
tienen cerebros minúsculos, pero superan con creces las capacidades de
navegación humanas, en principio, no sólo en el desempeño. No existe
una Gran Cadena del Ser con los humanos en la cima.
Los productos de la ingeniería de inteligencia
artificial se están utilizando en muchos campos, para bien o para mal. Incluso
los más sencillos y conocidos pueden ser muy útiles: en el área del lenguaje,
programas como el de autocompletar, transcripción en vivo, traductor de Google,
entre otros. Con una potencia informática mucho mayor y una programación más
sofisticada, debería haber otras aplicaciones útiles, también en las ciencias.
Ya ha habido algunas: la asistencia en el estudio del plegamiento de proteínas
es un caso reciente en el que la tecnología de búsqueda masiva y rápida ha
ayudado a los científicos a lidiar con un problema crítico y recalcitrante.
Los proyectos de ingeniería pueden ser útiles
o perjudiciales. Ambas preguntas surgen en el caso de la IA de ingeniería. El
trabajo actual con modelos de lenguaje grandes (LLM), incluidos los chatbots,
proporciona herramientas para la desinformación, la difamación y el engaño a
los desinformados. Las amenazas se acentúan cuando se combinan con imágenes
artificiales y réplicas de voz. Con diferentes preocupaciones en mente, decenas
de miles de investigadores de IA han pedido recientemente una moratoria del
desarrollo debido a los posibles peligros que perciben.
Como siempre, hay que sopesar los posibles
beneficios de la tecnología frente a sus costos potenciales.
Cuando analizamos la IA y la ciencia, surgen
preguntas muy diferentes. En este caso, es necesario actuar con cautela debido
a las afirmaciones exageradas e imprudentes que suelen amplificarse en los
medios de comunicación. Para aclarar las cuestiones, consideremos casos,
algunos hipotéticos y otros reales.
Mencioné la navegación de los insectos, que es
un logro asombroso. Los científicos que estudian los insectos han avanzado
mucho en el estudio de cómo se logra, aunque la neurofisiología, un tema muy
difícil, sigue siendo esquiva, junto con la evolución de los sistemas. Lo mismo
se puede decir de las asombrosas hazañas de las aves y las tortugas marinas que
viajan miles de kilómetros y regresan infaliblemente a su lugar de origen.
Supongamos que Tom Jones, un defensor de la
ingeniería de inteligencia artificial, llega y dice: “Todo su trabajo ha sido
refutado. El problema está resuelto. Los pilotos de aerolíneas comerciales
obtienen los mismos resultados o incluso mejores todo el tiempo”.
Si tan solo nos molestáramos en responder, nos
reiríamos.
Tomemos el caso de las hazañas marineras de
los polinesios, que todavía viven entre las tribus indígenas, que se valían de
las estrellas, el viento y las corrientes para hacer que sus canoas aterrizaran
en un lugar determinado a cientos de kilómetros de distancia. Este también ha
sido el tema de muchas investigaciones para averiguar cómo lo hacían. Tom Jones
tiene la respuesta: “Dejen de perder el tiempo; los buques de guerra lo hacen
todo el tiempo”.
La misma respuesta.
Pasemos ahora a un caso real: la adquisición
del lenguaje. En los últimos años se ha llevado a cabo una extensa y muy
esclarecedora investigación que demuestra que los bebés tienen un conocimiento
muy rico del lenguaje (o los lenguajes) del entorno, mucho más allá de lo que
demuestran en su ejecución. Esto se logra con pocas pruebas y, en algunos casos
cruciales, ninguna. En el mejor de los casos, como han demostrado estudios
estadísticos minuciosos, los datos disponibles son escasos, en particular
cuando se tiene en cuenta la frecuencia de rangos ("ley de Zipf").
Entra Tom Jones: “Han refutado sus
descubrimientos. Sin prestar atención a sus descubrimientos, los LLM que
escanean cantidades astronómicas de datos pueden encontrar regularidades
estadísticas que permiten simular los datos con los que están entrenados,
produciendo algo que se parece bastante al comportamiento humano normal. Los
chatbots”.
Este caso es diferente a los demás. En primer
lugar, es real. En segundo lugar, la gente no se ríe; de hecho, muchos se
quedan asombrados. En tercer lugar, a diferencia de los casos hipotéticos, los
resultados reales están muy lejos de lo que se afirma.
Estas consideraciones plantean un problema
menor con el actual entusiasmo por los LLM: su total absurdo, como en los casos
hipotéticos en que lo reconocemos de inmediato. Pero hay problemas mucho más
graves que el absurdo.
Una de ellas es que los sistemas LLM están
diseñados de tal manera que no nos pueden decir nada sobre el lenguaje, el
aprendizaje u otros aspectos de la cognición, una cuestión de principio,
irremediable. Si se duplican los terabytes de datos escaneados, se añaden otros
billones de parámetros, se utiliza aún más energía de California, y la
simulación del comportamiento mejorará, al tiempo que se revela más claramente
el fracaso en principio del enfoque para producir algún tipo de comprensión. La
razón es elemental: los sistemas funcionan igual de bien con lenguajes
imposibles que los bebés no pueden aprender como con aquellos que adquieren
rápidamente y de forma prácticamente reflexiva.
Es como si un biólogo dijera: “Tengo una nueva
y excelente teoría sobre los organismos. Enumera muchos que existen y muchos
que no pueden existir, y no puedo decirles nada sobre la distinción”.
De nuevo nos reiríamos. O deberíamos hacerlo.
No es Tom Jones, sino que se refiere a casos
reales. Persistiendo en su radical alejamiento de la ciencia, Tom Jones
responde: “¿Cómo puedes saber algo de esto hasta que hayas investigado todos
los idiomas?” En este punto, el abandono de la ciencia normal se hace aún más
claro. Por igualdad de argumentos, podemos descartar la genética y la biología
molecular, la teoría de la evolución y el resto de las ciencias biológicas, que
no han tomado muestras de más que una pequeña fracción de organismos. Y, por si
fuera poco, podemos descartar toda la física. ¿Por qué creer en las leyes del
movimiento? ¿Cuántos objetos se han observado realmente en movimiento?
Además, está la pequeña cuestión de la carga
de la prueba. Quienes proponen una teoría tienen la responsabilidad de
demostrar que tiene algún sentido, en este caso, demostrar que no es válida
para los lenguajes imposibles. No es responsabilidad de otros refutar la
propuesta, aunque en este caso parezca bastante fácil hacerlo.
Centremos nuestra atención en la ciencia
normal, donde las cosas se ponen interesantes. Incluso un solo ejemplo de
adquisición de un lenguaje puede ofrecer una valiosa perspectiva sobre la
distinción entre lenguajes posibles e imposibles.
Las razones son sencillas y conocidas: todo
crecimiento y desarrollo, incluido lo que se denomina “aprendizaje”, es un
proceso que comienza con un estado del organismo y lo transforma paso a paso
hasta etapas posteriores.
La adquisición del lenguaje es un proceso de
este tipo. El estado inicial es la dotación biológica de la facultad del
lenguaje, que obviamente existe, aunque se trate, como creen algunos, de una
combinación particular de otras capacidades. Esto es muy improbable por razones
que ya se han comprendido, pero no es relevante para lo que nos ocupa aquí, así
que podemos dejarlo de lado. Es evidente que existe una dotación biológica para
la facultad humana del lenguaje. Es una obviedad.
La transición se produce hasta un estado
relativamente estable, que sólo cambia superficialmente: el conocimiento de la
lengua. Los datos externos desencadenan y configuran parcialmente el proceso.
Estudiando el estado alcanzado (conocimiento de la lengua) y los datos
externos, podemos sacar conclusiones de gran alcance sobre el estado inicial,
la dotación biológica que hace posible la adquisición del lenguaje. Las
conclusiones sobre el estado inicial imponen una distinción entre lenguas
posibles e imposibles. La distinción es válida para todos aquellos que
comparten el estado inicial: todos los humanos, hasta donde se sabe; no parece
haber diferencias en la capacidad de adquirir el lenguaje entre los grupos
humanos existentes.
Todo esto es ciencia normal y ha conseguido
muchos resultados.
Los experimentos han demostrado que el estado
estable se alcanza en gran medida muy temprano, entre los tres y los cuatro
años de edad. También está bien establecido que la facultad del lenguaje tiene
propiedades básicas específicas de los humanos, por lo que es una verdadera
propiedad de la especie: común a los grupos humanos y, en aspectos
fundamentales, un atributo humano único.
En este esquema se omiten muchas cosas, en
particular el papel de la ley natural en el crecimiento y el desarrollo; en el
caso de un sistema computacional como el lenguaje, los principios de eficiencia
computacional. Pero esa es la esencia del asunto. Una vez más, ciencia normal.
Es importante tener clara la distinción que
hace Aristóteles entre posesión de conocimiento y uso de conocimiento (en la
terminología contemporánea, competencia y desempeño). En el caso del lenguaje,
el estado estable que se obtiene es la posesión de conocimiento, codificado en
el cerebro. El sistema interno determina una serie ilimitada de expresiones
estructuradas, cada una de las cuales podemos considerar como la formulación de
un pensamiento, cada una externalizable en algún sistema sensoriomotor, generalmente
el sonido, aunque podría ser un signo o incluso (con dificultad) el tacto.
El sistema codificado internamente se accede
en el uso del conocimiento (ejecución). La ejecución incluye el uso interno del
lenguaje en el pensamiento: reflexión, planificación, recuerdo y mucho más.
Estadísticamente hablando, ese es, con mucho, el uso abrumador del lenguaje. Es
inaccesible a la introspección, aunque podemos aprender mucho sobre él mediante
los métodos normales de la ciencia, desde “afuera”, metafóricamente hablando.
Lo que se llama “habla interna” es, de hecho, fragmentos de lenguaje
externalizado con el aparato articulatorio silenciado. Es solo un reflejo
remoto del uso interno del lenguaje, asuntos importantes que no puedo abordar
aquí.
Otras formas de uso del lenguaje son la
percepción (análisis) y la producción, esta última involucrando
fundamentalmente propiedades que siguen siendo tan misteriosas para nosotros
hoy como cuando Galileo y sus contemporáneos las miraban con asombro y
admiración en los albores de la ciencia moderna.
El objetivo principal de la ciencia es
descubrir el sistema interno, tanto en su estado inicial en la facultad humana
del lenguaje como en las formas particulares que asume en la adquisición. En la
medida en que se comprenda este sistema interno, podremos proceder a investigar
cómo entra en el desempeño, interactuando con muchos otros factores que
intervienen en el uso del lenguaje.
Los datos de desempeño brindan evidencia sobre
la naturaleza del sistema interno, particularmente cuando se refinan mediante
experimentos, como en el trabajo de campo estándar. Pero incluso la
recopilación de datos más masiva es necesariamente engañosa en aspectos
cruciales. Se limita a lo que se produce normalmente, no al conocimiento del
lenguaje codificado en el cerebro, el objeto primario bajo investigación para
quienes quieren comprender la naturaleza del lenguaje y su uso. Ese objeto
interno determina infinitas posibilidades de un tipo que no se utilizará en el
comportamiento normal debido a factores irrelevantes para el lenguaje, como las
limitaciones de la memoria de corto plazo, temas estudiados hace 60 años. Los
datos observados también incluirán mucho que se encuentra fuera del sistema
codificado en el cerebro, a menudo el uso consciente del lenguaje en formas que
violan las reglas con fines retóricos. Se trata de verdades obvias que conocen
todos los trabajadores de campo, que dependen de técnicas de obtención de
información con informantes, básicamente experimentos, para producir un corpus
refinado que excluya restricciones irrelevantes y expresiones desviadas. Lo
mismo ocurre cuando los lingüistas se utilizan a sí mismos como informantes, un
procedimiento perfectamente sensato y normal, común en la historia de la
psicología hasta el presente.
Si nos adentramos más en la ciencia normal,
nos damos cuenta de que los procesos y elementos internos del lenguaje no se
pueden detectar mediante la inspección de los fenómenos observados. A menudo,
estos elementos ni siquiera aparecen en el habla (o en la escritura), aunque
sus efectos, a menudo sutiles, sí se pueden detectar. Esa es otra razón por la
que la restricción a los fenómenos observados, como en los enfoques de LLM,
limita drásticamente la comprensión de los procesos internos que son los
objetos centrales de la investigación sobre la naturaleza del lenguaje, su
adquisición y su uso. Pero eso no es relevante si se ha abandonado la
preocupación por la ciencia y la comprensión en favor de otros objetivos.
En el ámbito científico, durante milenios se han
llegado a conclusiones mediante experimentos (con frecuencia, experimentos
mentales), cada uno de los cuales es una abstracción radical de los fenómenos.
Los experimentos están impulsados por la teoría y buscan descartar los
innumerables factores irrelevantes que intervienen en los fenómenos observados,
como el desempeño lingüístico. Todo esto es tan elemental que rara vez se lo
analiza. Y resulta familiar. Como se ha señalado, la distinción básica se
remonta a la distinción de Aristóteles entre posesión de conocimiento y uso de
conocimiento. La primera es el objeto central de estudio. Los estudios
secundarios (y bastante serios) investigan cómo se utiliza en el desempeño el
sistema de conocimiento almacenado internamente, junto con los numerosos factores
no lingüísticos que intervienen en lo que se observa directamente.
También podríamos recordar una observación del
biólogo evolucionista Theodosius Dobzhansky, famoso principalmente por su
trabajo con la Drosophila: cada especie es única, y los humanos somos los más
únicos de todos. Si nos interesa entender qué tipo de criaturas somos
–siguiendo el mandato del Oráculo de Delfos hace 2.500 años– nos interesará
principalmente lo que hace que los humanos seamos los más únicos de todos,
principalmente el lenguaje y el pensamiento, estrechamente entrelazados, como
reconoce una rica tradición que se remonta a la Grecia clásica y la India. La
mayor parte de la conducta es bastante rutinaria, por lo tanto, hasta cierto
punto predecible. Lo que nos proporciona una verdadera visión de lo que nos
hace únicos es lo que no es rutinario, que sí encontramos, a veces mediante la
experimentación, a veces mediante la observación, desde los niños normales
hasta los grandes artistas y científicos.
Un último comentario a este respecto. La
sociedad se ha visto acosada durante un siglo por campañas corporativas masivas
para fomentar el desdén por la ciencia, temas bien estudiados por Naomi
Oreskes, entre otros. Empezó con corporaciones cuyos productos son asesinos:
plomo, tabaco, amianto, más tarde combustibles fósiles. Sus motivos son
comprensibles. El objetivo de una empresa en una sociedad capitalista es el
beneficio, no el bienestar humano. Eso es un hecho institucional: si no juegas
el juego, estás fuera, y serás reemplazado por alguien que sí lo haga.
Los departamentos de relaciones públicas de
las empresas reconocieron desde el principio que sería un error negar la
evidencia científica cada vez mayor de los efectos letales de sus productos.
Eso sería fácil de refutar. Es mejor sembrar dudas, fomentar la incertidumbre,
el desprecio por esos trajes de cabeza puntiaguda que nunca han pintado una
casa pero que vienen desde Washington a decirme que no use pintura con plomo,
destruyendo mi negocio (un caso real, fácilmente multiplicable). Eso ha
funcionado demasiado bien. Ahora mismo nos está llevando por un camino de
destrucción de la vida humana organizada en la Tierra.
En círculos intelectuales, la crítica
posmoderna de la ciencia, desmantelada por Jean Bricmont y Alan Sokal, pero que
todavía sigue muy viva en algunos círculos, ha producido efectos similares .
Tal vez sea poco amable plantear esta
pregunta, pero creo que es justo preguntar si los Tom Jones y aquellos que
repiten acríticamente e incluso amplifican sus proclamaciones descuidadas están
contribuyendo a las mismas tendencias nefastas.
CJP : ChatGPT es un chatbot que funciona
con lenguaje natural y utiliza inteligencia artificial para permitir
conversaciones similares a las humanas. En un artículo reciente en The New
York Times , junto con otros dos autores, usted descartó los nuevos
chatbots como una moda porque simplemente no pueden igualar la competencia
lingüística de los humanos. Sin embargo, ¿no es posible que las futuras
innovaciones en IA puedan producir proyectos de ingeniería que igualen e
incluso superen las capacidades humanas?
NC: El crédito por el artículo debe atribuirse
al autor real, Jeffrey Watumull, un excelente matemático, lingüista y filósofo.
Los dos coautores mencionados fueron consultores que están de acuerdo con el
artículo pero no lo escribieron.
Es cierto que los chatbots no pueden, en
principio, igualar la competencia lingüística de los humanos, por las razones
que hemos repetido anteriormente. Su diseño básico les impide alcanzar la
condición mínima de adecuación para una teoría del lenguaje humano: distinguir
los lenguajes posibles de los imposibles. Como se trata de una propiedad del
diseño, no podrá ser superada por futuras innovaciones en este tipo de IA. Sin
embargo, es muy posible que futuros proyectos de ingeniería igualen e incluso
superen las capacidades humanas, si nos referimos a la capacidad humana de
actuar, al desempeño. Como se ha mencionado anteriormente, algunos lo han hecho
desde hace tiempo: las calculadoras automáticas, por ejemplo. Más interesante
aún, como se ha mencionado, los insectos con cerebros minúsculos superan las
capacidades humanas entendidas como competencia.
CJP: En el artículo mencionado
anteriormente también se observó que los proyectos de IA actuales no poseen una
facultad moral humana. ¿Este hecho obvio hace que los robots de IA sean una
amenaza menor para la raza humana? Creo que el argumento podría ser que los
hace incluso más.
NC: Es un hecho evidente, entendiendo la
“facultad moral” en sentido amplio. A menos que se controle cuidadosamente, la
ingeniería de IA puede plantear graves amenazas. Supongamos, por ejemplo, que
se automatizara la atención de los pacientes. Los errores inevitables que se
superarían mediante el juicio humano podrían dar lugar a una historia de
terror. O supongamos que se eliminara a los humanos de la evaluación de las
amenazas determinadas por los sistemas automatizados de defensa antimisiles.
Como nos informa un registro histórico impactante , eso sería el fin de la
civilización humana.
CJP: Los organismos reguladores y de
aplicación de la ley en Europa están expresando su preocupación por la
propagación de ChatGPT, mientras que una ley de la Unión Europea presentada
recientemente intenta abordar la IA clasificando dichas herramientas según su
nivel de riesgo percibido. ¿Está de acuerdo con quienes están preocupados porque
ChatGPT represente una amenaza pública grave? Además, ¿realmente cree que se
puede detener el desarrollo de herramientas de IA hasta que se puedan
introducir salvaguardas?
NC: Puedo simpatizar fácilmente con los
esfuerzos por controlar las amenazas que plantea la tecnología avanzada,
incluido este caso. Sin embargo, soy escéptico sobre la posibilidad de hacerlo.
Sospecho que el genio ya salió de la botella. Los actores maliciosos,
institucionales o individuales, probablemente puedan encontrar formas de evadir
las salvaguardas. Esas sospechas, por supuesto, no son motivo para no
intentarlo y para ejercer vigilancia.
*Artículo
publicado por primera vez en la revista Common
Dreams
Comentarios
Publicar un comentario