Cognición extendida y Modelos Masivos de Lenguaje

Juan Pablo Tejada Galeano
jpablo.tejada@udea.edu.co
Instituto de Filosofía
Universidad de Antioquia

La reciente introducción de los modelos masivos de lenguaje (MML) como la tecnología GPT ha suscitado inquietudes sobre posibles efectos negativos en la cognición humana. Autores como Nicholas Carr (2020, 2008) afirman que la constante conectividad y la utilización de la tecnología digital podrían contribuir a un deterioro sostenido del cerebro. Este autor argumenta que la sobreexposición a la información en línea podría disminuir la capacidad de concentración y reflexión profunda, afectando negativamente la retención de información. Este escenario plantea paralelismos con las preocupaciones expresadas por Platón sobre el impacto de la escritura en la memoria y el razonamiento, pues este consideraba que almacenar la información de forma física podría empobrecer la capacidad para retener información (Platón, Fedro, 275b). Sin embargo, la hipótesis de la descarga cognitiva sostiene que usar la tecnología para hacer tareas mentales no siempre hace que la mente sea más débil; en cambio, libera capacidad mental para cosas más complicadas. (Annu, 2020; Hu et al., 2019; Morrison & Richmond, 2020). Por otro lado, la hipótesis de la mente extendida, entendida como la idea de que la cognición humana no está limitada al cerebro y al sistema nervioso, podría ofrecer una perspectiva importante en este debate (Clark y Chalmers, 1998). Este ensayo se propone explorar el fenómeno de los MML a partir de la hipótesis de la mente extendida. En este contexto, se examinará cómo estos sistemas pueden entenderse como una extensión del sistema cognitivo humano.

A modo de definición, la inteligencia artificial, para autores como Chalmers (2023), es un campo de la informática que se centra en el desarrollo de sistemas y algoritmos capaces de realizar tareas que normalmente requieren inteligencia humana, incluyendo, por ejemplo, el aprendizaje automático, donde las máquinas pueden mejorar su rendimiento sin intervención humana directa (Shanahan, 2022). Un aspecto destacado en la evolución de la IA es la incorporación de modelos masivos de lenguaje, como GPT. Estos modelos, entrenados con grandes cantidades de datos lingüísticos, poseen la capacidad de comprender, generar y manipular el lenguaje de manera amplia (Shanahan et al., 2023). De este modo, autores como Ollivier y colaboradores (2023) afirman que dichas tecnologías utilizan técnicas de procesamiento de lenguaje natural para comprender contextos complejos y generar respuestas coherentes, demostrando avances significativos en la comprensión y producción de lenguaje por parte de las máquinas.

Para autores como Shin (2023), la relación entre las diferentes IA como las MML y la mente humana se caracteriza por un proceso cognitivo interconectado. De este modo se entiende que la forma en que los usuarios interactúan con los algoritmos está profundamente vinculada a procesos cognitivos automáticos e interactivos. Esto significa que la manera en que las IAs están conformadas, se configura simultáneamente sobre cómo perciben y comprenden estos mecanismos los usuarios. Esto implica que la mente humana no solo interpreta, sino que se moldea a la par de las características algorítmicas de estos sistemas, estableciendo una conexión dinámica. En este contexto, la interacción con algoritmos se convierte en un proceso cognitivo ampliado, donde las características algorítmicas influyen significativamente en la comprensión del usuario y, a su vez, los usuarios contribuyen a la evolución de los algoritmos a través de la interacción, aprobando o desaprobando la calidad de la información (Shin, 2023).

La hipótesis de la mente extendida, postula que la cognición no está confinada únicamente al cerebro y al sistema nervioso, sino que se extiende más allá del cuerpo, interactuando con el entorno y objetos externos (Clark, 2008, 2015; Clark y Chalmers, 1998). De este modo, la mente se entiende como una transacción fluida entre el cerebro, el cuerpo, el espacio circundante y las relaciones sociales (Paul, 2021). Este paradigma desafía la concepción tradicional de una mente completamente encapsulada en el cráneo, proponiendo que la inteligencia y la cognición se mejoran mediante la habilidosa orquestación de elementos internos y externos. En el contexto de las inteligencias artificiales, diversos autores (Clark, 2015; Paul, 2021; Smart y Clowes, 2021) afirman que la constante interacción con el entorno físico y digital funciona como una expansión de la capacidad mental, posibilitando la externalización de los procesos cognitivos. De esta manera, la cognición se transforma en un fenómeno distribuido, donde la inteligencia no se limita exclusivamente al individuo, sino que se dispersa a través de conexiones dinámicas entre el cerebro, dispositivos tecnológicos y otros agentes cognitivos presentes en el entorno. Esta interacción continua y de doble vía entre la mente humana y su contexto crea un sistema complejo en el cual la cognición no solo se refleja en el individuo, sino que se genera y se modifica a través de una red de conexiones que abarca lo tangible y lo digital (Paul, 2021).

Frente a la manera como se respalda la información, para autores como Pritchard (2010, 2015) es fundamental que un individuo integre de manera consciente y reflexiva la información proporcionada en su proceso cognitivo para que las creencias resultantes sean consideradas epistémicamente virtuosas, es decir, que el agente pueda discernir y manejar la información de manera reflexiva. En contra de lo anterior, Clark (2015) argumenta que no necesariamente la virtud epistémica debe limitarse a la mente consciente, pues procesos como el modelo predictivo mental, aunque no siempre están en la esfera de la conciencia del individuo, son fundamentales para el funcionamiento cognitivo efectivo (Clark, 2015). Esto sugiere que, aunque ciertos procesos pueden operar de manera no consciente, aún contribuyen a la formación de creencias y conocimientos efectivos.

A pesar de la atractiva perspectiva ofrecida por la teoría de la mente extendida en la integración de la inteligencia artificial y la cognición humana, existen críticos que plantean dudas sobre la aplicabilidad generalizada de esta concepción. Sterelny (2010) y Arango-Muñoz (2013) plantean preocupaciones específicas que ponen en duda la validez y relevancia de la teoría de la mente extendida. En primer lugar, argumentan que los casos a favor de esta teoría minimizan la importancia de herramientas cognitivas no exclusivas, pasando por alto que muchas herramientas comunes no necesariamente forman parte de un sistema acoplado. Además, señalan que los ejemplos de Clark y Chalmers son casos atípicos, ya que las personas suelen utilizar una variedad de objetos de manera variable sin generar una dependencia significativa. Por último, critican la falta de consideración adecuada de la individualización y arraigo de los recursos externos, lo que podría exagerar su influencia en la cognición. De este modo, según como lo expresan autores como Arango-Muñoz y Garzón-Rodríguez (2023), la teoría de la mente andamiada proporciona un modelo metodológicamente más flexible y menos exigente epistemológicamente en la interacción entre individuos y herramientas cognitivas, pues a diferencia de la mente extendida, la mente andamiada permite una elección más libre y consciente por parte del individuo sobre si utilizar sus sistemas cognitivos internos o recurrir a herramientas externas, ofreciendo así una perspectiva más adaptable y menos restrictiva en la comprensión de la cognición ampliada.

Podría concluirse que, aunque la teoría de la mente extendida aborda casos atípicos de la interacción de individuos con diferentes objetos cognitivos, no se descarta que, durante una interacción prolongada con los distintos modelos masivos de lenguaje, algunos agentes desarrollen una conexión más dependiente entre estos artefactos y su cognición. Asimismo, la confrontación epistemológica entre la teoría de la mente extendida y la virtud epistémica resalta la necesidad de considerar modelos más viables, como la teoría de la mente andamiada, que se presenta como una opción explicativa menos exigente en términos de la interacción mente-objeto. Este análisis sugiere que, en una etapa histórica crucial en la que apenas se están introduciendo estas herramientas, la teoría de la mente andamiada emerge como un enfoque valioso para comprender la intersección entre la mente humana y las inteligencias artificiales. Sin embargo, es esencial reconocer que esta conclusión podría evolucionar con el tiempo, ya que una exposición continua y persistente a la tecnología podría alterar aspectos fundamentales como la confianza y el respaldo hacia la información proporcionada por las IAs.

Las futuras investigaciones tienen el potencial de ofrecer claridad sobre la influencia de la consistencia en el uso de inteligencias artificiales en el desarrollo del pensamiento, razonamiento y toma de decisiones. Estos sistemas, al integrarse como asistentes cognitivos, poseen la capacidad de almacenar y recuperar información de manera eficiente, aliviando la carga cognitiva asociada con la retención de datos y la resolución de problemas, como señala Chalmers (2019). Además, su habilidad para procesar información a gran escala puede contribuir significativamente a la resolución de problemas complejos, proporcionando perspectivas y soluciones que podrían pasar desapercibidas para la atención humana. Sin embargo, tal como indican autores como Smart y Clowes (2021), es necesario que los usuarios desarrollen una capacidad crítica en la evaluación de la información proporcionada por estos sistemas, garantizando un uso reflexivo y consciente de la inteligencia artificial.

Referencias

Annu, H. (2020). Cognitive offloading an emerging concept: A review study. https://www.homesciencejournal.com/archives/2020/vol6issue2/PartB/6-2-20-544.pdf

Arango-Muñoz, S. (2013). Scaffolded Memory and Metacognitive Feelings. Review of Philosophy and Psychology, 4(1), 135-152. https://doi.org/10.1007/s13164-012-0124-1

Arango-Muñoz, S., & Garzón-Rodríguez, C. A. (2023). Justificación epistémica y cognición extendida.

Carr, N. (2020). The shallows: What the Internet is doing to our brains. WW Norton & Company.

Carr, N. (2008, julio 1). Is Google Making Us Stupid? The Atlantic. https://www.theatlantic.com/magazine/archive/2008/07/is-google-making-us-stupid/306868/

Chalmers, D. (2019). Extended cognition and extended consciousness. Andy Clark and his critics, 9-20.

Chalmers, D. J. (2023). Could a large language model be conscious? arXiv preprint arXiv:2303.07103.

Clark, A. (2008). Supersizing the mind: Embodiment, action, and cognitive extension. OUP USA.

Clark, A. (2015). Surfing uncertainty: Prediction, action, and the embodied mind. Oxford University Press.

Clark, A. (2015). What ‘Extended Me’ knows. Synthese, 192(11), 3757-3775. https://doi.org/10.1007/s11229-015-0719-z

Clark, A., & Chalmers, D. (1998). The extended mind. analysis, 58(1), 7-19.

Hu, X., Luo, L., & Fleming, S. M. (2019). A role for metamemory in cognitive offloading. Cognition, 193, 104012.

Morrison, A. B., & Richmond, L. L. (2020). Offloading items from memory: Individual differences in cognitive offloading in a short-term memory task. Cognitive Research: Principles and Implications, 5(1), 1. https://doi.org/10.1186/s41235-019-0201-4

Ollivier, M., Pareek, A., Dahmen, J., Kayaalp, M. E., Winkler, P. W., Hirschmann, M. T., & Karlsson, J. (2023). A deeper dive into ChatGPT: History, use and future perspectives for orthopaedic research. Knee Surgery, Sports Traumatology, Arthroscopy, 31(4), 1190-1192.

Paul, A. M. (2021). The extended mind: The power of thinking outside the brain. Eamon Dolan Books.

Plato, García Gual, C., Martínez Hernández, M., Lledó, E., & Plato. (1986). Fedón ; Banquete ; Fedro. Gredos.

Pritchard, D. (2010). Cognitive ability and the extended cognition thesis. Synthese, 175(1), 133-151. https://doi.org/10.1007/s11229-010-9738-y

Pritchard, D. (2015). Intellectual virtue, extended cognition, and the epistemology of education. En Intellectual virtues and education (pp. 113-127). Routledge.

Shanahan, M. (2022). Talking About Large Language Models. arXiv preprint arXiv:2212.03551.

Shanahan, M., McDonell, K., & Reynolds, L. (2023). Role-Play with Large Language Models (arXiv:2305.16367). arXiv. https://doi.org/10.48550/arXiv.2305.16367

Shin, D. (2023). Embodying algorithms, enactive artificial intelligence and the extended cognition: You can see as much as you know about algorithm. Journal of Information Science, 49(1), 18-31. https://doi.org/10.1177/0165551520985495

Smart, P., & Clowes, R. W. (2021). Intellectual virtues and Internet-extended knowledge. Social Epistemology Review and Reply Collective, 10(1), 7-21.

Sterelny, K. (2010). Minds: Extended or scaffolded? Phenomenology and the Cognitive Sciences, 9(4), 465-481. https://doi.org/10.1007/s11097-010-9174-y

Últimas noticias

La caracterización instrumental de materiales: coloquio 2025-1

Violencia y animales: Yonatan Durán becado para doctorado

La mente extendida y el transhumanismo: nuevo artículo del profesor Ángel Rivera-Novoa

Suscríbe
NEWSLETTER