El cerebro aprende sobre el mundo de la misma manera que los modelos computacionales

El cerebro aprende sobre el mundo de la misma manera que los modelos computacionales

Para abrirnos camino en el mundo, nuestro cerebro debe desarrollar una comprensión intuitiva del mundo físico que nos rodea, que luego utilizamos para interpretar la información sensorial que llega al cerebro.
1 November 2023

¿Cómo desarrolla el cerebro esa comprensión intuitiva? Se cree que puede utilizar un proceso similar a lo que se conoce como "aprendizaje autosupervisado". Este tipo de aprendizaje automático, desarrollado originalmente como una forma de crear modelos más eficientes para la visión por computadora, permite que los modelos computacionales aprendan sobre escenas visuales basándose únicamente en las similitudes y diferencias entre ellas, sin etiquetas ni otra información.

Un par de estudios de investigadores del Centro de Neurociencia Computacional Integrativa (ICoN) descubren que cuando entrenaron modelos conocidos como redes neuronales utilizando un tipo particular de aprendizaje autosupervisado, los modelos resultantes generaron patrones de actividad muy similares a los observados en los cerebros de animales que realizaban las mismas tareas que los modelos.

Los hallazgos sugieren que estos modelos son capaces de aprender representaciones del mundo físico que pueden usar para hacer predicciones precisas sobre lo que sucederá en ese mundo, y que el cerebro de los mamíferos puede estar usando la misma estrategia, dicen los investigadores del Instituto de Tecnología de Massachusetts.

"El tema de nuestro trabajo es que la IA diseñada para ayudar a construir mejores robots termina siendo también un marco para comprender mejor el cerebro en general", explica Aran Nayebi, postdoctorado en el Centro ICoN. "No podemos decir todavía si se trata de todo el cerebro, pero en escalas y áreas cerebrales dispares, nuestros resultados parecen sugerir un principio organizador".

Modelando el mundo físico

Los primeros modelos de visión por computadora se basaban principalmente en el aprendizaje supervisado. Con este enfoque, los modelos se entrenan para clasificar imágenes, cada una de las cuales está etiquetada con un nombre: gato, automóvil, etc. Los modelos resultantes funcionan bien, pero este tipo de entrenamiento requiere una gran cantidad de datos etiquetados por humanos.

Para crear una alternativa más eficiente, en los últimos años los investigadores han recurrido a modelos que permiten que un algoritmo aprenda a clasificar objetos en función de su similitud entre sí, sin proporcionar etiquetas externas.

"Este es un método muy poderoso porque ahora se pueden aprovechar conjuntos de datos modernos muy grandes, especialmente vídeos, y realmente desbloquear su potencial", dice Nayebi. "Gran parte de la IA moderna que se ve ahora, especialmente en los últimos años con ChatGPT y GPT-4, es el resultado del entrenamiento de una función objetivo autosupervisada en un conjunto de datos a gran escala para obtener una representación muy flexible".

Este tipo de modelos, también llamados redes neuronales, constan de miles o millones de unidades de procesamiento conectadas entre sí. Cada nodo tiene conexiones de diferente intensidad con otros nodos de la red. A medida que ésta analiza enormes cantidades de datos, las fortalezas de esas conexiones cambian dado que la red aprende a realizar la tarea deseada.

Cuando aprende se pueden medir los patrones de actividad de diferentes unidades a nivel interno y la actividad de cada unidad se puede representar como un patrón de activación similar a los patrones de activación de las neuronas en el cerebro.

¿Qué opinas de este artículo?