Grabaciones de la vida de un bebé de 1 año entrenan a la IA para aprender palabras

Desde el nacimiento, los bebés comienzan a recibir estímulos visuales y auditivos, fundamentales para aprender algo esencial en su vida: el lenguaje. Entre los seis y los nueve meses comienzan a hablar, asociando sonidos con objetos y conceptos del mundo real. Cuando cumplen dos años, suelen tener un vocabulario de unas 300 palabras. Pero, ¿cómo se produce este proceso de aprendizaje? Un equipo de investigadores de la Universidad de Nueva York estudió grabaciones de la vida diaria de un niño durante su primer año de vida para encontrar la respuesta. El experimento no solo confirmó el vínculo entre la representación visual y la lingüística -es decir, lo que se ve y la palabra que le corresponde-, sino que también contribuyó al desarrollo de un modelo de inteligencia artificial (IA), que logró reconocer diferentes objetos en de la misma manera que los niños.

“Los grandes sistemas de IA se entrenan y alimentan con una cantidad astronómica de datos. Estamos hablando de miles de millones de palabras para poder desarrollar un sistema lingüístico”, explica Wai Keen Vong, doctor en psicología e informática, que coordinó el estudio publicado este jueves en la revista Ciencia. “Sin embargo, los humanos sólo necesitan unos pocos miles de palabras para lograr un sistema de comunicación eficaz”, añade. De este contraste nació el interés por investigar si una IA sería capaz de aprender a hablar del mismo modo que los niños: observan su entorno, escuchan a las personas que les rodean y hacen la conexión entre lo que ven y lo que oyen.

La adquisición temprana del lenguaje es un tema ampliamente debatido para el cual se han propuesto varias hipótesis. Tradicionalmente, este tipo de estudios se han realizado en laboratorios controlados, lo que da como resultado hallazgos que a menudo no pueden extrapolarse de manera efectiva a entornos más dinámicos y variados del mundo real. “La novedad de este análisis radica en que pudimos trabajar con datos de primera mano, a partir de una situación de aprendizaje real”, subraya Vong.

Para ello, el equipo de Vong analizó 61 horas de la vida de Sam, un niño australiano que durante un año y medio -de seis a 25 meses- usó un casco con una cámara que registraba las interacciones que tenía con sus padres y abuelos. diariamente. En realidad, sólo registró el 1% de su tiempo de vigilia durante todo el experimento. Pese a ello, se crearon cientos de imágenes que reproducían exactamente lo que veía el niño, acompañadas de expresiones lingüísticas de sus allegados, que explicaban la naturaleza de los objetos que lo rodeaban. “Por ejemplo, durante la comida, la cámara en su cabeza grabó la imagen de una cuchara, al mismo tiempo que su madre le preguntaba algo relacionado con este utensilio. Y así sucesivamente, con decenas de objetos cotidianos”, explica Vong.

El vínculo entre estos dos medios casi nunca es obvio. De hecho, el investigador reconoce que parte del desafío para los bebés es entender exactamente qué palabra está asociada al objeto con el que interactúan. “La mayoría de las veces, los padres no etiquetan todos los artículos. Por cada pelota que Sam miraba, sus padres no le decían «eso es una pelota», «mira la pelota». Escuchó las palabras en un contexto natural y la dificultad es determinar con precisión, en una frase más o menos larga, qué palabra corresponde al objeto redondo con el que estaba jugando”, subraya Vong.

Entrena una IA como un bebé

Tras observar el comportamiento del niño, los investigadores pudieron confirmar que había aprendido el significado de las palabras conectando el estímulo visual, es decir la imagen que se le presentaba, con la respuesta de los miembros de su familia, que repetían la palabra correspondiente. Con estos resultados, pasaron a la segunda fase del experimento: probar si una IA sería capaz de aprender a reconocer objetos de la misma forma que Sam.

El modelo de inteligencia artificial, llamado CVCL (El punto de vista del niño para el aprendizaje contrastante., aprendizaje contrastivo desde el punto de vista del niño), fue entrenado con 64 categorías visuales -utensilios, juguetes, animales, entre otros- y la transcripción de lo que Sam escuchaba al mirar esos objetos. Una vez creada esta base de datos, los investigadores comenzaron a probar si la IA era capaz de identificar las imágenes. Según Vong, el modelo, con información sensorial limitada y mecanismos de aprendizaje relativamente genéricos, proporciona una base computacional para estudiar cómo los niños adquieren sus primeras palabras y cómo esas palabras pueden conectarse con el mundo visual.

«Descubrimos que CVCL puede aprender a establecer conexiones entre imágenes y texto a partir de fragmentos limitados de la experiencia de un solo niño», señalan los autores en el estudio. En algunos casos, los objetos aparecían sobre un fondo blanco, mientras que en otros estaban en un entorno con más estímulos. De hecho, la precisión de clasificación del modelo fue del 61,6% y se mantuvo alta incluso cuando se introdujeron en el sistema otras imágenes además de las grabaciones de Sam, en las que la IA no había sido entrenada. “Los resultados confirman nuestra hipótesis de que con sólo dos impulsos, lo que el niño ve y lo que oye, es posible conseguir y acelerar este tipo de aprendizaje”, subraya Vong.

Estudia cómo nace el habla

Antonio Rodríguez Fornells, investigador del Instituto de Neurociencias de la Universidad de Barcelona, destaca el aspecto innovador del estudio, que abre el camino a comprender, a través de simulaciones por ordenador, cuáles son los mecanismos mínimos de aprendizaje que utilizan los niños para afrontar el reto del aprendizaje de un idioma: «Estudios previos sobre bebés en psicología del desarrollo aportan información clave con experimentos muy novedosos, pero la falta de estudios de neurociencia o neuroimagen sobre ellos (debido a la dificultad de aplicar estas técnicas en bebés) no permite hecho. progreso.» en neurociencia para aclarar los mecanismos cerebrales que apoyan estos procesos de adquisición del lenguaje”, explica este neurocientífico.

Además, reconoce que las simulaciones propuestas en el artículo respaldan algunas teorías del lenguaje propuestas previamente. «Entre ellos, el simple hecho de disponer de simples mecanismos de aprendizaje asociativo (que permitan vincular imágenes y palabras) en un entorno de aprendizaje natural (como el que experimentan los niños al nacer y en los primeros meses de su vida) es suficiente para poder aprender estas relaciones y generalizar el contenido del significado”, añade Rodríguez Fornells.

Sin embargo, el estudio tiene ciertas limitaciones. El modelo CVCL se entrenó con grabaciones de la cámara montada en la cabeza de un solo niño y se aprendió a través de transcripciones de voz en lugar de habla directa, que omite matices importantes como la entonación y el énfasis. “Hay que recordar también que el aprendizaje del modelo fue pasivo, basado en grabaciones, sin interacción activa con el entorno, lo que difiere de la forma en que los niños aprenden en entornos reales”, reconocen los autores de la investigación.

puedes seguir LA MATERIA dentro Facebook, X Y Instagramo regístrate aquí para recibir nuestro boletín semanal.

Grabaciones de la vida de un bebé de 1 año entrenan a la IA para aprender palabras | Tecnología

Entrena una IA como un bebé

Estudia cómo nace el habla

Por Azanías Pelayo

Ruanda y el crecimiento de los servicios profesionales para la modernización económica

Consejos para añadir más fibra a tu dieta diaria

superando brechas sanitarias en Timor Oriental mediante la RSE

Estrategias multisectoriales de RSE para reducir residuos marinos en Tailandia

Economía del conocimiento en Argentina: impulso a sectores estratégicos y valor agregado

avances en RSE industrial para la industria de materiales de construcción en Turkmenistán

Grabaciones de la vida de un bebé de 1 año entrenan a la IA para aprender palabras | Tecnología

Entrena una IA como un bebé

Estudia cómo nace el habla

Por Azanías Pelayo

Artículos similares