Un nuevo modelo de aprendizaje automático, TweetyBERT, segmenta y clasifica automáticamente las vocalizaciones de los canarios con precisión experta, según han comprobado investigadores de la Universidad de Oregón (Estados Unidos).

Este avance ofrece una plataforma escalable para la neurociencia, proporciona información sobre la base neuronal del aprendizaje y la producción del lenguaje en el cerebro, y ofrece posibles aplicaciones para una comprensión más amplia de la vocalización animal. El estudio se publica en la revista científica Patterns.

Los métodos actuales de IA para analizar las vocalizaciones animales requieren datos de entrenamiento etiquetados por humanos, un proceso lento y laborioso. Desarrollamos TweetyBERT, una red neuronal autosupervisada para analizar el canto de las aves. Puede procesar rápidamente grabaciones vocales sin etiquetar, identificar unidades de comunicación y anotar secuencias, aporta Tim Gardner, profesor asociado de bioingeniería en el Campus Knight de la Universidad de Oregón.

Los neurocientíficos utilizan canarios, o pájaros cantores, debido a su notable capacidad para aprender cantos complejos y prolongados a lo largo de su vida, lo que ofrece una perspectiva sobre la base neuronal de comportamientos aprendidos complejos. George Vengrovski, estudiante de posgrado en el laboratorio de Gardner, desarrolló TweetyBERT como un medio para anotar automáticamente los cantos de los canarios, que consisten en entre 30 y 40 sílabas distintas encadenadas en secuencias. Vengrovski afirma que podría cambiar nuestra comprensión de cómo el cerebro produce el habla.

Red neuronal

La herramienta adapta BERT, la arquitectura de IA lingüística subyacente a las primeras versiones de grandes modelos lingüísticos como ChatGPT, para gestionar la singular estructura acústica del canto de las aves. Esta red neuronal transformadora autosupervisada está entrenada para predecir fragmentos de audio enmascarados u ocultos sin necesidad de supervisión humana ni etiquetas, y aprende de forma autónoma las unidades de comportamiento del canto (como notas, sílabas y frases), con un rendimiento similar al de los anotadores expertos.

Esta capacidad de clasificar y anotar cantos rápidamente, detectando diferencias entre individuos y rastreando cómo cambian con el tiempo, puede ayudar a los neurocientíficos a descubrir los fundamentos neuronales de cómo el cerebro aprende y produce el lenguaje.

Población de aves

Más allá de la neurociencia, con modificaciones, TweetyBERT podría aplicarse a poblaciones naturales de aves, identificando cambios en los patrones vocales que podrían revelar cómo las aves están respondiendo a la expansión de la infraestructura humana y al cambio climático.

«Lo desarrollamos para canarios, pero el enfoque subyacente no es específico para cada especie, y el mundo está lleno de aves cuyo comportamiento vocal apenas rastreamos. Con algunas modificaciones, las aplicaciones de TweetyBERT empiezan a ser muy diferentes», finaliza Gardner.

El enfoque subyacente de TweetyBERT ya se está utilizando con delfines y ballenas, lo que sugiere que podría extenderse mucho más allá de las aves y profundizar nuestra comprensión de la comunicación animal de manera más amplia.