
IBM y la Agencia Espacial Europea (ESA, por sus siglas en inglés) han presentado este martes Terramind, el modelo de inteligencia artificial (IA) generativa de código abierto "más eficaz" para la observación de la Tierra. Según IBM, el modelo ha sido entrenado previamente en TerraMesh, el conjunto de datos geoespaciales más grande disponible construido por investigadores como parte del proyecto.
De acuerdo con IBM, TerraMind combina información procedente de nueve millones de muestras de datos distribuidas globalmente y alineadas de forma espacio-temporal en nueve modalidades principales: observaciones de sensores en satélites, la geomorfología de la superficie de la Tierra, las características de la superficie importantes para la vida en la Tierra (vegetación y uso del suelo) y descripciones básicas de ubicaciones y sus características (latitud, longitud y descripciones de texto sencillas).
Además, tiene una arquitectura "única" de codificador-decodificador basada en transformadores simétricos, que está diseñada para trabajar con entradas basadas en píxeles, tokens y secuencias, así como aprender correlaciones entre modalidades distintas de datos. A pesar de haber sido entrenado con 500.000 millones de tokens, es un modelo "pequeño y ligero", que utiliza "diez veces menos recursos informáticos que el uso de modelos estándar para cada modalidad". Esto significa que los usuarios pueden implementarlo a escala con un coste menor, al tiempo que reducen el consumo total de energía en la etapa de inferencia.
Por otro lado, constituye el primero modelo de IA generativa multimodal "any to any" para la observación de la Tierra por lo que puede autogenerar datos de entrenamiento adicionales a partir de otras modalidades, una técnica que los investigadores de IBM han denominado 'Thinking-in-Modalities' (TiM).
El modelo se ha desarrollado en el marco de una iniciativa liderada por la ESA para mejorar el acceso a los modelos fundacionales dentro de la comunidad de observación de la Tierra. En el proceso han participado también KP Labs, Julich Supercomputing Center (JSC) y la Agencia Espacial Alemana (DLR).
Para llevarla a cabo, los investigadores de IBM combinaron sus conocimientos técnicos en preparación de datos y construcción de modelos fundacionales con los datos de observación de la Tierra de la ESA y su experiencia en la evaluación de modelos para desarrollar un nuevo modelo fundacional de IA multimodal para la observación de la Tierra. En concreto, se entrenó utilizando la infraestructura y los conocimientos del Centro de Supercomputación de Jülich.
"En la actualidad, TerraMind es el modelo fundacional de IA con mejor rendimiento para la observación de la Tierra según los puntos de referencia que establece la comunidad", ha señalado Juan Bernabé-Moreno, director de IBM Research en Reino Unido e Irlanda, y líder de Accelerated Discovery de IBM para el clima y la sostenibilidad.
Además, IBM pone como ejemplo que, para predecir el riesgo de escasez de agua, los investigadores deben tener en cuenta muchos factores diferentes, como el uso del suelo, el clima, la vegetación, las actividades agrícolas y la ubicación. Antes de TerraMind, todos estos datos estaban dispersos y almacenados por separado. Reunir esta información permite a los usuarios hacer predicciones más precisas sobre el riesgo potencial de escasez de agua basándose en una visión más amplia de las condiciones en la Tierra
En este sentido, la directora de Programas de Observación de la Tierra de la ESA y responsable de ESRIN, Simonetta Cheli, ha destacado que TerraMind permite una comprensión "más profunda de la Tierra" tanto para los investigadores como para las empresas "en comparación con los modelos similares".
Por su lado, el científico de datos de Observación de la Tierra de la ESA, Nicolas Longepe, ha incidido en que se está liberando "todo el potencial" de los datos espaciales para proteger la Tierra con la ciencia y la tecnología de observación de la Tierra y la colaboración internacional.
"Este proyecto es un ejemplo perfecto en el que la comunidad científica, las grandes empresas tecnológicas y los expertos han colaborado para aprovechar esta tecnología en beneficio de las ciencias de la Tierra. La magia ocurre cuando se unen expertos en datos de observación de la Tierra, expertos en aprendizaje automático, científicos de datos e ingenieros de HPC", ha puesto en valor.
|