La IA de la ciencia Aurora GPT

Aurora GPT: conoce el chatbot con 1 billón de parámetros científicos

La irrupción de la era digital significa una expansión sin precedentes en todos los campos del saber humano. En este sentido, la reciente estructuración de la iniciativa Aurora GPT tiene como propósito convertirse en el chatbot académico más avanzado del mundo.

No obstante, de aquí surgen un par de preguntas ¿Quiénes están involucrados en este ambicioso proyecto y cómo pretenden alcanzar sus objetivos? Mediante el recorrido preparado a continuación, aprenderás sobre el funcionamiento y las fases de desarrollo que articulan Aurora GPT; además de sus posibles contribuciones a la renovación de la ciencia y tecnología.

Aurora GPT: la herramienta de investigación científica del futuro

Aurora GPT se define como una Inteligencia Artificial generativa con la capacidad para recopilar, clasificar, plantear y resolver problemas pertenecientes a la ciencia e ingeniería. El proyecto está integrado por 15 equipos de investigación del Argonne National Laboratory (ANL) en alianza con Intel y HP; quienes trabajan con los datos consolidados por el ordenador Aurora, la segunda supercomputadora de mayor potencia a nivel mundial.

Por ende, la puesta en marcha de esta nueva herramienta requiere una planificación rigurosa que contempla los siguientes aspectos:

Funcionamiento

La matriz de aprendizaje automático de esta IA se sustenta en la supercomputadora Aurora, la cual posee un hardware con:

  • 21.248 procesadores Intel CPU Max Series
  • 63.744 gráficas Intel Data Center GPU Max Series
  • 1.024 nodos de almacenamiento

En su conjunto, estos elementos posibilitan 220 petabytes de capacidad y un ancho de banda de 31 terabytes por segundo. Así, es posible procesar una gran cantidad de información proveniente de disciplinas especializadas como física, matemáticas, biología, química, entre otras. Finalmente, su interfaz de chatbot favorece la accesibilidad al conocimiento científico mediante preguntas formuladas por los usuarios.

Ordenador Aurora Chatbot
Fuente: Unsplash

Fases de desarrollo

La optimización del sistema de Aurora GPT depende de dos procesos complementarios que avanzan actualmente:

  • Nodos: por el momento, la IA sólo cuenta con un total de 256 nodos activados. La razón de esta decisión se debe a que su funcionamiento debe ser habilitado de manera progresiva. Esto garantizará que la capacidad de memoria se ajuste a los exigencia del modelo de lenguaje que se busca implementar. Con el tiempo, se espera activar la totalidad de los nodos para alcanzar el máximo rendimiento.
  • Entrenamiento: para la generación de nuevo conocimiento científico, se aplicará un programa con 1 billón de parámetros. Esto quiere decir que podrá asimilar datos de textos, estudios de laboratorio, códigos y documentos académicos internacionales. A pesar de que esto no superará los 1,7 billones de parámetros de GPT-4; estará situada por encima de los 560 mil millones de parámetros de Bard, la IA de Google

Aurora GPT: una nueva era de avances tecnológicos

El proyecto de Aurora GPT proporcionará una base sólida para consolidar investigaciones en aspectos como:

Tiempos de investigación

El aprendizaje automático de esta IA puede simplificar los tiempos de investigación hasta en un 50%. Esto es crucial en la medida que se acelerarían tareas como el registro masivo de datos; así como los modelos de simulación y reportes gráficos.

De hecho, la posibilidad de una interfaz multimodal para el chatbot de Aurora constituye uno de los grandes desafíos; dado que aún no se define si sus respuestas combinarán texto, imágenes y videos. Si esta llegara a ser la elección, reduciría enormemente la carga de trabajo de los científicos.

Conocimiento científico Inteligencia artificial
Fuente: Unsplash

Exaescala 

Las supercomputadoras como Aurora pueden realizar operaciones informáticas de exaescala; es decir, mínimo 1 exaflop por segundo, equivalente a calcular un trillón de operaciones de punto flotante por segundo. Esta capacidad representa un amplio espectro de oportunidades para el conocimiento científico en campo como:

  • Química: Anouar Benalli, científico computacional del ANL, prepara un código de química y ciencia de materiales denominado QMCPACK. Este código, basado en el método Quantum Monte Carlo (QMC); puede analizar y predecir cómo interactúan los electrones de diferentes materiales. De esta forma, se pueden sintetizar nuevos materiales teniendo en cuenta estructura, comportamiento, condiciones de fabricación y conductividad. También, es posible evaluar materiales ya existentes, como baterías o catalizadores, para mejorar su desempeño.
  • Física: William Tang, investigador principal del Laboratorio Físico de Plasma de Princeton, argumenta que Aurora deshará limitaciones teóricas. Al respecto, considera que se lograrían nuevas modalidades o el perfeccionamiento de fuentes de energía limpia y sostenibilidad en general; del mismo modo, señala que servirá de base para la comprensión y descubrimiento de fenómenos astrofísicos que apenas se están planteando.
  • Medicina: Rick Stevens, director asociado del ANL, manifiesta que Aurora fortalecerá la ciencia médica. En particular, tiene como objetivo la detección temprana de cualquier síntoma de cáncer; además de la elaboración de medicamentos más efectivos mediante el monitoreo de su interacción con la salud de los pacientes.

En términos generales, el proyecto de Aurora GPT constituye un punto de partida para ampliar los horizontes de la investigación. A pesar de que su funcionamiento y fases de desarrollo todavía no están completadas, ya se vislumbran avances prometedores. Precisamente, el aprendizaje automático y operaciones de exaescala suponen nuevos materiales industriales, medicamentos, energías limpias y métodos de estudio. Para estar al tanto de las últimas tendencias en ciencia y tecnología, subscríbete a nuestro contenido.

Imagen de cabecera: Unsplash

Sobre el autor

RELACIONADOS

Chica usando un reconocimiento de voz de teléfono inteligente

Detección de voz falsa mediante IA

La detección de voz falsa a gran escala presenta desafíos significativos, no solo por su complejidad tanto en las técnicas de suplantación, que en un...