Marcelo Bertolami de Intel: "Aurora no es solo una supercomputadora exaescala, es un logro tecnológico"
Marcelo Bertolami, director de Socios Regionales y del Equipo de Tecnología de LatAm en Intel | Fotografía Créditos: Intel.

Marcelo Bertolami de Intel: "Aurora no es solo una supercomputadora exaescala, es un logro tecnológico"

La participación de Intel en el desarrollo de Aurora, el primer sistema exaescala entregado al Departamento de Energía de Estados Unidos, marcó un hito en la historia de la computación de alto rendimiento. Este proyecto, realizado en conjunto con HPE y el Laboratorio Nacional de Argonne, combina visión institucional, colaboración estratégica y una proyección tecnológica que trasciende los límites del hardware.

Con este motivo, conversamos con Marcelo Bertolami, director de Socios Regionales y del Equipo de Tecnología de LatAm en Intel, sobre el significado de Aurora, los aprendizajes de la colaboración y las oportunidades que abre para la ciencia y la industria.

Marcelo Bertolami, director de Socios Regionales y del Equipo de Tecnología de LatAm en Intel | Fotografía Créditos: Intel.

Aurora como hito y posicionamiento estratégico

Aurora significó para Intel el ingreso oficial a la era exaescala, un logro que no solo refleja la capacidad tecnológica de la compañía, sino que también la ubica en una posición destacada frente a sus competidores en HPC e inteligencia artificial.

"Aurora no es solo una supercomputadora, es un logro tecnológico. Capaz de realizar dos billones de cálculos por segundo, representa la llegada de Intel a la era exaescala con una plataforma diseñada para afrontar los desafíos más complejos de la ciencia y la inteligencia artificial".

El valor simbólico del proyecto también se reflejó en el equipo humano que lo impulsó, que vivió en primera persona el inicio de una nueva etapa para Intel.

"Para el equipo de Intel que estuvo involucrado, ver encenderse el primer procesador de producción en el laboratorio JF5, en Oregón, fue un momento histórico, cargado de emoción, orgullo y una profunda responsabilidad".
Intel y Argonne presentan Aurora: supercomputador exascale al servicio de la ciencia
Aurora es el nuevo sistema exascale desarrollado por Intel y Argonne para impulsar investigación científica de alto impacto.

Este hito no se limitó al plano tecnológico, sino que marcó una declaración de posicionamiento estratégico. Para Intel, Aurora es la prueba de que su ecosistema de hardware y software puede sostener proyectos de impacto global y responder a los desafíos más exigentes de la comunidad científica.

"Con Aurora nos posicionamos como un actor clave en el cómputo de alto rendimiento (HPC) e IA, al ofrecer la capacidad de acelerar investigaciones que van desde el mapeo del cerebro hasta el diseño avanzado de aeronaves".

Ese posicionamiento trasciende el sector tecnológico y ya está teniendo impacto en la manera en que la ciencia aborda los grandes problemas globales.

"Ya está revolucionando la manera en que los científicos utilizan la IA y las simulaciones para abordar algunos de los desafíos más complejos de la ciencia y la ingeniería. Es una prueba tangible de cómo la innovación puede transformar el conocimiento científico a escala global".

Un modelo de colaboración entre industria y laboratorio

El desarrollo de Aurora fue posible gracias a la cooperación estrecha entre Intel, HPE y el Laboratorio Nacional de Argonne, quienes trabajaron como un solo equipo en todas las etapas del proyecto.

"Desde las fases más tempranas del proyecto trabajamos con HPE y el Laboratorio Nacional de Argonne como un solo equipo, con un modelo de colaboración que integraba no solo las capacidades técnicas de cada parte, sino también una cultura de innovación conjunta".

Este esquema permitió que las fortalezas de cada actor se complementaran y que el laboratorio entregara observaciones clave para ajustar el diseño.

"Argonne participó activamente en el diseño y desarrollo del sistema, aportando retroalimentación técnica constante que nos permitió refinar el hardware, el software y las arquitecturas intermedias".

A partir de esa validación continua, la integración con HPE se estableció como la columna vertebral operativa del proyecto.

"Con HPE nos enfocamos en la integración de hardware, software y sistemas a escala exaescala, abordando desafíos que van desde la interconexión de miles de nodos".
Aurora Exascale Compute Blade, es decir, la unidad de cómputo básica que compone el sistema Aurora desarrollado por Intel y HPE para el Laboratorio Nacional de Argonne. | Créditos: Laboratorio Nacional de Argonne

La magnitud del reto exigió medidas de eficiencia y confiabilidad que aseguraran continuidad operativa en condiciones reales.

"Hasta la implementación de soluciones de refrigeración líquida directa para optimizar eficiencia y estabilidad térmica".

Ese nivel de integración consolidó un método de trabajo con visibilidad compartida de riesgos y decisiones técnico-operativas.

"Este modelo, basado en transparencia, comunicación continua y resolución conjunta de problemas, establece un precedente: fabricantes, integradores y usuarios finales trabajando de forma integrada para acelerar la innovación y asegurar que el sistema cumpla con las necesidades operativas y científicas".
Intel: Ingenieros latinos están impulsando la nueva ola de supercomputadoras
Los ingenieros del Centro de Diseño de Intel en Guadalajara, México, participaron en la construcción de esta supercomputadora con tecnologías de Intel para centros de datos.

El rol del Departamento de Energía en la planificación

El Departamento de Energía de Estados Unidos definió los objetivos estratégicos de Aurora desde el inicio, lo que influyó directamente en la planificación técnica y en las decisiones de diseño de Intel.

"El Departamento de Energía de Estados Unidos (DOE), a través del Laboratorio Nacional de Argonne, definió desde el inicio los objetivos estratégicos que debía cumplir Aurora: ser una plataforma capaz de ejecutar simulaciones científicas, realizar análisis de datos e impulsar el desarrollo de inteligencia artificial aplicada a problemas científicos".
U.S. Department of Energy and Intel to Build First Exascale Supercomputer
The Argonne National Laboratory supercomputer will enable high performance computing and artificial intelligence at exascale by 2021.

Estos lineamientos iniciales funcionaron como hoja de ruta, asegurando que cada componente del sistema respondiera a necesidades científicas concretas.

"Estas metas guiaron nuestras decisiones técnicas en todas las fases del proyecto".
Intel presenta procesadores Xeon de 4ta generación, CPUs Max Series y GPUs Data Center Max
Intel lanzó procesadores Xeon de 4ta generación, CPU Max y GPU Max Series con mejoras en eficiencia, aceleradores y memoria HBM2e.

La influencia del DOE se extendió hasta la elección de procesadores y aceleradores, garantizando que la infraestructura resultante combinara escalabilidad y flexibilidad.

"Desde la arquitectura de cómputo y almacenamiento hasta la selección de procesadores Intel® Xeon® CPU y las Intel® Data Center GPUs (Max Series), todo fue diseñado para cumplir los requisitos de rendimiento, escalabilidad y flexibilidad definidos por el DOE".
Intel Xeon Max Series | Imagen Créditos: Intel.
GPU Intel Data Center Max Series | Imagen Créditos: Intel

Frameworks y entornos de inteligencia artificial

La colaboración con Argonne también permitió a Intel trabajar en la optimización de frameworks como oneAPI y en la creación de entornos de inteligencia artificial, garantizando que Aurora pudiera desplegar aplicaciones críticas desde el primer día.

"Nuestra colaboración con Argonne no se limitó a la construcción física de Aurora, trabajamos juntos en la optimización de software, la maduración de frameworks como oneAPI y la creación de entornos de IA adaptados a cargas de trabajo de alto rendimiento".

Para alcanzar ese objetivo, el equipo contó con un banco de pruebas que permitió afinar el software antes de la implementación definitiva.

"Para esto utilizamos el sistema de prueba Sunspot, que cuenta con la misma arquitectura que Aurora, y que nos permitió validar, depurar y optimizar el código antes de su despliegue final".
Getting Started on Sunspot | Argonne Leadership Computing Facility

La experiencia con Sunspot sirvió como un campo de pruebas que redujo tiempos de integración y garantizó que el sistema alcanzara su máximo rendimiento desde el inicio.

"Esta fase fue clave para garantizar que las aplicaciones críticas pudieran aprovechar el potencial de Aurora desde el primer día".

Durante el desarrollo de Aurora, Intel y Argonne implementaron Sunspot, un sistema de prueba a menor escala que permitió validar arquitecturas, frameworks y aplicaciones críticas antes de la entrada en operación del supercomputador exaescala.

Racks del sistema Sunspot en Argonne, réplica a menor escala de Aurora con procesadores Intel Xeon Max y GPUs Max Series, utilizados para pruebas y optimización previa. | Fotografía Créditos: Argonne Leadership Computing Facility

La experiencia previa demostró que la colaboración temprana con el usuario final genera beneficios concretos en eficiencia y tiempos de integración.

"El trabajo conjunto en la fase previa de pruebas a escala real nos demostró que la co-innovación temprana con el usuario final no solo reduce los tiempos de integración, sino que también permite alcanzar un rendimiento óptimo de manera inmediata".
Intel’s oneAPI provides tools to prepare code for Aurora | Argonne Leadership Computing Facility

Impacto científico y proyección institucional

Aurora está diseñada para ser una plataforma estratégica en múltiples áreas científicas, con impacto en investigación climática, médica y en el desarrollo de nuevos materiales.

"En Intel vemos a Aurora como una plataforma estratégica para la investigación científica a nivel global".

La alianza con el Laboratorio Nacional de Argonne permitió enfocar sus capacidades hacia disciplinas críticas que marcan la frontera del conocimiento.

"Junto con el Laboratorio Nacional de Argonne, hemos orientado sus capacidades hacia áreas como la climatología, la investigación del cáncer, la cosmología y la ciencia de materiales".
Argonne National Laboratory Celebrates Aurora Exascale Computer
Intel, HPE and DOE leaders and researchers gather to celebrate the collaboration, which is already revolutionizing how scientists use artificial intelligence and simulations.

La clave de este impacto está en la arquitectura heterogénea y en un ecosistema abierto que potencia la portabilidad de las aplicaciones.

"Su arquitectura heterogénea, que combina CPUs y GPUs de alto rendimiento, junto con un ecosistema de software abierto como oneAPI, permite impulsar la portabilidad y optimización de aplicaciones en distintas arquitecturas de hardware".

Ese enfoque, además de reforzar el ecosistema de HPC e IA, garantiza que más investigadores tengan acceso a herramientas de vanguardia.

"Esto no solo fortalece el ecosistema de HPC e IA, sino que amplía el acceso de la comunidad científica a herramientas y recursos de vanguardia".
De la WorkStation al Exaflop: Desentrañando las arquitecturas que definen el futuro digital
La computación avanza de la workstation a la exaescala, uniendo data centers, HPC y nube para ciencia, IA y sostenibilidad energética.

Transferencia tecnológica hacia la industria

Las lecciones aprendidas con Aurora también apuntan a entornos comerciales e industriales, donde arquitecturas heterogéneas pueden aplicarse a centros de datos empresariales y proyectos de gran escala.

"El trabajo con Aurora abre la puerta a la transferencia tecnológica hacia entornos comerciales e industriales".

Su diseño permite aprovechar la misma combinación de procesadores y aceleradores en escenarios corporativos de gran demanda.

"La arquitectura que combina CPUs, GPUs y software optimizado puede implementarse en centros de datos empresariales para ejecutar cargas complejas, optimizar procesos y analizar grandes volúmenes de datos en tiempos récord".
Case Study: Argonne National Laboratory’s Aurora Exascale System Will Enable New Science, Engineering
When delivered, Argonne National Laboratory’s Aurora will be the nation’s first Exascale HPC system built on Intel® Architecture. With HPE and Intel, plus the support of the U.S Department of Energy (DOE), Aurora’s performance is expected to exceed 2 exaFLOPS of double precision performance. With its extreme scale and performance levels, Aurora will offer the scientific community the compute power needed for the most advanced research in fields like biochemistry, engineering, astrophysics, energy, healthcare and more. The Aurora supercomputer will be the United States’ first exascale system to integrate Intel’s forthcoming HPC and AI hardware and software innovations including: Future generation Intel Xeon Scalable processors, Future Intel Xe architecture-based GPUs, > 230 Petabytes of storage based on Distributed Asynchronous Object Storage (DAOS) technology supported on Intel Optane Persistent Memory, bandwidth >25TB/S, and oneAPI unified programming model designed to simplify development across diverse CP

La experiencia adquirida también abrió paso a iniciativas de mayor escala, orientadas a la creación de modelos avanzados de inteligencia artificial.

"Iniciativas como el Consorcio de Trillones de Parámetros y proyectos como AuroraGPT son un ejemplo del potencial de estas capacidades".

Estos desarrollos muestran cómo la convergencia de HPC e inteligencia artificial trasciende el ámbito científico y se abre paso en sectores productivos.

"Para sectores como la manufactura, la energía, la salud y las finanzas. La convergencia entre HPC e IA está demostrando que es posible abordar problemas específicos de alto impacto de manera más rápida y precisa".
ANL, Intel, HPE Mark Technical Collaboration Behind Aurora
Aurora provides simulation, AI and data analysis capabilities to accelerate discoveries in cancer research, fusion energy and other fields.

Hoja de ruta tecnológica y arquitecturas futuras

Aunque Aurora fue un proyecto independiente, sus aprendizajes siguen influyendo en el desarrollo de GPUs y arquitecturas convergentes dentro de la hoja de ruta de Intel.

"Si bien la supercomputadora Aurora utiliza CPUs y GPUs de Intel, Falcon Shores no estuvo vinculado al programa Aurora, sino que formaba parte de la hoja de ruta más amplia de Intel para GPUs destinadas a HPC e IA".
Hoja de ruta de Intel en 2024 para 2024 se vislumbraba el Falcon Shores XPU | Créditos Intel | Vía: Toms Hardware

La decisión de no continuar con Falcon Shores no invalidó los conocimientos adquiridos, que aún orientan el perfeccionamiento de nuevas generaciones de procesadores gráficos.

"Aunque Intel decidió no continuar con Falcon Shores, los aprendizajes obtenidos de la implementación de Aurora continúan guiando el desarrollo y la optimización de nuestras GPUs actuales".
De circuitos a escala el camino de Intel hacia la exaescala
Con la inauguración oficial del superordenador Aurora, tres integrantes del equipo de Intel reflexionan sobre el alcance único y los desafíos del proyecto.

AuroraGPT y la integración de IA científica

El desarrollo de AuroraGPT, en el marco del Consorcio de Trillones de Parámetros, posiciona a Intel como un actor clave en la convergencia entre inteligencia artificial y computación de alto rendimiento.

Aurora GPT: conoce el chatbot con 1 billón de parámetros científicos
Infórmate acerca del proyecto Aurora GPT, la IA cuya fase de desarrollo incluye 1 billón de parámetros enfocados en ciencia y tecnología

El desarrollo de AuroraGPT, en el marco del Consorcio de Trillones de Parámetros, posiciona a Intel como un actor clave en la convergencia entre inteligencia artificial y computación de alto rendimiento.

"AuroraGPT, desarrollado en el marco del Consorcio de Trillones de Parámetros, representa un avance clave en la integración de inteligencia artificial y computación de alto rendimiento".

Su escala permite aprovechar toda la capacidad de Aurora en áreas científicas donde los datos masivos y las simulaciones complejas son críticos.

"Este modelo de IA a gran escala aprovecha la capacidad de Aurora para abordar problemas científicos complejos, como simulaciones avanzadas y análisis de grandes volúmenes de datos".
Intel Aurora es el superordenador que puede con 1 billon de parámetros LLM de IA gracias a la arquitectura de su GPU Intel Max
En respuesta a las pruebas realizadas por NVIDIA, donde batieron 6 records en el test de referencia para IA MLPerf, Intel ha compartido los datos de rendimiento de su proyecto Aurora compuesto por las GPU Intel Data Center GPU Max Series, los aceleradores Intel Gaudi2 y procesadores Intel Xeon

Gracias a este nivel de procesamiento, se habilitan líneas de investigación que requieren modelamiento y predicción a gran escala.

"Lo que abre nuevas posibilidades en áreas como la investigación médica, el cambio climático y el diseño de materiales".

A partir de estos avances, la cooperación entre instituciones se vuelve determinante para escalar resultados y compartir capacidades.

"La colaboración con laboratorios nacionales y otras instituciones posiciona a Intel como un facilitador de innovación en la IA científica".

Este tipo de alianzas consolida un ecosistema donde los avances tecnológicos se transfieren como estándares y buenas prácticas para la industria.

"Al integrar tecnologías como la arquitectura Intel Xe y herramientas como Intel® oneAPI, este proyecto no solo impulsa el desarrollo de modelos más avanzados, sino que también establece un estándar para la convergencia entre HPC e IA".

La estandarización obtenida con esa convergencia establece una referencia técnica exigente para la siguiente generación de proyectos.

"Este enfoque estratégico refuerza el papel de Intel en la creación de soluciones tecnológicas que abordan desafíos globales".

De esta manera, AuroraGPT se integra como un pilar para sostener infraestructuras de inteligencia artificial a gran escala con impacto directo en ciencia y tecnología.

"Consolidando su posición en el desarrollo de infraestructuras para la IA a gran escala y su impacto en la ciencia y la tecnología".

Aurora es, al mismo tiempo, un logro técnico y una apuesta institucional que confirma el papel de Intel en la era exaescala. Más allá de la magnitud de su capacidad de cómputo, el proyecto refleja la importancia de la cooperación entre industria, laboratorios y gobiernos para impulsar la innovación en beneficio de la ciencia y la sociedad.