AMD habilita el entrenamiento del modelo ZAYA1 de Zyphra utilizando infraestructura MI300X
AMD Instinct MI300X | Fotografía Créditos: AMD

AMD habilita el entrenamiento del modelo ZAYA1 de Zyphra utilizando infraestructura MI300X

AMD informó que Zyphra alcanzó un hito significativo en el entrenamiento de modelos de gran escala mediante el desarrollo de ZAYA1, el primer modelo Mixture-of-Experts entrenado de manera íntegra con la plataforma de GPU y red de AMD. La iniciativa integra las capacidades de AMD Instinct MI300X, tecnología Pensando y el software abierto ROCm.

AMD redefine el cómputo de alto rendimiento con la GPU Instinct MI430X y la arquitectura CDNA de próxima generación
AMD presenta Instinct MI430X con 432 GB HBM4: potencia inédita para liderar la convergencia global entre IA masiva y supercomputación científica.

¿Cuál es el impacto del entrenamiento de ZAYA1 con la plataforma de AMD?

Zyphra reportó que su modelo entrega un rendimiento competitivo o superior frente a modelos abiertos en razonamiento, matemáticas y codificación, demostrando la eficiencia de AMD Instinct MI300X en cargas de trabajo de IA a escala productiva. La memoria del GPU permitió simplificar procesos y acelerar tiempos de guardado.

Emad Barsoum, vicepresidente corporativo de IA e ingeniería en AMD, destacó que la capacidad de cómputo acelerado de la compañía permite que organizaciones como Zyphra desarrollen modelos complejos, respaldando iniciativas que amplían las posibilidades de la inteligencia artificial en entornos exigentes.

“El liderazgo de AMD en cómputo acelerado está impulsando a innovadores como Zyphra a superar los límites de lo posible en inteligencia artificial. Este hito demuestra la potencia y flexibilidad de las GPU AMD Instinct y la red Pensando para entrenar modelos complejos y de gran escala”.
AMD, Cisco y HUMAIN crean una empresa conjunta para expandir infraestructura de IA a escala global
La alianza proyecta hasta 1 GW de infraestructura de IA al 2030 con un despliegue inicial de 100 MW en Arabia Saudita.

Zyphra también reforzó su enfoque en eficiencia, señalando que este principio orienta el diseño de arquitecturas, el desarrollo de algoritmos de entrenamiento e inferencia y la selección de hardware que ofrece la mejor relación precio-rendimiento para sus clientes.

“La eficiencia siempre ha sido un principio rector fundamental en Zyphra. Determina cómo diseñamos arquitecturas de modelos, desarrollamos algoritmos para entrenamiento e inferencia y elegimos el hardware con la mejor relación precio-rendimiento para ofrecer inteligencia de frontera a nuestros clientes”.

Krithik Puthalath, CEO de Zyphra, añadió que ZAYA1 refleja esta filosofía y celebró que la compañía sea la primera en demostrar entrenamiento a gran escala totalmente sobre una plataforma AMD, subrayando la importancia del co-diseño entre modelos, silicio y sistemas.

“ZAYA1 refleja esta filosofía y estamos entusiasmados de ser la primera compañía en demostrar entrenamiento a gran escala en una plataforma AMD. Nuestros resultados destacan el poder de co-diseñar arquitecturas de modelos con el silicio y los sistemas, y estamos emocionados de profundizar nuestra colaboración con AMD e IBM mientras construimos la próxima generación de modelos fundamentales multimodales avanzados”.
AMD en supercomputación y IA: hardware y software para instalaciones de alto rendimiento
AMD lidera supercomputación e IA: equipa sistemas exascale, suministra Lux y Discovery y ofrece Enterprise AI Suite para investigación a escala. 2025.

La infraestructura creada por Zyphra en conjunto con AMD e IBM combina GPU AMD Instinct MI300X con la arquitectura de red y almacenamiento de IBM Cloud, proporcionando la base técnica del preentrenamiento de ZAYA1 y reforzando el trabajo previo entre las organizaciones.