NVIDIA define las fábricas de IA como infraestructura para producir tokens
NVIDIA presenta las fábricas de IA como un sistema que integra aplicaciones, modelos, infraestructura, chips y energía. | Créditos: NVIDIA.

NVIDIA define las fábricas de IA como infraestructura para producir tokens

NVIDIA publicó un análisis sobre las fábricas de IA, un tipo de infraestructura orientada a convertir energía en tokens mediante sistemas coordinados de cómputo, memoria, redes, almacenamiento, software, energía y refrigeración. El enfoque apunta a cargas de inferencia sostenida, agentes autónomos, IA física y robótica.

¿Qué es una AI Factory?
Las AI Factory son entornos operativos que convierten datos en modelos y modelos en decisiones automatizadas, con infraestructura acelerada y MLOps. .

La inferencia agéntica exige otra arquitectura

NVIDIA plantea que las métricas para centros de datos de IA ya no se limitan al rendimiento bruto. En una fábrica de IA, los indicadores relevantes incluyen tokens por segundo, tokens por watt, costo por token, utilización, tiempo operativo y capacidad de respuesta.

Los agentes autónomos no solo generan respuestas, sino que razonan, planifican, consultan herramientas, recuperan datos, escriben código y ejecutan acciones bajo una secuencia más larga de inferencia.

Ese comportamiento exige coordinación entre GPU, CPU, memoria, redes y software de orquestación. Según NVIDIA, la producción de tokens pasa a depender de la eficiencia del sistema completo, no de un componente aislado.

NVIDIA presenta las fábricas de IA como un sistema que integra aplicaciones, modelos, infraestructura, chips y energía. | Créditos: NVIDIA.

Blackwell Ultra, Dynamo y Vera Rubin aparecen en la ruta técnica

NVIDIA indica que Blackwell Ultra permite hasta 50 veces más throughput por megawatt y hasta 35 veces menor costo por token frente a Hopper. La compañía también menciona NVIDIA Dynamo como framework para orquestar inferencia de alto volumen y razonamiento de contexto largo.

La arquitectura Vera Rubin extiende esa línea con sistemas diseñados para elevar el rendimiento por watt hasta 35 veces con LPX. En ese esquema, la reducción del costo por token depende de la integración entre hardware, redes, memoria, software y operación.

Comparación de GB300 NVL72 frente a H200 NVL8 en tokens por watt y costo por token, con base en DeepSeek R1 0528. | Créditos: NVIDIA y SemiAnalysis InferenceX.

El modelo se proyecta hacia fábricas de IA empresariales

NVIDIA presenta las fábricas de IA como infraestructura para organizaciones que requieren inferencia continua y operación a escala. El ecosistema mencionado incluye socios como Cisco, Dell, HPE, Lenovo y Supermicro, además de software empresarial y modelos propietarios o abiertos.

Los diseños de referencia NVIDIA DSX están orientados a instalaciones de escala gigawatt. Ese trabajo se complementa con Omniverse DSX Blueprint, que permite modelar instalaciones, hardware, energía, refrigeración y operación mediante gemelos digitales antes y después del despliegue.

Personal técnico manipula hardware de NVIDIA en un entorno de centro de datos, dentro del enfoque de infraestructura para fábricas de IA. | Créditos: NVIDIA.

La compañía sitúa este modelo en centros de datos donde la unidad económica principal pasa a ser el token. Desde esa lógica, la fábrica de IA se define por su capacidad para producir inferencia útil con alta utilización, menor costo operativo y control sobre energía, refrigeración y disponibilidad.