NVIDIA publicó un análisis sobre las fábricas de IA, un tipo de infraestructura orientada a convertir energía en tokens mediante sistemas coordinados de cómputo, memoria, redes, almacenamiento, software, energía y refrigeración. El enfoque apunta a cargas de inferencia sostenida, agentes autónomos, IA física y robótica.

La inferencia agéntica exige otra arquitectura
NVIDIA plantea que las métricas para centros de datos de IA ya no se limitan al rendimiento bruto. En una fábrica de IA, los indicadores relevantes incluyen tokens por segundo, tokens por watt, costo por token, utilización, tiempo operativo y capacidad de respuesta.
Los agentes autónomos no solo generan respuestas, sino que razonan, planifican, consultan herramientas, recuperan datos, escriben código y ejecutan acciones bajo una secuencia más larga de inferencia.
Ese comportamiento exige coordinación entre GPU, CPU, memoria, redes y software de orquestación. Según NVIDIA, la producción de tokens pasa a depender de la eficiencia del sistema completo, no de un componente aislado.

Blackwell Ultra, Dynamo y Vera Rubin aparecen en la ruta técnica
NVIDIA indica que Blackwell Ultra permite hasta 50 veces más throughput por megawatt y hasta 35 veces menor costo por token frente a Hopper. La compañía también menciona NVIDIA Dynamo como framework para orquestar inferencia de alto volumen y razonamiento de contexto largo.
La arquitectura Vera Rubin extiende esa línea con sistemas diseñados para elevar el rendimiento por watt hasta 35 veces con LPX. En ese esquema, la reducción del costo por token depende de la integración entre hardware, redes, memoria, software y operación.

El modelo se proyecta hacia fábricas de IA empresariales
NVIDIA presenta las fábricas de IA como infraestructura para organizaciones que requieren inferencia continua y operación a escala. El ecosistema mencionado incluye socios como Cisco, Dell, HPE, Lenovo y Supermicro, además de software empresarial y modelos propietarios o abiertos.
Los diseños de referencia NVIDIA DSX están orientados a instalaciones de escala gigawatt. Ese trabajo se complementa con Omniverse DSX Blueprint, que permite modelar instalaciones, hardware, energía, refrigeración y operación mediante gemelos digitales antes y después del despliegue.

La compañía sitúa este modelo en centros de datos donde la unidad económica principal pasa a ser el token. Desde esa lógica, la fábrica de IA se define por su capacidad para producir inferencia útil con alta utilización, menor costo operativo y control sobre energía, refrigeración y disponibilidad.
