En un momento de expansión decisiva para la inteligencia artificial y los sistemas autónomos en América Latina, presentamos un especial en seis entregas basado en una conversación con Marcio Aguiar, director de la División Enterprise de NVIDIA para América Latina.

Con más de 14 años en la compañía, Aguiar lidera la integración regional en LATAM de tecnologías como IA generativa, simulación industrial, gemelos digitales y visión por computadora en sectores clave.
Este especial, desarrollado en conjunto entre NVIDIA y Tabulado, recorre la nueva frontera de la robótica corporativa desde una perspectiva ejecutiva. Cada bloque temático aborda un aspecto específico del ecosistema de NVIDIA, desde las plataformas de hardware hasta las arquitecturas cognitivas que habilitan agentes autónomos capaces de razonar y actuar en entornos dinámicos.

Robots que razonan, ven y actúan: así construye NVIDIA su arquitectura de inteligencia encarnada
La primera entrega se enfoca en la evolución estratégica de NVIDIA, que pasó de la IA perceptiva hacia la IA física y agéntica. Aquí se explora cómo la compañía construyó las AI Factories, centros operativos donde convergen simulación, entrenamiento y despliegue continuo de modelos de inteligencia artificial en sistemas físicos, así lo comenta el vocero de NVIDIA:
“La IA agentica va más allá de la percepción y la acción, incorporando capacidades de razonamiento, planificación y toma de decisiones autónoma”.

La segunda parte detalla las plataformas de hardware que sostienen la infraestructura de IA de próxima generación. Desde el cómputo en el borde con Jetson y Thor, hasta el entrenamiento masivo de modelos fundacionales en DGX SuperPOD, NVIDIA ofrece soluciones que escalan desde dispositivos autónomos hasta supercomputación empresarial.
“Jetson permite llevar la inteligencia artificial directamente al lugar donde se generan los datos, reduciendo la latencia y el consumo de ancho de banda, mientras DGX SuperPOD ofrece capacidades de supercomputación para entrenar modelos con billones de parámetros”.

En el tercer conversatorio se analizan las herramientas de software y desarrollo que hacen posible la robótica cognitiva. Isaac ROS, NeMo, Riva y Metropolis forman un ecosistema que integra lenguaje natural, visión computacional, inferencia optimizada y simulación para entrenar sistemas autónomos con capacidades multimodales.
“NeMo y Riva permiten que los robots comprendan y se comuniquen en lenguaje natural al proporcionar capacidades avanzadas de procesamiento de lenguaje y síntesis de voz”.
El cuarto capítulo se centra en los modelos fundacionales para robótica que están definiendo el estándar global. GR00T N1, Cosmos, Nemotron y Hymba representan avances decisivos en razonamiento autónomo, planificación adaptativa y cognición multimodal, con aplicaciones que van desde la manufactura hasta la interacción humano-robot.
“GR00T N1 permite a los robots realizar tareas como agarrar y mover objetos con una o ambas manos, transferir artículos entre manos y ejecutar acciones que requieren una comprensión contextual prolongada”.


La quinta entrega aborda la simulación como eje del entrenamiento moderno. Plataformas como Isaac Sim y Omniverse permiten crear entornos virtuales de alta fidelidad donde los robots aprenden tareas complejas mediante refuerzo y aprendizaje por imitación, reduciendo riesgos y acelerando la validación antes del despliegue físico.
“El enfoque sim-to-real permite entrenar y validar modelos de IA en simuladores realistas antes de implementarlos en robots físicos, lo que ofrece ventajas como la reducción de costos y riesgos, entrenamiento acelerado y validación segura de escenarios complejos”.

Finalmente, el especial culmina con una mirada a las capacidades emergentes de cognición avanzada. Modelos basados en arquitectura de sistema dual, aprendizaje auto-supervisado y planificación jerárquica están dotando a los robots de una comprensión contextual profunda y de habilidades para ejecutar tareas multi-etapa en entornos no estructurados.
“La integración de modelos de lenguaje y visión dota a los robots de una comprensión más rica y contextual de las tareas que deben realizar, facilitando el razonamiento y la adaptación en situaciones imprevistas”.