NVIDIA y AWS llevan infraestructura de IA a producción a un nuevo nivel
AWS suma GPU Blackwell y búsqueda vectorial para IA productiva. | Créditos: NVIDIA

NVIDIA y AWS llevan infraestructura de IA a producción a un nuevo nivel

NVIDIA y AWS mejoraron y ampliaron su trabajo conjunto con nuevas capacidades para ejecutar cargas de IA en producción. El anuncio cubre instancias Amazon EC2 G7 con GPU Blackwell, búsqueda vectorial acelerada en Amazon OpenSearch Serverless y validación de rendimiento para entrenamiento con NVIDIA GB300.

NVIDIA y HPE amplían AI Factory para agentes de IA
La ampliación de AI Factory suma CPU Vera, agentes, seguridad confidencial y redes NVIDIA para despliegues empresariales privados

Amazon EC2 G7 suma GPU NVIDIA Blackwell

Las nuevas instancias Amazon EC2 G7 incorporan GPU NVIDIA RTX PRO 4500 Blackwell Server Edition. Están orientadas a inferencia de IA, gráficos, video, computación espacial y analítica de datos acelerada por GPU.

Según NVIDIA, G7 ofrece hasta 4,6 veces más rendimiento en inferencia de IA y hasta 2,1 veces más rendimiento gráfico frente a G6. La plataforma considera configuraciones de hasta ocho GPU, 256 GB de memoria GPU total, redes EFA de hasta 700 Gbps y hasta 7,6 TB de almacenamiento local NVMe.

La disponibilidad considera AWS Deep Learning AMIs, Deep Learning Containers, Amazon EMR, Amazon EKS, Amazon ECS y AMIs gráficas. El soporte para Amazon SageMaker AI está previsto próximamente.

La carrera por la infraestructura de IA llega con fuerza a Latinoamérica con data centers a escala de Gigavatios
El crecimiento acelerado de la inteligencia artificial está impulsando una nueva generación de infraestructura digital a escala global.

OpenSearch Serverless acelera la búsqueda vectorial

Amazon OpenSearch Serverless usará indexación vectorial acelerada por GPU con NVIDIA cuVS como opción predeterminada para colecciones vectoriales. El foco está en cargas de generación aumentada por recuperación, búsqueda semántica, recomendaciones e IA agéntica.

NVIDIA plantea que esta integración permite indexación vectorial hasta 10 veces más rápida y a un cuarto del costo frente a construcciones basadas solo en CPU. En bases vectoriales de gran escala, el objetivo es reducir el tiempo de preparación de datos para aplicaciones de IA que dependen de recuperación rápida de contexto.

NAVER ampliará infraestructura de IA con NVIDIA DSX en Corea
GAK Sejong será la base inicial para fábricas de IA soberana, con 55 MW de partida y una ruta de expansión hacia escala gigawatt para Corea y empresas

AWS obtiene validación NVIDIA Exemplar Cloud para GB300

AWS alcanzó el estado NVIDIA Exemplar Cloud para cargas de entrenamiento sobre NVIDIA GB300. Esa validación indica que la nube de AWS cumple los umbrales de rendimiento usados por NVIDIA para comparar cargas de IA frente a su arquitectura de referencia.

Para empresas que evalúan IA en producción, el anuncio apunta a tres capas críticas de la infraestructura. G7 cubre cómputo, cuVS mejora recuperación de información y GB300 entrega una referencia para entrenamiento de modelos a gran escala.