NVIDIA y AWS mejoraron y ampliaron su trabajo conjunto con nuevas capacidades para ejecutar cargas de IA en producción. El anuncio cubre instancias Amazon EC2 G7 con GPU Blackwell, búsqueda vectorial acelerada en Amazon OpenSearch Serverless y validación de rendimiento para entrenamiento con NVIDIA GB300.

Amazon EC2 G7 suma GPU NVIDIA Blackwell
Las nuevas instancias Amazon EC2 G7 incorporan GPU NVIDIA RTX PRO 4500 Blackwell Server Edition. Están orientadas a inferencia de IA, gráficos, video, computación espacial y analítica de datos acelerada por GPU.
Según NVIDIA, G7 ofrece hasta 4,6 veces más rendimiento en inferencia de IA y hasta 2,1 veces más rendimiento gráfico frente a G6. La plataforma considera configuraciones de hasta ocho GPU, 256 GB de memoria GPU total, redes EFA de hasta 700 Gbps y hasta 7,6 TB de almacenamiento local NVMe.
La disponibilidad considera AWS Deep Learning AMIs, Deep Learning Containers, Amazon EMR, Amazon EKS, Amazon ECS y AMIs gráficas. El soporte para Amazon SageMaker AI está previsto próximamente.

OpenSearch Serverless acelera la búsqueda vectorial
Amazon OpenSearch Serverless usará indexación vectorial acelerada por GPU con NVIDIA cuVS como opción predeterminada para colecciones vectoriales. El foco está en cargas de generación aumentada por recuperación, búsqueda semántica, recomendaciones e IA agéntica.
NVIDIA plantea que esta integración permite indexación vectorial hasta 10 veces más rápida y a un cuarto del costo frente a construcciones basadas solo en CPU. En bases vectoriales de gran escala, el objetivo es reducir el tiempo de preparación de datos para aplicaciones de IA que dependen de recuperación rápida de contexto.

AWS obtiene validación NVIDIA Exemplar Cloud para GB300
AWS alcanzó el estado NVIDIA Exemplar Cloud para cargas de entrenamiento sobre NVIDIA GB300. Esa validación indica que la nube de AWS cumple los umbrales de rendimiento usados por NVIDIA para comparar cargas de IA frente a su arquitectura de referencia.
Para empresas que evalúan IA en producción, el anuncio apunta a tres capas críticas de la infraestructura. G7 cubre cómputo, cuVS mejora recuperación de información y GB300 entrega una referencia para entrenamiento de modelos a gran escala.


