OpenAI y Broadcom presentan Jalapeño, un chip de inferencia para LLM

Admin 25 de jun. de 2026 Lectura de 4 minutos

OpenAI y Broadcom presentaron Jalapeño, el primer Intelligence Processor de OpenAI y un acelerador diseñado para la inferencia de grandes modelos de lenguaje. OpenAI lo vincula con la infraestructura que sostiene ChatGPT, Codex, la API y futuros productos basados en agentes, dentro de una plataforma de cómputo pensada para crecer durante varias generaciones.

Un chip diseñado alrededor de la inferencia

Jalapeño fue diseñado desde cero para inferencia de LLM y no como una adaptación de aceleradores generales. OpenAI indicó que su arquitectura considera kernels, movimiento de memoria, redes, sistemas de servicio y necesidades de producto, con el objetivo de acercar el uso real del hardware a sus límites teóricos.

La inferencia es la etapa en que el modelo genera respuestas, ejecuta tareas o atiende solicitudes mediante una API. En servicios de alta demanda, la relación entre latencia, consumo eléctrico y disponibilidad determina cuánto puede escalar una plataforma sin deteriorar la experiencia.

Greg Brockman, presidente y cofundador de OpenAI, situó Jalapeño dentro de una estrategia de infraestructura de pila completa. El foco de su explicación estuvo en aumentar la disponibilidad de cómputo y reducir barreras técnicas y económicas para usar IA avanzada.

“El mundo se está moviendo hacia una economía sustentada por el cómputo. Jalapeño forma parte de nuestra estrategia de infraestructura de pila completa a largo plazo para hacer que el cómputo sea más abundante, lo que da como resultado una IA más rápida, más confiable, más asequible para personas y empresas, y que puede usarse para resolver problemas más importantes. Al diseñar una mayor parte de la pila nosotros mismos, podemos servir más inteligencia con mayor eficiencia y seguir llevando la IA avanzada hacia un acceso más amplio”.

La arquitectura busca reducir movimiento de datos

OpenAI indicó que las muestras de ingeniería del chip ya ejecutan cargas de aprendizaje automático en laboratorio, con frecuencia y consumo objetivo de producción, incluido GPT-5.3-Codex-Spark.

La empresa aún mide el rendimiento final, pero sus pruebas iniciales muestran una mejora sustancial de rendimiento por vatio frente al estado del arte actual. La arquitectura reduce movimiento de datos y equilibra cómputo, memoria y redes, una combinación crítica cuando el rendimiento real importa tanto como la capacidad teórica.

Richard Ho, responsable del programa de hardware de OpenAI, explicó el vínculo entre investigación y diseño de chip. Su intervención concentra el punto técnico del proyecto, porque conecta inferencia de frontera con memoria, redes y patrones reales de servicio.

“Jalapeño fue diseñado desde cero para la inferencia de LLM usando conocimientos detallados de nuestra estrecha colaboración con investigadores de OpenAI. Optimizamos la arquitectura en torno a los kernels, el movimiento de memoria, las redes y los patrones de servicio que más importan para los modelos de IA de frontera. Según las pruebas iniciales, Jalapeño ejecutará eficientemente nuestras cargas de trabajo más importantes cerca de los límites teóricos del hardware”.

Desarrollo acelerado y plataforma con socios

OpenAI y Broadcom llevaron Jalapeño desde el diseño inicial hasta el cierre para fabricación en nueve meses. OpenAI afirmó que el programa de acelerador personalizado representa, en su evaluación, el ciclo de desarrollo de ASIC avanzado de alto rendimiento más rápido conseguido hasta ahora.

Broadcom aporta implementación de silicio y tecnologías de red, incluida la familia Tomahawk. Celestica participa en placa, rack e integración de sistemas, una capa necesaria para pasar del chip a una plataforma de producción a gran escala.

El CEO de Broadcom, señaló que el proyecto con la infraestructura física que requerirá la IA durante la próxima década. Su intervención sitúa Jalapeño como una hoja de ruta, no como un componente aislado de primera generación.

“Nuestra colaboración con OpenAI representa un compromiso fundamental con escalar la infraestructura física requerida para la próxima década de la IA. Este es solo el comienzo de una hoja de ruta multigeneracional. Al codesarrollar nuestro silicio líder en la industria directamente con OpenAI, estamos habilitando el despliegue de data centers a escala de gigavatios con Microsoft y otros socios a partir de 2026”.