GPT-5.4 apunta al trabajo profesional con foco en precisión, uso de herramientas y ejecución de flujos complejos

Admin 9 de mar. de 2026 Lectura de 5 minutos

OpenAI presentó GPT-5.4 en ChatGPT, la API y Codex como su modelo de vanguardia más capaz y eficiente para trabajo profesional. La compañía también lanzó GPT-5.4 Pro para tareas de mayor complejidad y sostuvo que esta versión reúne avances en razonamiento, programación y flujos de trabajo con agentes dentro de un mismo modelo.

OpenAI pone el foco en resultados aplicados a tareas profesionales

Según el documento, GPT-5.4 mejora el desempeño en hojas de cálculo, presentaciones y documentos, además de fortalecer el uso de herramientas y el trabajo dentro de entornos de software. OpenAI también afirma que el modelo entrega respuestas de mayor calidad con menos idas y vueltas y conserva mejor el contexto en consultas largas.

En trabajo profesional especializado, OpenAI indicó que GPT-5.4 igualó o superó a profesionales de la industria en 83,0% de las comparaciones dentro de GDPval, frente a 71,0% de GPT-5.2. En una evaluación interna de modelización en hojas de cálculo obtuvo 87,5%, mientras que GPT-5.2 alcanzó 68,4%.

La compañía añadió que, en un conjunto de prompts usados para evaluar presentaciones, los revisores humanos prefirieron las de GPT-5.4 en un 68,0% de los casos frente a las de GPT-5.2. También señaló que las afirmaciones individuales del modelo fueron 33% menos propensas a ser falsas y que sus respuestas completas fueron 18% menos propensas a contener algún error.

En ese contexto, Brendan Foody, CEO de Mercor, vinculó el desempeño del modelo con un mejor resultado en tareas de servicios profesionales. Su comentario apunta a la capacidad de GPT-5.4 para elaborar trabajos complejos con mayor rapidez y menor costo frente a otros modelos de referencia.

“GPT-5.4 es el mejor modelo que hemos probado. Ahora encabeza la tabla de clasificación en nuestra prueba de referencia APEX-Agents, que mide el rendimiento del modelo en tareas propias de servicios profesionales. Destaca en la elaboración de trabajos complejos, como presentaciones, modelos financieros y análisis jurídico, con un rendimiento superior y, al mismo tiempo, con mayor rapidez y menor coste que los modelos de vanguardia de la competencia”.

Ejemplo visual del foco de GPT-5.4 en hojas de cálculo para trabajo profesional. | Créditos: OpenAI

El modelo amplía sus capacidades para operar software y usar el ordenador

OpenAI describió a GPT-5.4 como su primer modelo de propósito general con capacidades nativas de uso del ordenador. Según el documento, esta base permite a los agentes operar aplicaciones, ejecutar flujos de trabajo complejos y desenvolverse en distintos entornos de software con un contexto de hasta un millón de tokens.

La compañía sostuvo que ese avance también se refleja en evaluaciones comparativas. En OSWorld-Verified, GPT-5.4 alcanzó 75,0% de éxito, por encima de GPT-5.2 con 47,3% y del rendimiento humano reportado en 72,4%. En WebArena-Verified logró 67,3%, mientras que en Online-Mind2Web llegó a 92,8% usando observaciones basadas en capturas de pantalla.

OpenAI añadió que la mejora visual también se trasladó a pruebas como MMMU-Pro y OmniDocBench. En la primera, GPT-5.4 obtuvo 81,2% sin herramientas, mientras que en OmniDocBench registró un error medio de 0.109 frente a 0.140 de GPT-5.2.

GPT-5.4 elevó su rendimiento en uso del ordenador y superó tanto a GPT-5.2 como al resultado humano reportado en OSWorld-Verified. | Créditos: OpenAI

La eficiencia con herramientas aparece como uno de los ejes del lanzamiento

OpenAI señaló que GPT-5.4 mejora la forma en que los modelos trabajan con herramientas externas. Según el texto, los agentes pueden operar en ecosistemas más amplios, elegir mejor las herramientas adecuadas y completar flujos de varios pasos con menor costo y latencia.

Dentro de esa estrategia, la empresa incorporó búsqueda de herramientas en la API. En vez de cargar desde el inicio todas las definiciones dentro del prompt, el modelo recibe una lista ligera y busca la definición cuando la necesita, lo que reduce tokens, conserva caché y acelera las solicitudes.

Para medir ese cambio, OpenAI evaluó 250 tareas con 36 servidores MCP habilitados en dos modalidades. El documento indica que la configuración con búsqueda de herramientas redujo el uso total de tokens en un 47% y mantuvo la misma precisión.

Disponibilidad, precios y alcance de la nueva versión

OpenAI informó que GPT-5.4 comenzó a desplegarse de forma gradual en ChatGPT y Codex, mientras que en la API ya está disponible como gpt-5.4. GPT-5.4 Thinking quedó habilitado para usuarios Plus, Team y Pro, y el acceso anticipado para Enterprise y Edu depende de la configuración de administración.

En precios de API, GPT-5.4 figura con un valor de entrada de 2,50 dólares por millón de tokens, entrada en caché de 0,25 dólares y salida de 15 dólares por millón. GPT-5.4 Pro aparece con 30 dólares por millón de tokens de entrada y 180 dólares por millón en salida.