6 min
Internet

ChatGPT 5.4: la nueva función que permite controlar un computador y automatizar tareas en la web

ChatGPT 5.4 introduce control nativo del computador, búsqueda dinámica de herramientas y una ventana de contexto de 1 millón de tokens.

08/03/2026 6 min read

La evolución de los modelos de inteligencia artificial está entrando en una nueva etapa. Ya no se trata solo de responder preguntas o generar texto: ahora los sistemas también pueden interactuar directamente con software y sitios web para completar tareas reales.

Con ChatGPT 5.4, OpenAI introdujo varias mejoras importantes que apuntan exactamente en esa dirección. Entre las más destacadas están el control nativo del computador, una nueva función de búsqueda de herramientas (tool search) y una enorme ventana de contexto de hasta 1 millón de tokens, lo que permite manejar tareas mucho más complejas que antes.

Estas capacidades acercan a la IA a algo más parecido a un asistente digital que puede ejecutar acciones reales en el sistema, como navegar páginas web, completar formularios o interactuar con aplicaciones.

Qué es ChatGPT 5.4 y por qué es importante

ChatGPT 5.4 es una nueva versión del modelo de OpenAI diseñada para manejar tareas más complejas en entornos profesionales y técnicos. El modelo combina capacidades avanzadas de razonamiento con herramientas para automatizar flujos de trabajo y resolver problemas complejos.

Entre sus mejoras más importantes destacan:

✔ control nativo del computador
✔ búsqueda dinámica de herramientas
✔ ventana de contexto de hasta 1 millón de tokens
✔ mayor eficiencia en uso de recursos
✔ mejoras en programación y análisis técnico

Estas características permiten que el modelo no solo genere información, sino que pueda ejecutar pasos concretos para completar una tarea.

Control nativo del computador: el cambio más grande

La novedad más importante de ChatGPT 5.4 es su capacidad de controlar directamente un computador o software, algo que antes requería herramientas externas o agentes adicionales.

Esto significa que el modelo puede:

  • mover el mouse
  • presionar teclas del teclado
  • navegar interfaces de software
  • interactuar con páginas web

En muchos casos, la IA puede analizar capturas de pantalla o interfaces gráficas y decidir qué acción realizar.

Este tipo de capacidad abre la puerta a automatizar tareas digitales completas, algo que antes solo podían hacer scripts o software especializado.

Automatización de tareas en la web

Gracias al control del computador, ChatGPT 5.4 puede realizar acciones en navegadores web y aplicaciones.

Por ejemplo, puede ayudar a automatizar tareas como:

✔ completar formularios en línea
✔ buscar información en varios sitios web
✔ descargar archivos o datos
✔ navegar paneles administrativos
✔ realizar tareas repetitivas en plataformas web

Esto es especialmente útil para desarrolladores, analistas o empresas que necesitan automatizar flujos de trabajo digitales.

En pruebas de navegación web y control de interfaces, el modelo logra tasas de éxito muy altas al interactuar con entornos reales de software

La nueva función Tool Search

Otra mejora importante es la función llamada tool search o búsqueda dinámica de herramientas.

En versiones anteriores, el modelo tenía que cargar todas las herramientas disponibles dentro del contexto de la conversación, lo que podía consumir muchos recursos.

Con ChatGPT 5.4 el proceso cambia:

  • el modelo recibe una lista simple de herramientas
  • cuando necesita una específica, la busca dinámicamente
  • solo carga la información necesaria

Este sistema reduce el consumo de tokens y hace que el modelo sea más eficiente en tareas complejas.

En pruebas internas, este enfoque redujo el uso de tokens en casi un 47%, lo que puede traducirse en menores costos y respuestas más rápidas.

Ventana de contexto de 1 millón de tokens

Otra característica impresionante de ChatGPT 5.4 es su enorme ventana de contexto.

La ventana de contexto es la cantidad de información que el modelo puede recordar o analizar dentro de una conversación o tarea.

En este caso, el modelo puede manejar hasta:

1 millón de tokens de contexto

Esto permite trabajar con:

  • documentos muy largos
  • grandes bases de datos
  • análisis complejos de información

Por ejemplo, el modelo podría analizar un contrato completo, un informe técnico largo o incluso un proyecto de código grande sin perder contexto.

Mejor rendimiento en programación y tareas técnicas

ChatGPT 5.4 también mejora en áreas técnicas como programación, análisis de datos y resolución de problemas.

Entre sus puntos fuertes están:

✔ debugging de código
✔ automatización de flujos de trabajo
✔ generación de scripts
✔ análisis de grandes datasets

El modelo combina capacidades de razonamiento con habilidades de programación avanzadas, lo que lo hace especialmente útil para desarrolladores y profesionales técnicos.

Modo rápido para tareas urgentes

El modelo también incluye un Fast Mode, que acelera la generación de respuestas cuando se necesita velocidad.

Este modo permite:

  • generar resultados más rápido
  • procesar tareas urgentes
  • reducir tiempos de respuesta

Sin embargo, el modo rápido puede consumir más recursos, por lo que se utiliza principalmente en situaciones donde la velocidad es prioritaria.

Limitaciones actuales

Aunque ChatGPT 5.4 introduce avances importantes, todavía existen algunas limitaciones.

Generación más lenta en tareas complejas

Debido a su mayor capacidad de razonamiento, el modelo puede generar tokens más lentamente en ciertos casos.

Costos más altos

Las funciones avanzadas y la gran ventana de contexto pueden aumentar el costo para usuarios que ejecutan tareas muy grandes.

Creatividad en diseño

En algunas pruebas, el modelo puede rendir menos en tareas creativas subjetivas como diseño de interfaces o UI.

Qué cambia respecto a versiones anteriores

Comparado con modelos anteriores, ChatGPT 5.4 representa un salto importante en tres áreas principales:

MejoraImpacto
Control del computadorAutomatización real de tareas
Tool SearchUso más eficiente de herramientas
Contexto 1M tokensAnálisis de información masiva

Estas mejoras acercan el modelo a lo que muchos consideran agentes de IA verdaderamente autónomos.

Qué significa esto para el futuro de la IA

La capacidad de controlar software directamente marca un cambio importante en la evolución de la inteligencia artificial.

En lugar de ser solo un chatbot, sistemas como ChatGPT 5.4 pueden convertirse en agentes digitales capaces de ejecutar tareas completas, como:

  • automatizar procesos de trabajo
  • gestionar información
  • interactuar con aplicaciones

Esto podría transformar áreas como desarrollo de software, análisis de datos, administración digital e incluso productividad diaria.

Conclusión

ChatGPT 5.4 representa una de las evoluciones más importantes de los modelos de inteligencia artificial recientes. Gracias a funciones como el control nativo del computador, la búsqueda dinámica de herramientas y una enorme ventana de contexto, el modelo puede manejar tareas mucho más complejas que versiones anteriores.

Aunque todavía tiene algunas limitaciones, estas capacidades acercan a la IA a un nuevo tipo de asistente digital capaz no solo de responder preguntas, sino también de interactuar con software y ejecutar tareas reales en la web y en el computador.