OpenAI lanzó el jueves un nuevo agente de inteligencia artificial (AI, por sus siglas en inglés) de propósito general en ChatGPT, marcando un hito significativo en la evolución de las herramientas de AI.
Según la compañía, este agente está diseñado para ejecutar una amplia variedad de tareas informáticas en nombre de los usuarios. Entre sus capacidades, destaca que el agente puede navegar automáticamente por el calendario del usuario, generar presentaciones y diapositivas editables, y ejecutar código, lo que promete una mayor automatización de procesos para empresas.
La herramienta, denominada Agente ChatGPT, integra diversas funciones de las herramientas de agente previas de OpenAI y combina la capacidad de navegación web de su operador con la habilidad de deep research para sintetizar información de múltiples sitios web en informes de investigación concisos.
La startup aseguró en una publicación de blog que la interacción con el agente será fluida, requiriendo únicamente instrucciones en lenguaje natural a través de ChatGPT.
El Agente ChatGPT disponible para los suscriptores de los planes Pro, Plus y Team de OpenAI. Para activar esta potente herramienta, los usuarios simplemente deben seleccionar “modo agente” en el menú desplegable de herramientas de ChatGPT.
Índice de temas
Un ambicioso Intento de OpenAI por Potenciar la Capacidad de Acción de ChatGPT
El lanzamiento del Agente ChatGPT representa el esfuerzo más audaz de OpenAI hasta la fecha para transformar ChatGPT en un producto con capacidad de acción, permitiendo la delegación de tareas en lugar de solo responder preguntas.
En los últimos años, destacadas empresas de Silicon Valley como OpenAI, Google y Perplexity han presentado múltiples agentes de AI con promesas similares. No obstante, las versiones iniciales de estos agentes de AI han enfrentado desafíos con tareas complejas, lo que ha mermado su atractivo comercial frente a la visión de AI autónoma que los ejecutivos tecnológicos suelen proyectar.
A pesar de estos antecedentes, OpenAI sostiene que el Agente ChatGPT es considerablemente más capaz que sus ofertas previas. Este nuevo agente tiene acceso a los conectores de ChatGPT, lo que permite a los usuarios vincular aplicaciones como Gmail y GitHub.
Esta conectividad dota al agente de la capacidad de encontrar información relevante para las indicaciones del usuario. Además, OpenAI ha confirmado que el Agente ChatGPT tiene acceso a una terminal y puede utilizar API para interactuar con diversas aplicaciones, ampliando su funcionalidad empresarial
Casos de Uso Avanzados y Rendimiento de Vanguardia
OpenAI sugiere que el Agente ChatGPT puede ser utilizado para tareas tan diversas como “planificar y comprar ingredientes para preparar un desayuno japonés para cuatro” o “analizar a tres competidores y crear una presentación”.
Estas capacidades requieren que el Agente ChatGPT analice sitios web, desarrolle un plan de acción y utilice herramientas, lo que representa un nivel de complejidad superior al de los agentes anteriores de OpenAI.
El modelo subyacente al Agente ChatGPT ha demostrado un rendimiento de vanguardia en diversos benchmarks, según datos de OpenAI. La compañía afirma que el modelo del Agente ChatGPT obtuvo una puntuación del 41.6% en el Último Examen de la Humanidad (aprobado en 1), una prueba exigente con miles de preguntas en más de cien temas. Esta puntuación duplica aproximadamente los resultados obtenidos por los modelos o3 y o4-mini de OpenAI en la misma prueba. En FrontierMath, uno de los benchmarks matemáticos más desafiantes, OpenAI asegura que el Agente ChatGPT alcanzó un 27.4% con acceso a herramientas como una terminal para la ejecución de código. El récord anterior en este benchmark lo ostentaba o4-mini, con solo un 6.3%.
Enfoque Riguroso en la Seguridad de la AI
OpenAI ha desarrollado el Agente ChatGPT con una firme atención a la seguridad, principalmente porque las nuevas capacidades del producto podrían, hipotéticamente, ser explotadas por actores maliciosos. OpenAI ya había alertado previamente sobre el potencial peligro que podrían representar los modelos agénticos.
En un informe de seguridad del Agente ChatGPT, OpenAI clasificó el modelo como de “alta capacidad” en el ámbito de las armas biológicas y químicas. Esta designación, según el Marco de Preparación de OpenAI, se aplica a modelos con la capacidad de “amplificar las vías existentes hacia daños graves”. Aunque OpenAI no ha encontrado evidencia directa de tal riesgo, ha adoptado un enfoque preventivo, implementando nuevas medidas de seguridad para mitigar estos peligros.
Las nuevas medidas de seguridad para el Agente ChatGPT incluyen un monitor en tiempo real que opera mientras los usuarios interactúan con el producto. OpenAI explicó que este clasificador analiza cada solicitud ingresada en el Agente ChatGPT para determinar si está relacionada con la biología. Si es así, la respuesta del agente se procesa a través de un segundo monitor que evalúa si el contenido podría incitar a una amenaza biológica.
Además, OpenAI ha desactivado la función de memoria de ChatGPT para este agente con el fin de prevenir su uso indebido. En otras versiones de ChatGPT, esta función permite al chatbot consultar información de conversaciones previas con usuarios. No obstante, OpenAI advierte que actores maliciosos podrían explotar esta función en el Agente ChatGPT para exfiltrar datos confidenciales mediante ataques de inyección rápida. La compañía no descarta reconsiderar la incorporación de esta función en el futuro.
Si bien las capacidades del Agente ChatGPT son prometedoras, su efectividad real en el mundo real aún está por comprobarse. Hasta ahora, la tecnología de agentes ha demostrado ser relativamente frágil al interactuar con entornos complejos. Sin embargo, OpenAI confía en haber desarrollado un modelo más robusto capaz de cumplir la promesa de los agentes de AI y redefinir la interacción entre los usuarios y la inteligencia artificial.