La empresa de inteligencia artificial (IA) Open IA anunció un complemento de ChatGPT para navegar en Internet que permitirá buscar en la web y realizar tareas preestablecidas en nombre del usuario. El agente de ChatGPT combina las capacidades autónomas de su motor operativo y su capacidad de razonamiento se conjugan con la herramienta de Investigación Profunda (Deep Search en inglés).
Operador, nombre del nuevo desarrollo de Open IA, se lanzó en enero –detalló el medio especializado en cultura digital Mashable– como modo de vista previa para los usuarios de ChatGPT Pro, y permite desplazarse, hacer clic y redactar en la web, pero con limitaciones. Lo mismo con el agente "Investigación profunda" que permite programar ChatGPT para buscar en la web y recopilar información en nombre del usuario. El lanzamiento del nuevo complemento de navegación combina ambas herramientas. El agente ChatGPT de OpenAI se suma a otras herramientas de este estilo que pueden realizar tareas preestablecidas en nombre del usuario. Si bien no es un navegador web completo, actúa de manera similar al asistente de Perplexity para el navegador Comet. Anthropic también tiene una herramienta llamada "computer use" que puede tomar el control del cursor y escribir código de programación de forma automática. A medida que los modelos de IA mejoran, se vuelven más capaces de realizar tareas autónomas. La navegación web se considera uno de los próximos ámbitos en los que competirán las empresas de IA como OpenAI, Anthropic y Perplexity y Proyecto Mariner, un prototipo de Google que se encuentra en etapa de investigación. Con la herramienta Operador de ChatGPT se podrán realizar tareas como "mirar mi calendario e informarme sobre las próximas reuniones con clientes según noticias recientes" o "planificar y comprar ingredientes para preparar un desayuno japonés para cuatro", según un portavoz de OpenAI. OpenAI reforzó la idea de que los usuarios son quienes tienen el control y que ChatGPT solicita permiso antes de tomar acciones como enviar formularios, realizar compras o manejar información personal. La empresa de IA dijo que los usuarios pueden interrumpir o tomar el control cuando sea necesario sin mayores dificultades. Ciertas tareas, como enviar correos electrónicos, requieren una supervisión llamada Modo de Vigilancia. Con respecto a la seguridad, al agente de navegación web de ChatGPT no se le permite realizar tareas de "alto riesgo", como transacciones financieras o asesoramiento legal, y está entrenado para reconocer ataques maliciosos como tácticas de manipulación vía preguntas. En términos de recopilación de datos, Open IA dijo que el agente de ChatGPT puede eliminar sus datos de navegación y cerrar sesión en sitios web con un solo clic y no recopila datos mientras el usuario realiza tareas como ingresar contraseñas. El nuevo desarrollo está disponible para usuarios de pago en su versión Pro, Plus y Team. Los clientes Pro tendrán acceso a partir de este jueves, y los de Plus y Team en los próximos días. Aunque las consultas estarán restringidas a 400 por mes para los primeros y a 40 para los dos restantes.
"Operador no podía profundizar en el análisis ni escribir informes detallados, y la investigación profunda no lograba interactuar con los sitios web para refinar los resultados o acceder ha contenido que requirieran autenticación del usuario", detalló el anuncio de OpenAI. "Vimos que muchas de las consultas que los usuarios intentaban realizar con Operador eran más adecuadas para una investigación profunda, por lo que reunimos lo mejor de ambas", sintetizó.Los agentes crecen a gran velocidad en el ecosistema de desarrollos IA