¿Cuán útil es Operator, el nuevo agente de IA de OpenAI?

Reportajes Especiales - Business

Guardar

(The Shift)

SAN FRANCISCO -- En la última semana, el agente Operator de OpenAI ha hecho las siguientes cosas por mí:

-- Me ordenó una nueva cuchara para helado en Amazon.

-- Me compró un nuevo nombre de dominio e hizo la configuración.

-- Reservó una cita de San Valentín para mí y mi mujer.

-- Programó un corte de cabello.

Realizó estas tareas casi de forma autónoma, aunque varias veces tuve que darle un empujoncito y en algunos momentos lo rescaté de un bucle de intentos fallidos.

Si apenas estás poniéndote al día (o si te distrajiste con las noticias sobre DeepSeek de la semana pasada, que eclipsaron las demás noticias sobre inteligencia artificial), Operator es una nueva herramienta, conocida como agente de IA, que OpenAI lanzó a finales de enero.

La herramienta, anunciada como un "avance de investigación", solo está disponible para quienes pagan 200 dólares al mes por el nivel de suscripción más alto de la empresa, ChatGPT Pro. Les ofrece a los usuarios la posibilidad de darle instrucciones a un agente de IA para que utilice un navegador web, rellene formularios y realice otras tareas en su nombre.

Los agentes de IA están de moda en Silicon Valley. Algunas personas del sector piensan que son el siguiente gran paso en las capacidades de la IA, porque un agente de IA capaz de utilizar una computadora de verdad puede realizar tareas valiosas del mundo real y no solo proporcionar asistencia. Muchas de las principales empresas de IA, como Google y Anthropic, tienen en periodo de prueba a agentes autónomos que, según afirman, las empresas podrán "contratar" en el futuro como trabajadores de pleno derecho.

Actualicé mi suscripción a ChatGPT a fin de poner a prueba a Operator y constatar lo que un agente de IA podía hacer por mí.

A primera vista, Operator se parece un poco al ChatGPT normal, salvo que cuando le das una tarea ("Cómprame una bolsa de 10 kilos de comida para perros en Amazon", por ejemplo), Operator abre una ventana de navegador miniatura, teclea "Amazon.com" en la barra de direcciones y empieza a dar clics, intentando seguir tus instrucciones.

Puede que te haga algunas preguntas para clarificar la tarea (¿Quieres comida con sabor a pollo o a ternera? ¿Envío al día siguiente o en dos días?). Luego, cuando está seguro de haber tomado la decisión correcta, Operator te pide una confirmación final, pone la comida para perro en tu carrito de compras y hace el pedido. (Operator no ingresa contraseñas ni números de tarjeta de crédito, tú tienes que tomar el control del mininavegador y teclearlos, pero hace el resto por sí solo).

El objetivo de Operator es que no tengas que supervisarlo; puede realizar tareas en segundo plano mientras tú haces otras cosas. No obstante, me quedé pegado a la ventana, hipnotizado ante el espectáculo de un navegador web autónomo que presionaba botones, escribía palabras en casillas y seleccionaba en menús desplegables por sí solo. ¡Mira, mamá, una computadora usando una computadora!

Operator también tuvo un desempeño impresionante en algunas tareas relativamente sencillas que le encargué:

-- Pidió sin problemas el almuerzo en DoorDash para mi colega Mike y se lo envió a casa. (No le dije lo que tenía que pedirle, pero Operator eligió un restaurante mexicano, escogió un puñado de platillos para él e incluso le dio 7 dólares de propina al repartidor).

-- Respondió por mí cientos de mensajes no leídos de LinkedIn después de que le di control de mi perfil de LinkedIn (aunque, para mi horror, también me inscribió en un seminario web).

-- Gané 1,20 dólares por crear cuentas en sitios web que ofrecen pequeñas recompensas en efectivo por responder encuestas (podría haber ganado más, pero empecé a sentirme culpable por llenar las encuestas de basura con respuestas falsas escritas por un robot).

Pero Operator también fracasó en un montón de tareas más y reveló sus limitaciones:

-- No pudo escanear mis columnas recientes y añadirlas a mi sitio web personal, porque el acceso del navegador de Operator al sitio web de The New York Times está bloqueado (también está bloqueado en otros sitios, como Reddit y YouTube. El Times demandó a OpenAI y a Microsoft por infracción de derechos de autor en relación con el entrenamiento de modelos de IA).

-- No quiso jugar póquer en línea por mí (Operator respondió: "No puedo ayudar con juegos de apuestas o actividades relacionadas", lo que me pareció una negativa razonable, dado el caos que podría crear un bot apostador).

-- Además, las pruebas CAPTCHA le impidieron entrar en varios sitios (lo que me tranquilizó, dado que el objetivo de los CAPTCHA es impedir el uso de robots).

En general, utilizar Operator me dio más problemas de los que me resolvió. La mayor parte de lo que hizo por mí lo podía haber hecho yo más rápido y con menos dolores de cabeza. Incluso cuando funcionó, me pidió tantas confirmaciones y corroboraciones antes de actuar que, más que sentir que tenía un asistente virtual, me pareció que estaba supervisando al practicante más inseguro del mundo.

Por supuesto, apenas son los primeros pasos de los agentes de IA. Por lo regular, los productos de IA mejoran de una versión a otra, así que es muy probable que las próximas versiones de Operator sean mejores. Pero en su forma actual, Operator es más una demostración intrigante que un producto que recomendaría utilizar y, definitivamente, no es algo en lo que la mayoría de la gente necesite gastar 200 dólares al mes.

Operator, una nueva herramienta informática de OpenAI, es frágil y errática en ocasiones, pero apunta a un futuro de potentes agentes de Inteligencia Artificial. (Ard Su/The New York Times)

Guardar