Operator : l’agent IA qui navigue sur le web et exécute des tâches pour vous
OpenAI dévoile Operator, un agent IA capable de commander en ligne et naviguer sur le web
OpenAI, l’entreprise derrière ChatGPT, a récemment présenté Operator, un nouvel agent IA capable de naviguer sur le web et d’exécuter des tâches pour les utilisateurs. Cette technologie révolutionne l’expérience en ligne en automatisant des activités comme la réservation de billets ou la commande de courses, avec une intervention humaine minimale.
Qu’est-ce qu’Operator et comment fonctionne-t-il ?
Operator repose sur le modèle Computer Using Agent (CUA) d’OpenAI, qui combine les capacités visuelles de GPT-4o avec des méthodes avancées de raisonnement. Cela permet à l’agent de parcourir des sites web, remplir des formulaires, cliquer sur des boutons et faire défiler des pages, comme le ferait un utilisateur humain.
Selon Yash Kumar, responsable produit et ingénierie chez OpenAI, « il peut naviguer sur des sites web et y effectuer des actions, tout comme vous et moi. » Contrairement aux outils IA traditionnels qui utilisent des APIs, Operator exploite des captures d’écran et un navigateur virtuel pour analyser visuellement les éléments, tels que les boutons et les champs de texte.
Un projet en développement : limites et préoccupations en matière de sécurité
Bien qu’Operator marque une avancée majeure, OpenAI reconnaît qu’il en est encore à ses débuts et présente certaines limitations. Des tâches complexes, comme la création de diaporamas ou l’organisation d’événements détaillés, restent difficiles à automatiser. Lors de démonstrations, Operator a affiché un taux de réussite de 87 % pour des tâches en ligne, mais a rencontré des difficultés avec des processus en plusieurs étapes.
La sécurité et la confidentialité sont au cœur de la stratégie de déploiement d’OpenAI. L’agent utilise un système de sécurité en trois niveaux pour garantir un contrôle utilisateur maximal :
- Mode de prise en charge : pour les actions sensibles (ex. saisie de mots de passe, paiements), Operator demande une intervention manuelle.
- Confirmations utilisateur : avant toute action majeure (ex. validation d’un achat), l’utilisateur doit approuver l’opération.
- Restrictions de tâches : Operator refuse les actions à haut risque, comme les transactions financières ou les candidatures à des emplois.
OpenAI a également mis en place un mode surveillance pour éviter les abus et les attaques de phishing.
Partenariats et applications concrètes
OpenAI collabore avec DoorDash, Instacart, Uber et OpenTable pour permettre à Operator de gérer des tâches pratiques, comme la commande de repas ou la réservation de services. L’entreprise travaille aussi avec la ville de Stockton pour faciliter l’accès aux services publics.
Selon Jamil Niazi, directeur des technologies de l’information de Stockton, « en apprenant à mieux utiliser Operator, nous pourrons identifier comment l’IA peut simplifier l’engagement civique pour nos habitants. »
Un aperçu de l’avenir des agents IA
Sam Altman, PDG d’OpenAI, a présenté Operator comme le premier d’une série d’agents IA en développement. À l’avenir, ces agents seront intégrés à ChatGPT et une API sera mise à disposition pour que les développeurs créent leurs propres solutions IA.
Disponibilité et perspectives
Actuellement, Operator est réservé aux abonnés ChatGPT Pro aux États-Unis, avec un coût mensuel de 200 dollars. OpenAI prévoit un lancement mondial après des améliorations et des retours utilisateurs.
Bien que prometteur, Operator nécessite encore une supervision humaine. Son lancement marque toutefois une transition vers des agents IA actifs, capables de gérer aussi bien des achats en ligne que la planification quotidienne.