OpenAI dévoile Operator — Un nouvel agent IA pour ChatGPT capable d'effectuer des actions sur Internet au nom des utilisateurs

L'organisation de recherche américaine OpenAI a introduit une nouvelle fonctionnalité pour ChatGPT appelée Operator. Cet agent IA peut effectuer de manière autonome des actions sur Internet au nom des utilisateurs.

Operator est alimenté par un nouveau modèle appelé Agent Utilisant un Ordinateur (CUA). Alliant les capacités de vision de GPT-4o à un raisonnement avancé par apprentissage par renforcement, CUA est formé pour interagir avec des interfaces graphiques (GUI) — les boutons, menus et champs de texte que les gens voient sur un écran.

Operator peut “voir” (à travers des captures d'écran) et “interagir” (en utilisant toutes les actions qu'une souris et un clavier permettent) avec un navigateur, lui permettant d'agir sur le web sans nécessiter d'intégrations API personnalisées.
— selon la description

Voici quelques fonctionnalités prises en charge par Operator :

  • Commander des ingrédients pour un plat basé sur des photos et une recette ;
  • Planifier des voyages en fonction du budget et des intérêts de l'utilisateur, ainsi que des informations provenant des forums Reddit ;
  • Explorer des opportunités d'investissement en cryptomonnaie basées sur des tokens qui pourraient devenir populaires à l'avenir ;
  • Réserver des vols et des hébergements sur Booking ;
  • Prendre des rendez-vous chez le coiffeur en fonction d'un emploi du temps dans Google Calendar ;
  • Trouver des cadeaux pour une mère, une épouse ou un autre être cher ;
  • Commander un ménage à domicile grâce à l'intégration avec le service Thumbtack ;
  • Rechercher une assurance médicale abordable ;
  • Trouver divers services, comme localiser un promeneur de chien dans différents pays.

Notamment, la fonctionnalité peut refuser d'effectuer certaines actions qui pourraient causer des dommages ou représenter une menace potentielle. Operator prend en charge presque tous les sites Web utilisant le protocole HTTPS, ainsi que certains services et applications.

Lors de l'utilisation de la fonctionnalité Operator, un navigateur crypté est lancé dans le cloud. Si désiré, l'utilisateur peut prendre le contrôle et ajuster la tâche. Dans certaines situations, comme lors d'achats sur des sites Web, l'utilisateur doit confirmer la demande.

Aux États-Unis, les propriétaires du plan premium ChatGPT Pro (au prix de 200 $ par mois) ont déjà reçu un accès anticipé à Operator. Dans un avenir proche, OpenAI prévoit d'étendre le support aux plans Plus, Team et Enterprise. La fonctionnalité n'est actuellement pas disponible dans l'UE.

Auparavant, nous avons rapporté une nouvelle fonctionnalité IA pour le forum Reddit .

Le post a été traduit Afficher l'original (EN)
0
Author's Userpic
Автор новостей и статей
С 2003-го в теме. До безумия люблю Survival Horror и Sci-Fi.
Commentaires 0