Introduction

OpenAI, la société derrière le modèle de langage ChatGPT, lance un nouvel agent AI généraliste qui promet de révolutionner la façon dont les utilisateurs interagissent avec les ordinateurs. Baptisé ChatGPT agent, cet outil combine les capacités de plusieurs agents précédents, permettant ainsi d’automatiser une grande variété de tâches informatiques.

Les capacités du ChatGPT agent

Le ChatGPT agent peut notamment naviguer automatiquement dans le calendrier d’un utilisateur, générer des présentations et des diaporamas éditables, et même exécuter du code. Grâce à l’accès à des API et à des connecteurs, l’agent peut interagir avec des applications tierces comme Gmail et GitHub pour trouver des informations pertinentes. OpenAI affirme que l’agent peut même planifier et acheter des ingrédients pour préparer un petit déjeuner japonais pour quatre personnes, ou analyser trois concurrents et créer un diaporama.

La puissance du modèle sous-jacent

Le modèle sous-jacent au ChatGPT agent offre des performances de pointe sur plusieurs benchmarks, selon OpenAI. L’agent obtient ainsi un score de 41,6% sur l’examen Humanity’s Last Exam, un test difficile composé de milliers de questions sur plus de cent sujets. Sur le benchmark FrontierMath, l’un des plus difficiles en mathématiques, le ChatGPT agent obtient un score de 27,4% lorsqu’il a accès à des outils tels qu’un terminal pour l’exécution de code.

La sécurité, une priorité

OpenAI a développé le ChatGPT agent en gardant à l’esprit la sécurité, compte tenu des capacités nouvelles et puissantes qu’il présente. La société a mis en place de nouvelles mesures de sécurité pour éviter les utilisations malveillantes, notamment un moniteur qui fonctionne en temps réel pour détecter les requêtes liées à la biologie et à la chimie. OpenAI a également désactivé la fonction de mémoire de ChatGPT pour éviter les attaques par injection de prompts.

Un avenir prometteur

Si le ChatGPT agent seems impressive, il reste à voir comment il se comportera dans le monde réel. Jusqu’à maintenant, les agents AI ont souvent prouvé être fragiles lorsqu’ils interagissaient avec le monde réel. Cependant, OpenAI affirme avoir développé un modèle plus capable qui peut réellement délivrer sur la promesse des agents AI.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *