L’intelligence artificielle (IA) continue d’évoluer à un rythme rapide, et les dernières avancées dans le domaine des modèles de langage sont particulièrement prometteuses. OpenAI, l’un des leaders dans ce domaine, vient de lancer GPT-5.4, un nouveau modèle de fondation qui promet d’être encore plus capable et efficient que ses prédécesseurs.
Caractéristiques et améliorations de GPT-5.4
GPT-5.4 est disponible sous trois formes différentes : une version standard, une version appelée GPT-5.4 Thinking qui se concentre sur la capacité de raisonnement, et une version optimisée pour les performances élevées, appelée GPT-5.4 Pro. L’une des caractéristiques les plus notables de ce nouveau modèle est sa capacité à traiter des contextes très larges, pouvant aller jusqu’à 1 million de tokens. Cela représente une avancée significative par rapport aux modèles précédents, qui étaient limités à des contextes beaucoup plus petits. De plus, GPT-5.4 a été conçu pour être plus efficient en termes de tokens, ce qui signifie qu’il peut résoudre les mêmes problèmes avec moins de tokens que ses prédécesseurs.
Performances et benchmark
Les résultats des tests de GPT-5.4 sont très prometteurs. Le modèle a obtenu des scores record dans plusieurs benchmarks, notamment OSWorld-Verified et WebArena Verified, qui évaluent les capacités de traitement de l’information et de raisonnement du modèle. De plus, GPT-5.4 a obtenu un score de 83 % sur le test GDPval d’OpenAI, qui évalue les capacités du modèle à effectuer des tâches de travail professionnel. Le modèle a également dominé le benchmark APEX-Agents de Mercor, qui évalue les compétences professionnelles en droit et en finance. Selon Brendan Foody, PDG de Mercor, GPT-5.4 excelle dans la création de documents de longue durée, tels que des présentations, des modèles financiers et des analyses juridiques, tout en offrant des performances supérieures à celles des modèles concurrents.
Sécurité et évaluation
OpenAI a également travaillé à améliorer la sécurité et la fiabilité de GPT-5.4. Le modèle a été conçu pour réduire les hallucinations et les erreurs factuelles, et les résultats des tests montrent que GPT-5.4 est 33 % moins susceptible de commettre des erreurs dans les réclamations individuelles par rapport à GPT 5.2. De plus, les réponses globales du modèle sont 18 % moins susceptibles de contenir des erreurs. OpenAI a également introduit un nouveau système de gestion des outils appelé Tool Search, qui permet au modèle de rechercher les définitions des outils au besoin, plutôt que de les définir tous à l’avance. Cela devrait rendre les requêtes plus rapides et moins coûteuses. Enfin, OpenAI a inclus une nouvelle évaluation de sécurité pour tester la chaîne de pensée du modèle, qui montre que GPT-5.4 est moins susceptible de tromper les utilisateurs sur son processus de pensée.