OpenAI a dévoilé son très attendu modèle GPT-4.5 jeudi, marquant les débuts de l’un des produits les plus attendus sur le marché croissant de l’IA générative.
Cependant, le lancement, qui a eu lieu deux ans après GPT-4, a mis en lumière les défis auxquels l’entreprise d’IA est confrontée pour maintenir son leadership dans la course qu’elle a aidé à initier.
Le PDG Sam Altman a salué les avancées de GPT-4.5, tweetant que c’était le premier modèle d’IA qui « donne l’impression de parler à une personne réfléchie » et exprimant son étonnement face aux « bons conseils » qu’il fournit.
Un article de blog publié par l’entreprise a partagé que les testeurs ont trouvé que GPT-4.5 affichait plus d' »EQ » (intelligence émotionnelle) que les modèles OpenAI précédents.
De plus, GPT-4.5 serait moins sujet aux « hallucinations » – un phénomène où l’IA génère des informations inexactes ou inventées – que ses prédécesseurs.
Bien qu’Altman et son équipe aient cherché à tempérer les attentes, il a averti que GPT-4.5 n’était pas conçu comme un modèle de raisonnement et ne dépasserait pas nécessairement les références. Il l’a décrit comme présentant une « différente sorte d’intelligence ».
Le post de blog d’OpenAI a également souligné des métriques plus douces et plus qualitatives pour mesurer les améliorations de GPT-4.5 par rapport aux modèles précédents, telles que la production de résultats qui « semblent plus naturels » et le fait de démontrer une « capacité améliorée à suivre l’intention de l’utilisateur ».
La position mitigée de l’entreprise sur GPT-4.5 était évidente même dans la manière dont elle a décrit le modèle.
OpenAI a d’abord déclaré dans son document technique publié en même temps que le lancement que « GPT-4.5 n’est pas un modèle de pointe » (se référant aux systèmes d’IA à la pointe de la capacité technologique).
Cependant, quelques heures plus tard, l’entreprise a supprimé cette phrase du document pour des raisons qui restent floues.
De plus, OpenAI a indiqué qu’elle n’avait pas encore décidé si elle proposerait GPT-4.5 comme une API à long terme pour que les partenaires l’intègrent dans leurs systèmes en raison des coûts opérationnels élevés.
Actuellement, le nouveau modèle est proposé à des prix 15 à 30 fois plus élevés que le modèle GPT-4 d’OpenAI. À bien des égards, GPT-4.5 marque la fin d’une époque pour OpenAI.
Comme l’a annoncé Altman plus tôt ce mois-ci, GPT-4.5, également appelé en interne Orion, est le dernier modèle à être construit en utilisant la même méthode de « pré-entrainement » employée pour créer la technologie derrière le ChatGPT réussi (avec le « P » de GPT signifiant « pré-entraîné »).
Cette méthode consiste à construire des modèles progressivement plus grands et à utiliser des quantités de données toujours plus expansives à chaque nouvelle version, une méthode à la fois coûteuse et complexe, mais qui, en théorie, permet aux modèles de devenir plus puissants.
OpenAI a annoncé que GPT-4.5 serait disponible pour les utilisateurs du service ChatGPT Pro à 200 $ par mois à partir de jeudi, mais qu’il ne serait pas accessible aux autres utilisateurs avant la semaine suivante en raison de la capacité de calcul limitée, comme l’a noté Altman.
L’entreprise n’a pas révélé la taille du nouveau modèle GPT-4.5. Cependant, des experts externes estiment que GPT-4 pourrait avoir jusqu’à 1,8 trillion de paramètres – des nœuds ajustables dans son réseau neural.
Certains experts ont suggéré que GPT-4.5 pourrait inclure entre 4 et 5 trillions de paramètres. Bien que le nouveau modèle GPT-4.5 surpasse le GPT-4 d’OpenAI de manière significative dans plusieurs tests de référence, en particulier ceux impliquant des réponses à des questions de culture générale précises, ses performances sur d’autres tests, y compris ceux impliquant la résolution de problèmes multilingues, n’ont montré qu’une légère amélioration.
De plus, les premiers utilisateurs ont signalé que GPT-4.5 sous-performe les modèles de « raisonnement » existants d’OpenAI, tels que o1 et o3-mini, ainsi que le modèle R1 de la startup chinoise DeepSeek, en particulier dans des tâches impliquant des mathématiques, de la programmation et de la logique.
Les scores de référence partagés sur les réseaux sociaux suggèrent également que GPT-4.5 est à la traîne par rapport au Claude 3.7 Sonnet d’Anthropic, un modèle d’IA concurrent dévoilé plus tôt cette semaine.
Claude 3.7 Sonnet est le premier modèle d’IA à combiner les réponses rapides et « intuitives » typiques des modèles de type GPT avec les réponses plus lentes, mais souvent plus précises, produites par les modèles de raisonnement.
Claude 3.7 Sonnet détermine, en fonction de l’invite de l’utilisateur, s’il peut fournir rapidement une réponse basée uniquement sur son entraînement initial ou s’il doit s’engager dans un processus de « chaîne de pensée » – produisant une série d’étapes et y réfléchissant pour arriver à une conclusion plus précise. GPT-4.5 d’OpenAI ne possède pas cette capacité.