Un modèle de pointe aux capacités étonnantes
Un modèle de langage nommé “gpt2-chatbot”, aux performances remarquables, a été récemment découvert sur le site LMSYS. Bien que peu d’informations soient disponibles sur ce modèle, l’analyse de son comportement et de ses messages d’erreur suggère fortement qu’il s’agit en réalité d’un modèle développé par OpenAI, probablement une version précoce de GPT-4. Cet article explore les indices qui mènent à cette conclusion et soulève des questions sur les motivations potentielles d’OpenAI à tester discrètement ce modèle sur la plateforme LMSYS.
Points clés
- Un modèle de langage nommé “gpt2-chatbot” a été découvert sur le site LMSYS, démontrant des capacités dépassant celles de tout modèle GPT-2 connu
- L’analyse de ses messages d’erreur, de sa structure de réponse, de ses instructions et de ses informations autobiographiques suggère fortement qu’il s’agit d’un modèle développé par OpenAI
- Le modèle se présente comme étant “basé sur GPT-4” et fait référence à lui-même comme étant “ChatGPT” ou “un ChatGPT”
- Il utilise le tokenizer de OpenAI et présente des vulnérabilités spécifiques aux modèles d’OpenAI
- La qualité et la structure de ses réponses sont jugées exceptionnelles, au niveau de GPT-4 ou supérieur
- L’accès à ce modèle a été temporairement retiré par LMSYS, probablement en raison d’un afflux inattendu d’utilisateurs
- LMSYS a récemment mis à jour sa politique d’évaluation des modèles non publiés, ce qui pourrait être lié au retrait de “gpt2-chatbot”
À retenir
Bien que les preuves soient solides, il est important de rester prudent et de ne pas tomber dans la spéculation excessive. Cependant, si ce modèle est bien une version précoce de GPT-4 d’OpenAI, cela pourrait signifier que la prochaine génération de modèles de langage sera encore plus impressionnante. Espérons que ce mystérieux “gpt2-chatbot” réapparaisse bientôt pour que nous puissions en apprendre davantage sur ses capacités et son origine.
Sources