Comment utiliser Chatbot Arena pour comparer les meilleurs LLM

Comment utiliser Chatbot Arena pour comparer les meilleurs LLM
Des lecteurs comme vous aident à soutenir MUO. Lorsque vous effectuez un achat en utilisant des liens sur notre site, nous pouvons gagner une commission d'affiliation. En savoir plus.

Avec plusieurs chatbots disponibles en ligne, il peut devenir extrêmement difficile de sélectionner celui qui répond à vos besoins. Bien que vous puissiez comparer manuellement deux chatbots, cela prendra beaucoup de temps et d’efforts.





Vidéo MUO du jour DÉFILEZ POUR CONTINUER AVEC LE CONTENU

Un moyen meilleur et plus simple consiste à utiliser Chatbot Arena pour comparer les différents LLM qui alimentent les chatbots populaires. Il propose plusieurs modes de comparaison des différents modèles, que nous expliquons ci-dessous.





Qu’est-ce que Chatbot Arena ?

Créé par LMSYS Org, Chatbot Arena est une plateforme permettant de comparer divers LLM. Il utilise le système Elo Rating pour classer les différents modèles.





Chatbot Arena propose aux utilisateurs plusieurs façons de comparer et d’évaluer les LLM. Sur la base des commentaires soumis, Chatbot Arena classe les différents LLM dans le classement public. Le projet est parrainé par HuggingFace, une alternative open source à ChatGPT .

comment faire des captures d'écran sans qu'ils le sachent

Comment comparer les LLM anonymes avec Chatbot Arena

  Capture d'écran de la bataille de l'arène de chatbot

Le mode combat de Chatbot Arena vous permet de comparer les LLM de manière anonyme. Par exemple, vous pouvez comparer ChatGPT (GPT 3.5) et Claude . Cela signifie que Chatbot Arena sélectionne lui-même deux modèles de langage et, sans révéler leurs noms, vous permet de les comparer.



Lorsque vous entrez la première invite, Chatbot Arena récupère les réponses des deux modèles, les présentant côte à côte. La plateforme vous permet de régénérer les réponses (pour les deux LLM) et d'effacer l'historique pour démarrer une conversation différente. Vous pouvez continuer à poser plus de questions jusqu'à ce que vous ayez sélectionné un gagnant clair.

Ensuite, vous pouvez choisir si le modèle A est meilleur ou B. Lors de la sélection du gagnant, Chatbot Arena révèle les noms des deux robots. Ce mode fonctionne très bien car votre décision n'est pas affectée par votre perception antérieure ou la popularité des modèles. Chatbot Arena vous permet également d'ajuster des paramètres tels que la température, le Top P et les jetons de sortie maximale.





Comment comparer les LLM sélectionnés avec Chatbot Arena

  Capture d'écran côte à côte de l'arène de chatbot

Si vous souhaitez comparer deux LLM spécifiques, vous pouvez passer au mode côte à côte de Chatbot Arena. Outre le fait que vous pouvez choisir vous-même les LLM, ce mode fonctionne presque de la même manière que le mode combat. Vous pouvez ajuster les paramètres, régénérer les réponses, effacer l'historique et sélectionner un gagnant à la fin.

Cependant, le nombre de LLM disponibles dans ce mode est limité. Vous pouvez sélectionner différentes versions de Llama 2, Vicuna et ChatGLM. Bien que les LLM populaires, comme GPT-4, GPT-3.5, Claude 1, Claude 2, etc., ne soient actuellement pas disponibles dans ce mode, Chatbot Arena prévoit de les ajouter.





dois-je utiliser mbr ou gpt pour ssd

Comparez les LLM à l'aide de Chatbot Arena

Que vous cherchiez à trouver un chatbot adapté à vos besoins ou que vous souhaitiez simplement tester différents LLM, Chatbot Arena est une excellente plateforme.

Il fournit un moyen simplifié de comparer différents modèles de langage côte à côte. Et comme il maintient un classement basé sur les commentaires des utilisateurs, vous pouvez consulter directement les classements des différents modèles sans exécuter les tests vous-même.