Jusqu’à présent, les grands modèles de langage (LLM) open-source ont généralement été éclipsés par leurs homologues closed-source en termes de performances et de capacités.
Pour changer cette dynamique, Meta met ses derniers modèles d’IA à la disposition du public, annonçant ainsi une nouvelle ère où les modèles open-source sont prêts à dominer le domaine.
Voici Llama 3.1 405B, qui, selon Meta, est le modèle de base open-source le plus grand et le plus avancé au monde, mettant l’accent sur la collaboration et l’accessibilité.
Cette version fait suite au succès des versions précédentes de Llama, qui ont accumulé plus de 300 millions de téléchargements, y compris Llama 3.1 70B et Llama 3.1 8B.
Le nouveau modèle Llama 3.1 405B, doté d’un nombre impressionnant de 405 milliards de paramètres, démontre ses prouesses en matière de connaissances générales, d’orientation, de mathématiques, d’utilisation d’outils et de traduction multilingue, égalant ainsi les capacités des principaux modèles d’IA actuellement sur le marché.
Il peut étendre la longueur du contexte jusqu’à 128 Ko et prend en charge huit langues différentes. Grâce à ses capacités multilingues, vous pouvez lui demander de traduire en espagnol l’histoire de la poule aux œufs d’or.
Pour les tâches de développement de logiciels, vous pouvez écrire une invite qui lui permet de développer un programme capable de générer un labyrinthe parfait.
Ce programme peut utiliser soit un algorithme de retour en arrière récursif, soit un algorithme de recherche en profondeur, et peut être personnalisé en termes de taille et de complexité.