Elon Musk a récemment présenté Grok, un modèle d’intelligence artificielle (IA) innovant, conçu pour répondre aux sollicitations avec une touche d’humour. Intégré à la plateforme X, Grok est une option intéressante pour ceux qui aiment une dose d’humour dans leurs interactions avec l’IA.
Grok tire ses connaissances en temps réel de la plateforme X, ce qui lui permet de répondre même aux questions les plus épicées. Bien que toujours en version bêta, Grok, avec deux mois d’entraînement à son actif, vise à affiner et à étendre ses capacités au fil du temps.
L’Objectif de Grok AI
Selon xAI, l’objectif de Grok AI est d’aider les gens à comprendre et à apprendre. Grok est alimenté par Grok-1 LLM, développé sur une période de quatre mois. Son prototype, Grok-0, a été entraîné avec 33 milliards de paramètres, le plaçant en dessous de LLaMA 2 de Meta, qui utilise 70 milliards de paramètres.
Les Capacités de Grok
Grok-1 a des capacités impressionnantes. Il obtient un score de 63,2% à la tâche de codage HumanEval et de 73% à MMLU. Bien qu’il ne surpasse pas GPT-4, xAI affirme que Grok-1 s’est amélioré de manière significative par rapport à Grok-0 en peu de temps.
Sur le benchmark GSM8k, qui se concentre sur les problèmes de maths de niveau moyen, Grok-1 atteint 62,9%, surpassant GPT-3.5 et LLaMa 2 mais restant derrière Palm 2, Claude 2, et GPT-4.
Grok-1 se débrouille bien sur divers benchmarks, notamment MMLU, HumanEval, un test de génération de code Python et MATHS, qui couvre les examens de maths du collège et du lycée.
Dans un test noté à la main, Grok-1 a obtenu 59% aux finales nationales hongroises de maths du lycée de 2023, dépassant les 55% de Claude 2 et les 68% de GPT-4.
Ces chiffres indiquent que Grok-1 est plus capable que GPT-3.5 d’OpenAI mais pas aussi avancé que le dernier GPT-4. xAI affirme que Grok-1, malgré l’utilisation de moins de données d’entraînement, peut rivaliser avec des modèles nécessitant des ensembles de données plus importants et plus de puissance de calcul.
L’Entraînement et l’Accès aux Données de Grok
Grok-1 est formé à l’aide d’une pile personnalisée basée sur Kubernetes, Rust et JAX. Il a accès en temps réel à l’internet, lui permettant de fournir des informations à jour. Cependant, cela signifie également qu’il peut générer des informations incorrectes ou contradictoires. xAI recherche activement des retours humains pour améliorer la compréhension contextuelle de Grok, ses capacités multimodales et sa robustesse adversariale.
Disponibilité de Grok
Actuellement, la version bêta de Grok est accessible à un nombre limité d’utilisateurs aux États-Unis. Dans un avenir proche, il sera disponible pour les abonnés X Premium+, pour un coût de 16$ par mois, soit environ 14,90€ lorsque souscrit depuis l’interface web de X.