La société xAI d'Elon Musk a publié son dernier modèle d'IA, Grok 3, qui présente des améliorations significatives par rapport à Grok 2.
Grok 3 a réalisé en peu de temps des fonctionnalités qui sont supérieures d'un ordre de grandeur à celles de Grok 2. Par rapport à Grok 2, les données d'entraînement de Grok 3 ont été multipliées par dix, et ses performances surpassent ou rivalisent avec celles des concurrents tels que ChatGPT, DeepSeek et Gemini. Bien que Grok ait commencé tard, il a rapidement rattrapé ChatGPT en termes de scores MMLU.
Après le lancement officiel du dernier modèle, Grok 3, Elon Musk l'a qualifié de « l'IA la plus intelligente sur Terre ».
Pourquoi fait-il cette affirmation audacieuse ? Regardons d'abord les résultats des tests publiés par xAI :
Les résultats des tests montrent que Grok 3 et Grok 3 mini ont de très bonnes performances dans plusieurs tests de référence, surpassant de nombreux modèles mainstream, y compris GPT-4o, Claude 3.5 Sonnet, DeepSeek-V3 et Gemini-2 Pro.
xAI a également lancé un moteur de recherche intelligent nommé DeepSearch, qui fonctionne en synergie avec Grok-3. Il s'agit de la première génération d'outils agents étendus de xAI, qui non seulement aide les ingénieurs, chercheurs et scientifiques à coder, mais qui peut également aider chacun à répondre aux questions quotidiennes.
DeepSearch peut non seulement rechercher sur le web des informations existantes, mais il peut également déduire l'intention réelle de l'utilisateur et réfléchir. Après avoir confronté différentes sources d'information, il s'assure de retourner les bonnes informations.
Jetons un œil à la démonstration de Musk : « Le moment du prochain lancement de Starship. »
DeepSearch peut réfléchir, rechercher des nouvelles sur le web, des publications sur X, etc., analyser et résumer les informations avant de donner une réponse. Les utilisateurs peuvent consulter le processus de raisonnement du modèle et cela supporte des tâches telles que la recherche et l'analyse de données.
Des modèles comme DeepSeek et OpenAI ChatGPT se sont déjà engagés dans la recherche AI, fournissant des réponses en temps réel via une connexion réseau. Nous pouvons voir que la recherche en ligne alimentée par l'IA devient un domaine d'affaires très prisé pour de nombreuses entreprises d'IA.
Grok 3 sera d'abord proposé aux abonnés Premium+ sur X, qui seront les premiers à y avoir accès. On ne sait pas encore quand les utilisateurs ordinaires pourront y accéder.
Comme le modèle est en constante mise à jour et amélioration, la version lancée sur l'App Store d'Apple sera relativement en retard, tandis que la version web sera mise à jour de manière plus rapide. Selon les rapports, une version complète pourrait être lancée dans une semaine. L'équipe de xAI a également confirmé qu'elle travaillerait sur des fonctionnalités d'interaction vocale pour Grok 3, ce qui pourrait être une des meilleures expériences avec Grok 3.
Musk a confirmé des plans pour open-sourcer Grok 3 et à publier des versions plus anciennes lors du développement de nouvelles versions. Le genre de ce modèle n'a pas encore été déterminé.
Dans un contexte de compétition mondiale toujours plus intense dans le domaine de l'IA, le lancement de Grok 3 a suscité un grand intérêt dans l'industrie. En particulier, la société émergente chinoise DeepSeek a présenté son modèle très rentable, qui peut rivaliser en performance avec les séries GPT et o1/o3 d'OpenAI, poussant de nombreuses entreprises d'IA à réfléchir à la question de savoir si la stratégie d'« expansion » consistant à se fier uniquement à l'augmentation des ressources informatiques et à l'élargissement de l'échelle des modèles reste la meilleure solution.
Au début février, Google a lancé une série de nouveaux modèles, y compris Gemini 2.0 Flash, Gemini 2.0 Flash-Lite et la version expérimentale du nouveau modèle phare Gemini 2.0 Pro.
Et le jour du lancement de Grok 3, Ultraman a également déclaré sur X : « Pour les testeurs ayant des exigences élevées, l'expérience d'essayer GPT-4.5 pour ressentir l'AGI est bien plus profonde que ce que j'avais prévu ! » Cela semble indiquer que GPT-4.5 est en phase de test et ne sera pas loin d'une sortie officielle.
Anthropic a également annoncé qu'il lancerait prochainement la série Claude 4.
Avec OpenAI, Anthropic, Meta et Google lançant sans cesse des modèles d'IA de plus en plus avancés, la bataille de l'IA continuera de s'intensifier à l'avenir. Il reste à voir si Grok 3 pourra réellement surpasser ses concurrents et devenir l'IA la plus intelligente sur Terre.
Alors que les modèles Grok, ChatGPT, DeepSeek et Gemini continuent de se mettre à jour et de progresser,XXAI met également continuellement à jour et ajoute des modèles, s'efforçant de permettre aux utilisateurs de bénéficier de tous les services des modèles sur une seule plateforme.
XXAI prévoit de lancer la version web ce mois-ci. De plus, elle ajoutera des fonctionnalités telles que XXAI bot, XXAI tools et la collaboration entre plusieurs modèles sur la base de la fonctionnalité existante de XXAI chat. Les utilisateurs intéressés peuvent s'attendre à ces développements.