Das Unternehmen xAI von Elon Musk hat sein neuestes AI-Modell Grok 3 vorgestellt, das im Vergleich zu Grok 2 erhebliche Verbesserungen aufweist.
Grok 3 hat in kurzer Zeit Funktionen erreicht, die um einen Faktor überlegener sind als die von Grok 2. Im Vergleich zu Grok 2 wurde das Training von Grok 3 zehntausendfach erweitert, und seine Leistung übertrifft oder rivalisiert mit Wettbewerbern wie ChatGPT, DeepSeek und Gemini. Obwohl Grok spät gestartet ist, hat es sich in den MMLU-Wertungen sehr schnell an ChatGPT herangearbeitet.
Nach der offiziellen Vorstellung des neuesten Modells Grok 3 bezeichnete Elon Musk es als die "intelligenteste KI auf der Erde".
Warum wagt er diese Aussage? Lassen Sie uns zunächst die von xAI veröffentlichten Testergebnisse betrachten:
Grok 3 und Grok 3 mini haben in mathematischen, wissenschaftlichen und Programmier-Benchmarks alle gängigen Modelle übertroffen, einschließlich GPT-4o, Claude 3.5 Sonnet, DeepSeek-V3 und Gemini-2 Pro.
Auch das Leistungsmodell von Grok 3 hat in mathematischen, wissenschaftlichen und Programmier-Benchmarks sehr gute Leistungen gezeigt. Die Schlussfolgerungsfähigkeiten von Grok-3 Reasoning Beta und Grok-3 mini Reasoning übertreffen ähnliche Modelle wie DeepSeek-R1 und OpenAIs o3 mini.
Die Testergebnisse zeigen, dass Grok 3 und Grok 3 mini in mehreren Benchmarks hervorragende Leistungen zeigen und mehrere gängige Modelle, darunter GPT-4o, Claude 3.5 Sonnet, DeepSeek-V3 und Gemini-2 Pro, übertreffen.
xAI hat auch die intelligente Suchmaschine DeepSearch eingeführt, die mit Grok-3 zusammenarbeitet. Dies ist xAIs erste Generation eines umfassenden Agentenwerkzeugs, das nicht nur Ingenieuren, Forschern und Wissenschaftlern beim Programmieren hilft, sondern auch jedem hilft, alltägliche Fragen zu beantworten.
DeepSearch kann nicht nur im Web suchen und vorhandene Informationen finden, sondern auch die wahren Absichten der Benutzer vermuten und kritisch denken. Nach dem Abgleich verschiedener Informationsquellen stellt es sicher, dass die richtigen Informationen zurückgegeben werden.
Betrachten wir Musks Demonstration: "Der Zeitpunkt des nächsten Starship-Starts."
DeepSearch kann kritische Überlegungen anstellen und dann Nachrichten aus dem Web, X-Plattform-Beiträge usw. analysieren und zusammenfassen, bevor es eine Antwort gibt. Benutzer können den Denkprozess des Modells einsehen und Aufgaben wie Forschung und Datenanalyse unterstützen.
Modelle wie DeepSeek, OpenAI ChatGPT usw. haben bereits in den Bereich der KI-Suchmaschinen investiert und können durch Vernetzung in Echtzeit Antworten geben. Wir sehen, dass die KI-Internet-Suche zu einem beliebten Geschäftsbereich für zahlreiche KI-Unternehmen wird.
Grok 3 wird zuerst den Premium+-Abonnenten auf X zur Verfügung gestellt, die zu den ersten gehören, die Zugriff erhalten. Es ist unklar, wann reguläre Benutzer darauf zugreifen können.
Da das Modell immer aktualisiert und verbessert wird, wird die im Apple App Store veröffentlichte Grok-Version relativ zurückliegen, während die Webversion die aktuellsten Updates erhält. Berichten zufolge könnte eine vollständige Version in einer Woche verfügbar sein. Das xAI-Team hat auch angekündigt, Sprachinteraktionsfunktionen für Grok 3 zu entwickeln, was eine der besten Erfahrungen mit Grok 3 sein könnte.
Musk hat die Pläne bestätigt, Grok 3 als Open Source zu veröffentlichen, und beim Entwickeln neuer Versionen ältere Versionen herauszugeben. Das Geschlecht des Modells ist noch unbekannt.
Vor dem Hintergrund eines zunehmend wettbewerbsintensiven globalen AI-Markts hat die Einführung von Grok 3 große Aufmerksamkeit in der Branche erregt. Besonders als das chinesische Unternehmen DeepSeek sein kosteneffizientes Modell vorstellte, das leistungstechnisch mit OpenAIs GPT und den Serien o1/o3 gleichziehen kann, begannen viele AI-Unternehmen zu hinterfragen, ob die bloße Abhängigkeit von erhöhten Rechenressourcen und der Skalierung von Modellen die optimale Strategie bleibt.
Anfang Februar veröffentlichte Google eine Reihe neuer Modelle, einschließlich Gemini 2.0 Flash, Gemini 2.0 Flash-Lite und dem neuen Flaggschiff-Modell Gemini 2.0 Pro in der Experimentierphase.
Am selben Tag, als Grok 3 veröffentlicht wurde, sagte Ultraman auf X: "Für Tester mit hohen Anforderungen ist die Erfahrung von GPT-4.5 im Hinblick auf AGI viel tiefer, als ich erwartet hatte!" Dies scheint darauf hinzudeuten, dass GPT-4.5 in die Testphase eingetreten ist und nicht mehr weit von der offiziellen Veröffentlichung entfernt sein könnte.
Auch Anthropic hat angekündigt, bald die Claude 4-Serie herauszubringen.
Mit OpenAI, Anthropic, Meta und Google, die ständig fortschrittlichere AI-Modelle herausbringen, wird der AI-Wettbewerb in Zukunft weiter an Intensität gewinnen. Es bleibt abzuwarten, ob Grok 3 tatsächlich in der Lage ist, seine Wettbewerber zu übertreffen und die intelligenteste KI auf der Erde zu werden.
Mit dem Upgrade und der Weiterentwicklung der Modelle Grok, ChatGPT, DeepSeek und Gemini aktualisiert und ergänzt XXAI ständig neue Modelle und strebt an, dass Nutzer alle Modelle auf einer einzigen Plattform genießen können.
XXAI plant, in diesem Monat die Webversion zu starten und wird neue Funktionen wie XXAI bot, XXAI Tools und Multi-Model-Kollaboration auf der Basis der bestehenden XXAI Chat-Funktionalität hinzuzufügen. Interessierte Benutzer können auf diese Entwicklungen gespannt sein.