イーロン・マスクの会社xAIは、最新のAIモデルGrok 3を発表しました。このモデルはGrok 2に比べて、顕著な改善が見られます。Grok 3は、短期間でGrok 2の機能を一桁強化したものです。Grok 2と比較して、Grok 3のトレーニングデータは10倍に増加しており、その性能はChatGPT、DeepSeek、Geminiなどの競合他社を超えるか、匹敵しています。Grokは遅れてスタートしましたが、MMLUスコアではChatGPTに驚異的なスピードで追いついています。
xAIが最新のGrok 3モデルを正式に発表した後、イーロン・マスクはこれを「地球上で最も賢いAI」と呼びました。
彼がなぜそのように言うことができるのか、まずxAIが発表したテスト結果を見てみましょう。
Grok 3およびGrok 3 miniは、数学、科学、およびプログラミングのベンチマークテストで、GPT-4o、Claude 3.5 Sonnet、DeepSeek-V3、Gemini-2 Proを含むすべての主流モデルを超えています。
Grok 3の推論モデルは、数学、科学、プログラミングのベンチマークテストでも非常に良いパフォーマンスを示しています。推論能力であるGrok-3 Reasoning BetaおよびGrok-3 mini Reasoningは、DeepSeek-R1やOpenAIのo3 miniなどの類似の推論モデルを超えています。
テスト結果から、Grok 3とGrok 3 miniが複数のベンチマークテストで優れており、GPT-4o、Claude 3.5 Sonnet、DeepSeek-V3、Gemini-2 Proなどの複数の主流モデルを超えていることがわかります。
xAIは、Grok-3と連携して動作するインテリジェント検索エンジンDeepSearchも発表しました。これはxAIの初代広範なエージェントツールであり、エンジニアや研究者、科学者がコードを書くのを助けるだけでなく、誰でも日常的な質問に答える手助けをします。
DeepSearchは、ウェブを検索し、既存の情報を見つけるだけでなく、ユーザーの本当の意図を推測し、考察を行うことができます。異なる情報源を相互参照した後、正確な情報を返すことを保証します。
マスクのデモを見てみましょう:「次のスターシップの発射時間。」
DeepSearchは考えることができ、ウェブニュース、Xプラットフォームの投稿などを検索して分析し、まとめてから回答を出します。ユーザーはモデルの推論プロセスを確認でき、研究やデータ分析などのタスクをサポートします。
DeepSeek、OpenAIのChatGPTなどのモデルは、すでにAI検索エンジンの分野に参入しており、オンライン接続を通じてリアルタイムで分析して回答を提供します。AIによるオンライン検索が主要なAI企業の人気ビジネス分野になっていることが分かります。
Grok 3は、まずX上のPremium+サブスクライバーに提供され、彼らが最初のアクセス権を得ることになります。一般ユーザーがいつ利用できるかは不明です。
モデルは引き続き更新・改善されているため、Apple App Storeに登場するGrokのバージョンは相対的に遅れており、ウェブ版が最も迅速な更新を受けます。完成版はおそらく1週間後に登場する可能性があります。また、xAIチームはGrok 3の音声インタラクション機能の開発を計画しており、これがGrok 3の最良の体験の1つになるかもしれません。
マスクはGrok 3をオープンソースにする計画を確認し、新しいバージョンを開発する際には古いバージョンをリリースすると述べています。ただし、モデルの性別については確認されていません。
世界のAI市場がますます競争が激しくなる中、Grok 3の発表は業界の注目を集めています。特に、中国の新興企業DeepSeekがそのコスト効果の高いモデルを披露し、それがOpenAIのGPTやo1/o3シリーズと同等の性能を持つことが、夏の多くのAI企業に対し、単に計算資源を増加させ、モデルの規模を拡大する「スケーリング戦略」が最適解であるかどうか再考させるきっかけとなりました。
2月初旬、GoogleはGemini 2.0 Flash、Gemini 2.0 Flash-Lite、および次世代フラッグシップ大規模モデルGemini 2.0 Proの実験版を含む新しいモデルのシリーズを発表しました。
Grok 3が発表された同日、UltramanもX上で「高い要求を持つテスト者にとって、GPT-4.5を試用することで得られるAGIの体験は、私の予想よりもはるかに深いものでした!」とコメントしました。これは、GPT-4.5がテスト段階に入っており、正式リリースまでもう遠くないことを示唆しているようです。
Anthropicも、間もなくClaude 4シリーズを発表することを発表しました。
OpenAI、Anthropic、Meta、Googleなどの企業が新たに進化したAIモデルを次々と発表する中、今後のAI戦争はますますヒートアップするでしょう。Grok 3が本当に競合他社を超えて地球上で最も賢いAIになるかどうかは、市場のさらなる検証を待つ必要があります。
Grok、ChatGPT、DeepSeek、Geminiモデルのアップグレードと発展に伴い、XXAIもモデルの更新や追加を続けており、ユーザーがXXAI一つのプラットフォームで全てのモデルのサービスを享受できることを目指しています。
XXAIは今月、ウェブ版を発表する予定で、既存のXXAIチャット機能に加え、XXAIボット、XXAIツール、多モデル協力機能を追加する予定です。興味のあるユーザーは、これらの進展に期待が持てます。