ついに、イーロン・マスクが率いるAI企業xAIが、最新のAIモデル「Grok 3」を発表しました。マスク氏は、Grok 3が前世代のGrok 2に比べて「10倍以上」性能が向上しており、「究極のリアリズム」を追求したAIであると述べています。このリアリズムは時に「政治的正しさ」と対立することもありますが、その魅力が際立っています。
数学的推論、科学的論理推論、コード生成の能力において、Grok 3はDeepSeek-v3、GPT-4o、Gemini-2 Proなどの他のAIモデルを上回る成果を上げています。マスク氏はGrok 3を「地球上で最も賢いAI」と自信を持って称賛し、その圧倒的な能力を証明しています。
xAIによると、Grok 3は複数の基準テストにおいてGPT-4oを超える結果を出しており、特にAIME(数学的問題に関するパフォーマンス評価)やGPQA(博士課程レベルの物理学、生物学、化学に関する問題解決能力)で優れたパフォーマンスを発揮しています。また、Grok 3はChatbot Arenaでも高い評価を得ており、これはユーザーが異なるAIモデルを比較し、投票で最良の回答を選ぶプラットフォームです。
Grok 3の性能は、Colossusスーパーコンピュータによって支えられています。このコンピュータは、わずか8ヶ月で建設され、10万台のNVIDIA H100 GPUを搭載し、2億GPU時間にわたるトレーニングを実施。これにより、データ処理のスピードが大幅に向上し、モデルの精度も飛躍的に向上しました。
ハードウェアだけでなく、ソフトウェア面でも最適化が行われています。トレーニングプロセスの改善、合成データセットの使用、自己修正機能、強化学習技術などが組み合わさることで、Grok 3はさらに優れたパフォーマンスを発揮します。
Grok 3の開発サイクルを大幅に短縮したのは、Colossusスーパーコンピュータの存在です。このスーパーコンピュータは、10万台のNVIDIA H100 GPUを活用し、2億GPU時間という圧倒的なトレーニング時間を記録しました。Grok 3の開発速度を加速させると同時に、データ処理と精度の向上を実現しました。
さらに、xAIはソフトウェアの最適化にも取り組み、合成データセット、自動修正、強化学習を駆使することで、Grok 3の性能を一段と向上させました。
Grok 3には、「Grok 3 Reasoning(推論)」および「Grok 3 Mini Reasoning」の2つのバリエーションが登場しました。これらは、OpenAIのo3-miniやDeepSeekのR1と同様に、問題を深く考える「推論型」のモデルです。推論モデルは、結果を出す前に徹底的な事実確認を行い、一般的にモデルが犯しやすい誤りを回避します。
xAIは、Grok 3 Reasoningが複数の主要なベンチマークテストで、o3-mini highバージョンを超えたと主張しています。特にAIME 2025という新しい数学基準テストでは圧倒的な強さを見せています。ユーザーは、Grokアプリを通じて推論モードを利用でき、複雑な問題には「Big Brain」モードを使って、より深く慎重に思考することが可能です。xAIは、このモードが数学、科学、プログラミングに最適であると述べています。
XプラットフォームのPremium+サブスクライバーは、最初にGrok 3を体験できます。その他の機能は、SuperGrokという新しいサブスクリプションサービスに統合されます。SuperGrokは月額30ドル、または年額300ドルで提供され、追加の推論機能やDeepSearch検索、無制限の画像生成機能が利用できます。
マスク氏はまた、Grokは「音声モード」を来週中にリリース予定であり、Grok 3とDeepSearch機能は数週間後にxAIの企業向けAPIに統合されることを明かしました。
AIの世界は本当に速く進化しています!DeepSeekが年初にR1モデルを発表し、今ではGrok 3の登場、さらにOpenAIはGPT 4.5とGPT 5の発表を予告しています。DeepSeekが低コストで高リターンを狙う一方、Grok 3は「大きな投資で大きな成果を狙う」アプローチを採用しています。20万枚のGPUを使ったGrok 3の圧倒的なパフォーマンスは、Scaling Lawが今なお有効であることを証明しています。
いずれにせよ、これはユーザーにとっては嬉しいニュースです。私たちはこれからもAIモデルがもたらす革新に期待しています。世界の進化を見守ることができることに、ワクワクしている人は多いはずです!私はすでにその日に向けて、両手を広げて準備万端です!