数日以内に、OpenAIとAnthropicがそれぞれ最新のフラッグシップモデル、GPT-4.5とClaude Sonnet 3.7を発表しました。モデル間の競争は再び緊張し、刺激的です。
GPT-4.5とClaude Sonnet 3.7は、先進的なAIの二つの異なるビジョンを代表しています。一方はコスト効果と簡素な性能を優先し、もう一方は推論の透明性とマルチモードの能力を重視しています。
OpenAIはGPT-4.5をこれまでで最大かつ最良のチャットモデルと称しています。GPT-4.5は、推論を必要とせずにパターンを認識し、関連性を築き、創造的な洞察を生み出す能力を向上させました。ユーザーとのインタラクションは、より自然に感じられるでしょう。GPT-4.5は知識ベースが広範で、ユーザーの意図を追跡する能力が強化されており、感情的知性も高く、執筆、プログラミング、実際の問題解決などのタスクに非常に有用です。
Claude 3.7 Sonnetは、プログラミングとフロントエンドWeb開発において特に顕著な改善を示しています。Claude 3.7 Sonnetは通常のLLMモデルでありながら、推論モデルでもあります。ユーザーはモデルに標準的な回答をさせるか、回答前により長く考えさせるかを選ぶことができます。標準モードでClaude 3.7 SonnetはClaude 3.5 Sonnetのアップグレード版であり、拡張思考モードでは回答前に自己反省を行い、数学、物理、指示遵守、プログラミング、その他多くのタスクにおけるパフォーマンスを向上させます。
ユーザーがより良い選択をするために、Claude 3.7 SonnetとGPT-4.5のコスト、コンテキストアーキテクチャ、速度、ベンチマーク性能などの主要な違いを比較します。
GPT-4.5:毎百万入力トークンあたり約75ドル、毎百万出力トークンあたり約150ドル。
Claude 3.7:毎百万入力トークンあたり3ドル、毎百万出力トークンあたり15ドル。
Claude 3.7 SonnetはGPT-4.5よりもはるかに安価です。Claude 3.7 Sonnetに比べて、GPT-4.5の入力トークン価格は25倍、出力トークン価格は10倍も高いです。Claude 3.7 Sonnetは汎用モデルでありながら推論モデルでもあり、価格面で明確な選択肢があります。
GPT-4.5:改良された大規模トランスフォーマーモデルで、膨大なテキストで訓練され、改善された整合性、画像サポート、128kのコンテキストウィンドウを持っています。
Claude 3.7:迅速な応答とより深い思考過程の推論間で切り替え可能な「混合推論」設計を使用しています。200kの大規模コンテキストウィンドウと専用のコーディング最適化があります。
GPT-4.5:高度に最適化され、応答速度がGPT-4よりも早く、最大128kのトークンコンテキストを持っています。OpenAIとAzureから広く利用可能で、大規模な展開が簡単です。
Claude 3.7:簡単なクエリのための迅速な応答と複雑な問題への遅い拡張推論のための二つのモードを提供しています。200kのトークンコンテキストを処理でき、大型ドキュメントに適しています。
GPT-4.5:知識テスト(MMLU)スコアは約89-90%。強力な汎用的な正確性と推論能力を持っていますが、高度な数学やプログラミングタスクでは専門モデルよりも若干劣ります。
Claude 3.7:コーディング能力が優れており(専門的コーディングベンチマークで70%以上)、特定の数学データセットでは96%のスコアを得ています。MMLUでのスコアは約80%で、段階的な推論で優れたパフォーマンスを示します。
Claude 3.7 Sonnetは、コーディングにおいて明らかにGPT-4.5よりも優れています。数学はClaudeの得意分野ではありませんが、GPT-4.5よりも優れたパフォーマンスを示しています。
XXAIはClaude 3.7 SonnetとClaude 3.7 Sonnet(thinking)を発表しすぐにそれをXXAIプラットフォームに統合しました。現在、XXAIには15の人気AIモデルが含まれており、使用する際には好きなモデルに自由に切り替えることができます。もし無制限にClaude 3.7を利用したいのであれば、XXAIを試してみてはいかがでしょう。
分析結果は、GPT-4.5は技術の進化における中間地点であり、革命的な飛躍ではないことを示しています。幻覚の減少と対話プロセスの最適化において進展があるが、その価格戦略は広く疑問視されています。GPT-4.5の価格は約75倍高く、実際の性能向上に見合ったものではないように思われます。
これに対してClaude 3.7 Sonnetは、リーズナブルな価格構造、高効率な処理能力、優れた論理推論によってプログラミング分野でリーダーシップを確立しています。
AI分野は急速な変革期にあり、GPT-4.5はOpenAIの構想の中で戦術的な調整に過ぎない可能性があります。今後の変革的な革新を注視し続ける必要があります。