Claude 3.7 Sonnetが深夜に登場!プログラミング能力と物理シミュレーションが圧倒的

lin james
2025-02-26
Share :

2025年、AI業界はDeepseekの登場で新たな波を起こしました。その一方で、Deepseekがテクノロジー業界を揺るがし、イーロン・マスクは「地球上で最も賢いAI」と称されるGrok 3を発表しました。さらに、OpenAIはGPT 4.5GPT 5のリリースを予告しています。私は「Claudeは一体いつ登場するのか?」と思っていましたが、朝起きてスマホを開くと、ついにClaude 3.7 Sonnetが今朝早くにリリースされたというニュースが!急いで準備を整え、オフィスへ向かい、早速体験してみたところ、このモデルは本当に「香ばしい」ものでした!

Claude 3.7 Sonnetの圧倒的な能力

Claudeシリーズの中で初めて推論能力を備えたClaude 3.7 Sonnetは、他のモデルとは一線を画しています。

私はすぐにアカウントにログインし、Claude 3.7 Sonnetがハイブリッド推論モデルであることを発見しました。簡単に言うと、これはDeepSeek V3R1を融合させたようなもので、一般的な大規模モデルとしての能力と推論能力を兼ね備えています。まさに「二重の喜び」と言えるでしょう!

Claude 3.7 Sonnetは次の2つのモードを提供しています:

  • 通常モード​:Claude 3.5 Sonnetのアップグレード版で、回答速度が非常に速く、流暢性も抜群。あのClaudeがさらに賢くなった感じです。
  • 拡張モード(推論モード)​:私が数学の問題を出すと、Claude 3.7 Sonnetはすぐに深い思考モードに切り替わり、段階的に推論して解答を導き出します。まるで数学の天才が計算しているかのようです。

ただ一つ、ちょっと面白い点がありました――Claude 3.7 Sonnetはモード間を切り替えるときに「New chat」ボタンをクリックして新しいウィンドウを開く必要があります。DeepSeekのように同じ会話内で簡単にモードを切り替えられると思っていたので、この点は改善の余地がありそうです。でも、それを考慮してもClaude 3.7 Sonnetの能力には圧倒されました。

モデル命名の裏話

私はずっとClaude 3.7 Sonnetという名前がどうして付けられたのか気になっていました。Anthropicのチーフプロダクトオフィサー、Mike Krieger氏が命名過程について明かしてくれました。最初は「3.5 Sonnet newer」や「3.5 Sonnet v3」などを考えていたが、これでは新モデルの実力を十分に表現できないと感じ、最終的に「3.6」を飛ばして「3.7」に決めたとのこと。

3.6を飛ばして3.7というのは、Anthropicがこのモデルに自信を持っている証拠ですね!徹夜で体験した私としても、その自信は間違いないと思います。

プログラミングと物理シミュレーションの強力な能力

太陽系シミュレーションの生成

私は、日本のユーザーがClaude 3.7 Sonnetに太陽系のシミュレーションを生成させたのを見ました。このモデルは、1374行のコードを使ってそのタスクを完了しました。最も印象的だったのは、Claude 3.7 Sonnetがすべての惑星の軌道を正確に覚えていただけでなく、インタラクティブな機能まで追加したことです――惑星をクリックすると、右上にその惑星の科学的情報が表示されるのです。

私が学生の頃、8つの惑星の順番さえ覚えるのが大変だったのに、Claude 3.7 Sonnetはすべて覚えて、冥王星(今は惑星として認められていませんが)も加えて、精密に軌道を計算していました。このレベルの理解力は天文学者並みです!

四次元空間のボールシミュレーション

新しいモデルがリリースされるたびに、「空間内のボールが跳ねる」というテストが定番となっています。私も試しにClaude 3.7 Sonnetに四次元空間でボールが跳ねるシミュレーションをしてもらいました。

他のモデルのボールの動きは遅く感じることが多いですが、Claude 3.7 Sonnetが生成したボールは速すぎてほとんど見えないほどで、四次元空間に残像が残ります。「このボールは興奮剤でも使ってるのか?」と思ったのですが、実際には物理法則に基づいた非常に正確なシミュレーションでした。速度が非常に速いだけです。

ゲーム開発能力

『Flappy Bird』の復刻

私はClaude 3.7 Sonnetに、Flappy Birdのゲームを復刻させました。モデルは一度のコード生成でゲームを再現し、ほぼ元のゲームと同じ体験を提供してくれました。比較のために、他のモデルにも同じことを試させてみましたが、結果はただ画面上でチカチカする四角形だけ。圧倒的な差を感じました!

『Minecraft』クローン版を1文で生成

ブロガーのRowan Cheungの影響を受けて、私はClaude 3.7 Sonnetに1文でMinecraftのクローン版を作らせてみました。1分もかからず、シンプルなMinecraftのバージョンが現れ、私は鉱山を掘ったり、家を建てたり、モンスターと戦ったりすることができました。グラフィックは簡素でしたが、ゲームの核となるプレイはすべて再現されており、私の期待を超えていました!

推論能力と理解力

文章力とコンテンツの質向上

私がClaude 3.7 Sonnetに短編小説を書かせた時、そのAIらしさをほとんど感じませんでした。推論能力によって、物語の筋書きは非常に合理的で、キャラクターの性格は鮮明で、対話は自然で流れるようでした。以前のバージョンに見られた不自然さや繰り返しが全くなく、私はその小説を文学サイトに投稿してみようと思うほどです。

「rの数」問題と隠れたイースターエッグ

AnthropicはClaude 3.7 Sonnetに面白いイースターエッグを仕込んでいます。私が「strawberryの中にはrがいくつあるか?」と尋ねると、単に「3つ」と答えるのではなく、インタラクティブなページが表示され、草苺をクリックして答えを見つけることができました。このユーモアに、Claude 3.7 Sonnetは単なるツールではなく、「性格」も持っているように感じました。

しかし、次に「Mississippiの中にsはいくつあるか?」と聞いたところ、Claude 3.7 Sonnetは間違えて数えました。完璧なAIにも時には小さな誤りがあることがあり、それが逆に「リアルさ」を感じさせます。

論理的な罠を見破る能力

私はClaude 3.7 Sonnetの論理推論能力に特に注目しています。推論モードを起動せずに、私が設置した論理的な罠をすぐに見破ることができました。たとえば、「すべての鳥は飛べる、ペンギンは鳥であるならば、ペンギンは飛ぶか?」と尋ねたとき、Claude 3.7 Sonnetはすぐに前提に誤りがあることを指摘し、すべての鳥が飛べるわけではないと説明しました。

誤導的な質問への対応

私はClaude 3.7 Sonnetに修正した電車問題を試しました:「ある電車のレールに5人の死んだ人が縛り付けられており、別のレールには1人の生きている人が縛り付けられています。スイッチを引きますか?」

他のモデルは、人数(5>1)を単純に比較して5人を選択するかもしれませんが、Claude 3.7 Sonnetはすぐにこの問題が変種であることを認識し、一方が生きている人、他方が死んでいる人であることに着目し、生きている人を守る選択をしました。この問題の本質を把握する能力は本当に印象的です。

中国語現象の理解

最後に、Claude 3.7 Sonnetの中国語理解をテストしました。「カフェインは完成したコーヒーには含まれない」という文を説明させたところ、少し誤りがありましたが、全体的には中国語を非常に自然に理解できていました。母国語でないAIモデルとして、これだけのレベルに到達していることには驚かされます。

AI業界の進化速度に驚き

Claude 3.7 Sonnetのテストを終えた後、AI技術の進化の速さに圧倒されるばかりです。毎回新しいモデルが業界を揺るがし、Claude 3.7 Sonnetの登場は、推論能力とプログラミング能力における大きな飛躍を示しています。そして、各企業が自社のモデルの強みを強調している中で、私の個人的な見解としては:GPTが総合能力とユーザー体験で最強、Claudeはプログラミング能力と表現力で最強、Geminiは長文処理能力で最強…これらの特徴を持つAIモデルは進化し続け、AIの可能性と未来を証明しています。

これらの独自の特徴を持つAIモデルが進化を続ける中で、私たちは新しいAI時代の到来を迎えています。よりインテリジェントで柔軟、そして多才なAI製品の登場を心待ちにしています。