Google Gemini 1.5 AIモデルの再進化：低コスト、性能向上、そして高速応答

2024-11-08

グーグルのGemini 1.5 AIモデルは進化と更新において大幅な向上を遂げ、2つの新しいモデル、Gemini-1.5-Pro-002とGemini-1.5-Flash-002を発表しました。これらの新しいモデルは出力の質と効率を向上させ、ユーザーにより正確で効率的なサービスを提供するだけでなく、使用コストを大幅に削減し、経済性にも優れています。また、これらの更新により、ユーザーにはより高いレート制限が提供され、大量のデータを処理する際によりスムーズで迅速な体験ができます。全体として、Gemini 1.5の更新はAIモデルの性能を向上させるだけでなく、ユーザーにより大きな価値を創造しています。

了解Gemini 1.5 AIモデルの進化

機能再進化

Gemini-1.5-Pro-002の機能:

与えられた情報の大量のコンテンツをシームレスに分析、分類、要約できる機能。
動画を含む異なるモダリティに対して高度に複雑な理解と推理タスクを実行できる。
長いコードブロックに対して関連性の高い問題解決タスクを遂行できる。
コンテキストウィンドウが拡大しても高性能を維持できる。

Gemini-1.5-Flash-002の機能:

画像や動画から情報を抽出し、外部の知識と組み合わせて質問に答えるビジュアル情報検索。
画像や動画内の物体の細かい認識に関連する質問に回答する物体認識。
インフォグラフィック、グラフ、表、ウェブページなどから情報を抽出し、質問に回答するデジタルコンテンツ理解。
HTMLやJSONなどのフォーマットに基づいた構造化されたコンテンツ生成。
画像や動画に対する詳細な説明やキャプション生成。
記憶や検索を必要とせずに新しい情報を推論する推理能力。
音声ファイルを分析して要約、転記、質問応答を行う音声分析。
動画や音声を含む複数のメディア入力を同時に処理する多モード処理。

システム構成の再進化

更新されたフィルター設定:

Geminiチームは、ユーザーの指示に従いながら安全性を確保する能力を向上させ、引き続きGoogleのモデルに適用するための安全フィルターセットを提供します。本日発表されたモデルにはデフォルトではこれらのフィルターは適用されません。開発者はそれぞれの使用事例に最適な設定を決定することができます。

Gemini 1.5 Flash-8B Experimental:

8月に発表されたGemini 1.5モデルの更なる改良版、「Gemini-1.5-Flash-8B-Exp-0924」をリリースします。この改良版はテキストと多模式の使用例において顕著な性能向上を遂げています。Google AI StudioおよびGemini APIを通じて利用可能です。

Gemini 1.5モデル再進化の利点

速度制限が高い

Gemini-1.5-Pro-002とGemini-1.5-Flash-002のAIモデルは、ユーザーの使用制限を増加させます。1分あたり2,000リクエスト（RPM）が提供され、1.5 Proモデルは1,000 RPMを提供します。

出力速度が高く、遅延が減少しました

最新のモデルのコア改良に加えて、過去数週間にわたり、1.5 Flashを通じて遅延を減らし、毎秒の出力トークン数を大幅に向上させることで、最強のモデルを活用した新しいユースケースを実現しました。

より高い性能

より挑戦的なMMLU-Proベンチマークテストでは、モデルの性能が約7%向上しました。MATHおよびHiddenMathベンチマークテストでは、数学の性能が著しく20%向上しました。視覚およびコード関連のタスクでも改善が見られ、視覚理解およびPythonコード生成の評価で2-7%向上しました。

コスト低減

最も強力な1.5シリーズモデルであるGemini 1.5 Proでは、入力トークン価格が64%引き下げられ、出力トークン価格が52%引き下げられ、インクリメンタルキャッシュトークン価格が64%引き下げられました。これらの変更は2024年10月1日から有効であり、128Kトークン未満のプロンプトに適用されます。さらに、コンテキストキャッシュも加えることで、Geminiを使用したコストをさらに削減します。Claude3.5、GPT、dalle3などの強力なモデルやXXAIと同様に、このモデルも利用コストが低く、価格競争力が非常に高いです。

その他の改良:

Googleは8月に発表されたGemini 1.5実験モデルも改良し、Gemini-1.5-Flash-8B-Exp-0924のアップグレード版をリリースしました。ユーザーはGoogle AI Studio、Gemini API、およびVertex AIを通じて新しいGeminiモデルにアクセスできます。

結論:

Gemini 1.5シリーズモデルは、さまざまなテキスト、コード、マルチモーダルタスクにおいて卓越した性能を発揮するよう設計されています。Gemini 1.5モデルの継続的な進化は、AIを活用して創造、発見、構築するための新たな可能性を開拓することを目的としています。全体として、モデルの品質が向上し、数学、長期的なコンテキスト、視覚分野で大きな進歩を遂げました。

Gemini 1.5 FlashとGemini 1.5 Proの違い

人工知能の展望：OpenAIとGoogleの革新