OpenAI、困難な問題を解決するための新しいレベルの推論モデル「o1-preview」を発表

xx
2024-11-08
Share :

OpenAIは、問題に回答する前により多くの時間をかけて考えることにより、複雑な問題に取り組むことができる新しいシリーズのAIモデル「o1-preview」のリリースを発表しました。このモデルは困難なタスクに対して推論し、以前のモデルに比べて科学、コーディング、数学においてより難しい問題を解決することができます。 image.png

新モデルの機能と応用

o1-previewモデルは、回答前に人間のように多くの時間をかけて考えるように設計されています。このモデルは広範なトレーニングを通じて思考プロセスを洗練し、異なる戦略を試し、ミスを認識することができます。本日、このシリーズの最初のモデルがリリースされ、将来的に定期的なアップデートと改良が予定されています。

モデルの仕組み

OpenAIチームは、回答前に問題を練り直すことでこれらのモデルの問題解決能力を強化するようトレーニングしました。テストでは、次回のモデルアップデートが物理、化学、生物学の難しいベンチマークタスクで博士課程の学生と同等の成績を収めました。特に、数学とコーディングでは卓越したパフォーマンスを発揮し、国際数学オリンピアード(IMO)の問題の83%を解決し、Codeforcesのコーディング競技で89パーセンタイルに達しました。.[ Video Game Coding with OpenAI o1]

機能の制限

現在、初期のモデルには情報のウェブブラウジングやファイル・画像のアップロードなど、ChatGPTを便利にするいくつかの機能が欠けています。しかし、複雑な推論タスクに対して、OpenAI o1シリーズはAI能力において大きな飛躍を遂げています。

安全性

これらの高度な推論モデルの安全性と整合性を確保するために、OpenAIは新しい安全トレーニングアプローチを導入しました。このアプローチにより、モデルは安全ガイドラインに従うための推論を行うことがより効果的になります。挑戦的な「脱獄」テストでは、o1-previewモデルは100点満点中84点を獲得し、GPT-4oの22点に比べて優れた成績を収めました。詳細はOpenAIのシステムカードと研究投稿で確認できます。

これらのモデルの新しい能力に合わせて、OpenAIは内部ガバナンスを強化し、連邦機関との連携を進めています。これには、「準備フレームワーク」を使用した厳格なテストと評価、最高レベルのレッドチーミング、および安全・セキュリティ委員会によるモニタリングを伴う取締役会レベルのレビューが含まれます。

OpenAIはまた、米国および英国のAI安全機関と正式な契約を締結し、研究版モデルへの早期アクセスを提供しています。これらのパートナーシップにより、公開前後のモデルの研究、評価、テストのプロセスが確立されました。

対象ユーザー

OpenAI o1モデルの推論能力の向上は、科学、コーディング、数学の分野で複雑な問題に取り組むユーザーに特に有益です。たとえば、医療研究者はこれらのモデルを使用して細胞シーケンシングデータに注釈を付けることができ、物理学者は量子光学に必要な複雑な数式を生成し、開発者は多段階のワークフローを構築して実行することができます。

OpenAI o1-mini

OpenAIはまた、コーディング専用に設計された、より速く、より安価な推論モデル「OpenAI o1-mini」を発表します。このo1-miniモデルはo1-previewモデルよりも80%安価であり、強力な推論が必要であるが広範な世界知識が必要ないタスクに対して強力でコスト効果の高い解決策を提供します。 image.pngimage.png

XXAIの利点

XXAIは、さまざまなユーザーの要件に対応するために、GPT-4およびClaude3.5モデルをシームレスに統合します。月額わずか9.9ドルで、ユーザーはこれら2つのトップティアモデルの能力を活用できます。これにより、最先端のAI技術がよりアクセスしやすく、手頃な価格で提供されます。ディスカウントについての詳細を知りたい方は、こちらをクリックしてください! image.png

OpenAI o1の使用方法

本日より、ChatGPT PlusおよびTeamユーザーはChatGPTでo1モデルにアクセスできます。o1-previewおよびo1-miniはモデルピッカーで手動で選択でき、最初のレート制限は週30メッセージ(o1-preview)および50メッセージ(o1-mini)に設定されています。OpenAIはこれらの制限を増やし、ChatGPTが各プロンプトに適したモデルを自動的に選択できるようにする計画です。 image.png

来週からは、ChatGPT EnterpriseおよびEduユーザーもこれらのモデルにアクセスできるようになります。

API使用階層5に該当する開発者は、本日から1分あたり20RPMのレート制限で両モデルのプロトタイピングを開始できます。これらの制限はさらなるテストの後に増加する予定です。現在、これらのモデルのAPIには関数呼び出し、ストリーミング、システムメッセージのサポートなどが含まれていません。開発者はAPIドキュメントを参照して開始できます。

OpenAIは、近い将来にすべてのChatGPT無料ユーザーにo1-miniアクセスを提供する予定です。

今後の展望

o1-previewのリリースは、ChatGPTおよびAPIにおけるこれらの推論モデルの早期プレビューを提供します。OpenAIはこれらのモデルを継続的に更新し、ウェブ閲覧、ファイル、画像のアップロードなどの機能を追加して実用性を向上させる計画です。さらに、GPTシリーズおよび新しいOpenAI o1シリーズのモデル開発とリリースも続けていきます。

XXAIはまた、業界の最新情報に注目し、ユーザーに最先端の体験を提供し続けます。お見逃しなく!