OpenAI推出o1-preview:解决复杂问题的新一代推理模型

xx
2024-11-08
Share :

OpenAI很高兴宣布发布o1-preview模型系列,这款新系列AI模型旨在通过在回复前花费更多时间思考来解决复杂问题。这些模型能够通过推理来应对具有挑战性的任务,比之前的模型在科学、编程和数学方面解决更难的问题。 image.png

新模型功能和应用

o1-preview模型被设计成像人类一样在回答之前花费更多时间思考问题。它们能够通过反复训练来完善其思维过程、尝试不同策略并识别自己的错误。今天标志着这一系列中首款模型的发布,未来计划定期更新和改进。

模型的工作原理

OpenAI团队通过训练这些模型来增强其解决问题的能力,使其在答复之前花费更多时间进行思考。在测试中,即将推出的模型更新在物理、化学和生物学等高难度基准任务中表现得与博士生相当。令人惊讶的是,该模型在数学和编程方面表现出色——解决了83%的国际数学奥林匹克(IMO)问题,并在Codeforces编程竞赛中达到了第89百分位。[ Video Game Coding with OpenAI o1]

功能限制

目前,早期模型缺乏一些使ChatGPT实用的功能,如网页浏览信息和文件或图像上传。然而,对于复杂的推理任务来说,OpenAI o1系列代表了AI能力的显著飞跃。

安全性

为了确保这些高级推理模型的安全性和对齐,OpenAI实施了一种全新的安全培训方法。这种方法使模型能够更有效地推理并遵守安全指南。在一个具有挑战性的“越狱”测试中,o1-preview模型得分84(满分100),而GPT-4o的得分是22。更多详细信息可以在OpenAI的系统卡片和研究帖子中找到。

为了与这些模型的新能力相匹配,OpenAI加强了内部治理并与联邦机构合作。这包括使用《准备框架》进行严格测试和评估、一流的红队测试以及由安全与安全委员会监控的董事会级审核流程。

OpenAI还与美国和英国的AI安全机构达成了正式协议,向它们提供该模型的研究版本的早期访问权限。这些合作伙伴关系为研究、评估和测试未来模型的发布前和发布后建立了一个流程。

目标受众

OpenAI o1模型增强的推理能力对于处理科学、编程和数学领域的复杂问题的用户来说特别有益。例如,医疗研究人员可以使用这些模型注释细胞测序数据,物理学家可以生成量子光学所需的复杂数学公式,开发人员可以构建并执行多步骤工作流程。

OpenAI o1-mini

OpenAI还推出了OpenAI o1-mini,这是一款专为编程设计的、更快且更便宜的推理模型。这款o1-mini模型比o1-preview便宜80%,为需要强推理能力但不需要广泛世界知识的任务提供了一种强大而经济的解决方案。 image.pngimage.png

XXAI的优势

XXAI无缝整合了GPT-4和Claude3.5模型,以满足不同用户的需求。每月仅需9.9美元,用户便可以利用这两个顶级模型的能力,使最先进的AI技术更加可及和负担得起。如果您想了解更多关于折扣的信息,请点击这里! image.png

如何使用OpenAI o1

从今天开始,ChatGPT Plus和Team用户可以在ChatGPT中访问o1模型。o1-preview和o1-mini都可以在模型选择器中手动选择,初期的额度限制为每周30条消息(针对o1-preview)和50条消息(针对o1-mini)。OpenAI正在努力增加这些限额,并使ChatGPT能够自动为每个提示选择合适的模型。 image.png

ChatGPT Enterprise和Edu用户将从下周开始访问这两款模型。

符合API使用层级5的开发者今天可以以每分钟20次请求的速率开始原型制作。这些限额将在进一步测试后逐步增加。这些模型的API目前不包括函数调用、流式传输、对系统消息的支持等功能。开发者可以查看API文档以开始使用。

OpenAI还计划在不久的将来为所有ChatGPT免费用户提供o1-mini访问权限。

接下来是什么

o1-preview的发布提供了这些推理模型在ChatGPT和API中的早期预览。OpenAI计划不断更新这些模型,并添加网页浏览、文件和图像上传等功能,以增强其实用性。此外,GPT系列和新的OpenAI o1系列中的模型开发和发布将继续进行。

XXAI还将密切关注行业更新,为用户带来最新颖的体验,请不要错过!