埃隆·马斯克的公司 xAI 发布了其最新的 AI 模型 Grok 3,该模型比Grok 2 有了显著改进。Grok3在很短的时间内实现了功能比Grok2强大一个数量级。与 Grok 2 相比,Grok 3 的训练数据增加了十倍,其性能超越或匹敌 ChatGPT、DeepSeek 和Gemini 等竞争对手。虽然Grok起步较晚,但在MMLU得分上以超快的速度追上了ChatGPT。
xAI正式推出最新的Grok 3模型后,埃隆•马斯克将其称为目前“地球上最聪明的AI”。
他为什么敢说这句话?我们先来看看xAI放出的测试成绩:
1.Grok 3和Grok 3 mini在数学、科学和编程基准测试上超越了所有主流模型,包括GPT-4o、Claude 3.5 Sonnet、DeepSeek-V3和Gemini-2 Pro等。
2.Grok 3推理模型的数学、科学和编程基准测试中也有非常好的表现。推理能力Grok-3 Reasoning Beta和Grok-3 mini Reasoning超越了类似的推理模型,包括DeepSeek-R1和OpenAI的o3 mini等。
从测试的数据结果我们可以看出,Grok 3和Grok 3 mini在多个基准测试中表现出色,超越了包括GPT-4o、Claude 3.5 Sonnet、DeepSeek-V3和Gemini-2 Pro等在内的多个主流模型。
xAI 还推出了与 Grok-3 协同工作的智能搜索引擎DeepSearch。这是xAI的第一代广泛代理工具,它不仅帮助工程师、研究人员和科学家编写代码,也能帮助每个人回答日常遇到的问题。
DeepSearch不仅可以搜索网页,查找现有资料,还可以推测用户的真正意图并加以思考,在经过交叉对比不同信源后,确保能够返回正确的信息。
我们来看看马斯克的演示:“下一次星舰发射的时间。”
DeepSearch可以进行思考,然后寻找网页新闻、X 平台帖子等进行分析汇总,然后给出回答。用户可以查看模型的推理过程,并支持研究和数据分析等任务。
DeepSeek、OpenAI ChatGPT 等模型都已经布局 AI 搜索引擎,可通过联网实时分析给出答案。我们可以看出AI 联网搜索正成为各大人工智能企业的热门业务领域。
Grok 3 将首先提供给X 上的 Premium+订阅者,他们是第一批获得访问权限的人。尚不清楚普通用户何时能用上。
因为模型仍在不断更新和改进中,苹果应用商店上线的Grok版本会相对落后,而网页版更新最为及时。据其透露,完善的版本,可能会在一周后推出。xAI团队还表明将会给Grok 3开发语音交互功能, 这可能是Grok 3 最好的体验之一。
马斯克确认计划开源 Grok 3,并在开发新版本时发布旧版本。而该模型的性别还未确定。
在全球AI领域竞争愈发白热化的背景下,Grok 3的推出引发了业界关注。特别是在中国新锐企业DeepSeek展示了其成本效益显著的模型,该模型在性能上可与OpenAI的GPT和o1/o3系列比肩之际,促使众多AI企业开始思考:单纯依靠增加计算资源和扩大模型规模的"扩展策略"是否仍然是最优解。
在2月初,谷歌就发布了一系列新模型,包括Gemini 2.0 Flash、Gemini 2.0 Flash-Lite以及新一代旗舰大模型Gemini 2.0 Pro实验版本。
而在Grok 3发布当日,奥特曼也X上表示,“对于高要求的测试者来说,试用GPT-4.5带来的感受AGI的体验,远比我预期的要深刻得多!”这似乎在预示着,GPT-4.5已经进入测试阶段,距离正式发布也不会太远了。
Anthropic也宣布将在近期推出Claude 4系列。
随着OpenAI、Anthropic、Meta 和 Google等公司不断推出更先进的AI模型,未来的AI之战仍将持续升温。而Grok 3能否真正超越竞争对手,成为地球上最聪明的AI,还有待市场的进一步检验。
随着Grok、ChatGPT, DeepSeek和Gemini模型的升级和推进,XXAI也在不断地更新和添加模型,致力于用户可以在XXAI一个平台就可以享受到所有模型的服务。
XXAI计划在本月推出web端。还将在原有的XXAI chat功能基础上,添加XXAI bot、XXAI tools和多模型协作功能。感兴趣的用户可以期待一下.