Meta发布Llama 4系列大模型:Scout、Maverick、Behemoth正式亮相,MoE架构成最大亮点

lin james
2025-04-09
Share :

Meta在这场AI竞赛中打出了一张王牌。2025年4月6日,Meta正式发布了全新的Llama 4系列大模型,分别命名为Llama 4 Scout、Llama 4 Maverick,以及仍在训练中的庞然大物Llama 4 Behemoth。名字够有气势,技术实力也同样不容小觑。

本次更新最大的亮点在于:Meta首次引入了“专家混合架构”(Mixture of Experts,简称MoE),可能会彻底改变我们对AI模型效率的认知。

image.png


什么是Llama 4?有哪些新突破?

Llama 4系列不仅更大更快,更聪明也更高效。通过引入海量未标注的文本、图像,甚至视频数据进行训练,这些模型具备了更强的多模态理解能力,为未来的通用AI奠定了基础。

目前在Hugging Face上已经开放的有:

  • Llama 4 Scout​:仅需一张NVIDIA H100 GPU即可运行

  • Llama 4 Maverick​:需使用H100 DGX AI平台或同等级硬件

  • Behemoth​:还在训练中,尚未开放

    image.png


MoE架构:让大模型更聪明也更省力

Llama 4是Meta首批采用“专家混合架构”的模型。简单来说,可以把它理解为一个“专家智囊团”:每次用户提问,只有最合适的几个“专家”会被激活。

这样设计的优势在于:

  • 提高训练与响应速度
  • 每次推理调用的参数更少,资源更节省
  • 更善于处理复杂、专业化任务

具体数据如下:

  • Maverick​:总参数4000亿,但每次仅激活128个专家中的17亿参数
  • Scout​:总参数1090亿,每次仅激活16个专家中的17亿参数

这种“动态路由”的机制,让模型即使体量庞大,也能以较低成本实现高性能。


它们是“推理型”模型吗?

还不是。与OpenAI的GPT-4o或o3-mini不同,Llama 4系列目前仍不属于严格意义上的“推理型”模型。这意味着:

  • 响应速度更快
  • 在涉及事实核查的任务中可能不够稳定

不过,它们在创作类任务上的表现依然非常强劲,足以胜任大部分生成需求。


性能对比:Llama 4与其他主流大模型谁更强?

根据Meta内部测试:

Llama 4 Maverick作为通用型AI助手,在以下任务中表现突出:

  • 创意写作
  • 编程生成
  • 多语言翻译
  • 超长文档摘要
  • 基于图像的理解任务

在Meta的基准测试中,Maverick优于:

但仍略逊于以下顶级模型:

Scout则更适合:

  • 文档摘要

  • 大型代码库分析

  • 超长上下文推理(支持长达1000万个tokens)

    image.png


Behemoth:参数规模高达2万亿的AI巨兽

最后,是那个还在“烤炉里”的Behemoth。尽管还未正式发布,但已备受关注:

  • 总参数:2万亿
  • 活跃参数:2880亿(共16位专家)
  • 在数学、STEM领域和复杂推理任务上表现优异

在Meta的内部基准测试中,Behemoth超过了:

  • GPT-4.5
  • Claude 3.7
  • Gemini 2.0 Pro

但仍未能超越当前的顶级大模型:Gemini 2.5 Pro。


对开发者和AI用户意味着什么?

不论你是AI开发者、研究人员,还是重度AI写作用户,Llama 4的发布都代表着一个新的可能性:

  • Scout支持单卡运行,降低本地部署门槛
  • Maverick是对闭源模型(如GPT-4)的有力挑战
  • Behemoth或将在科研、教育、STEM领域引发重大突破

Scout和Maverick目前已在Hugging Face上线,感兴趣的用户可以马上动手尝试。

image.png


XXAI:体验Llama 4的理想平台

想要第一时间上手体验Meta的Llama 4模型?XXAI是一个便捷高效的选择。作为一个支持多模型接入的AI平台,XXAI即将支持包括Llama 4 Scout和Maverick在内的新模型,同时也提供GPT-4、Claude 3.7等强大模型的使用权限。

选择XXAI的理由:

  • 价格亲民​:每月仅需9.9美元起,轻松体验前沿AI模型
  • 多模型无缝切换​:无论是写作、编程还是科研任务,都可一键切换最合适的模型
  • 持续更新​:紧跟大模型发展步伐,第一时间接入新技术

如果你想亲手体验Llama 4的强大能力,XXAI会是一个高性价比、上手快的好平台。


写在最后

Meta这波操作,毫无疑问是在全力追赶甚至试图超越AI行业的领跑者。通过引入Mixture of Experts架构,Llama 4不再只是“更大”的模型,而是一个“更聪明”的存在。

Llama 4是否能真正挑战AI领域的头部选手还需时间检验,但有一点可以确定:Meta这只“羊”,已经不再是温顺的角色。

而你,也可以通过XXAI站上这股AI新浪潮的前排,亲自感受每一轮技术革新的脉动。