阿里巴巴 发行 Qwen3是该公司在周一声称的AI模型家庭,有时在周一匹配Google和Openai的最佳模型。该型号的规模从6亿参数到2350亿个参数,可从AI开发平台的“打开”许可下下载 拥抱脸 和 github。
QWEN3模型被描述为“混合”,因为它们可以花时间通过复杂的问题或快速回答更简单的请求来“推理”。这种推理能力使模型能够有效地检查自己,类似于OpenAI的O3模型,但延迟较高。根据QWEN团队的说法,他们“具有无缝整合的思维和非思考模式,为用户提供了控制思维预算的灵活性。”
一些QWEN3模型采用了专家(MOE)体系结构的混合,这对于回答查询更有效。 Moe将任务分解为子任务,并将其委派给较小的专业“专家”模型。这些模型支持119种语言,并在近36万亿代币的数据集上进行了培训,包括教科书,问答对,代码片段和AI生成的数据。

阿里巴巴 声称与其前身Qwen2相比,Qwen3的功能大大提高。最大的QWEN3模型,QWEN-3-235B-A22B,在基准评估方面竞争性能,击败了OpenAI的O3-Mini和Google的Gemini 2.5 Pro在CodeForces上,这是一个用于编程比赛平台的CodeForces。它还在最新版本的Aime(一个具有挑战性的数学基准)和BFCL上胜过O3-Mini,这是评估模型推理问题能力的测试。

尽管QWEN-3-235B-A22B尚未公开可用,但最大的公共QWEN3模型QWEN3-32B仍然与多种专有和开放的AI模型竞争。 QWEN3-32B在几个测试中超过了OpenAI的O1模型,包括编码基准LiveCodeBench。阿里巴巴说,QWEN3在按照说明和复制特定数据格式的情况下擅长工具称呼功能。
AI Cloud Host Baseten的联合创始人兼首席执行官Tuhin Srivastava指出,Qwen3是开放式模型与OpenAI等封闭式系统保持同步的另一个例子。他补充说,尽管美国对中国的筹码销售限制了QWEN3这样的模型,但可能会在国内使用。
QWEN3可供下载,并通过云提供商,包括烟花AI和双曲线。