Qwen3显示开放型号仍然可以与封闭巨头竞争

阿里巴巴发行 Qwen3是该公司在周一声称的AI模型家庭，有时在周一匹配Google和Openai的最佳模型。该型号的规模从6亿参数到2350亿个参数，可从AI开发平台的“打开”许可下下载拥抱脸和 github。

QWEN3模型被描述为“混合”，因为它们可以花时间通过复杂的问题或快速回答更简单的请求来“推理”。这种推理能力使模型能够有效地检查自己，类似于OpenAI的O3模型，但延迟较高。根据QWEN团队的说法，他们“具有无缝整合的思维和非思考模式，为用户提供了控制思维预算的灵活性。”

一些QWEN3模型采用了专家（MOE）体系结构的混合，这对于回答查询更有效。 Moe将任务分解为子任务，并将其委派给较小的专业“专家”模型。这些模型支持119种语言，并在近36万亿代币的数据集上进行了培训，包括教科书，问答对，代码片段和AI生成的数据。

阿里巴巴声称与其前身Qwen2相比，Qwen3的功能大大提高。最大的QWEN3模型，QWEN-3-235B-A22B，在基准评估方面竞争性能，击败了OpenAI的O3-Mini和Google的Gemini 2.5 Pro在CodeForces上，这是一个用于编程比赛平台的CodeForces。它还在最新版本的Aime（一个具有挑战性的数学基准）和BFCL上胜过O3-Mini，这是评估模型推理问题能力的测试。

尽管QWEN-3-235B-A22B尚未公开可用，但最大的公共QWEN3模型QWEN3-32B仍然与多种专有和开放的AI模型竞争。 QWEN3-32B在几个测试中超过了OpenAI的O1模型，包括编码基准LiveCodeBench。阿里巴巴说，QWEN3在按照说明和复制特定数据格式的情况下擅长工具称呼功能。

AI Cloud Host Baseten的联合创始人兼首席执行官Tuhin Srivastava指出，Qwen3是开放式模型与OpenAI等封闭式系统保持同步的另一个例子。他补充说，尽管美国对中国的筹码销售限制了QWEN3这样的模型，但可能会在国内使用。

QWEN3可供下载，并通过云提供商，包括烟花AI和双曲线。

特色图像信用

Tags: QWEN 阿里巴巴

Qwen3显示开放型号仍然可以与封闭巨头竞争

Related Posts

奥特曼打破反广告立场 "赞助的" ChatGPT 答案下方的链接

DeepSeek 在 V4 之前在 GitHub 更新中揭示了 MODEL1 架构

英业达警告 H200 芯片在中国延迟上市，英伟达股价下跌

全球手机出货量下降 20%，一加面临拆解索赔

苹果将通过隐藏 Face ID 传感器来缩小 iPhone 18 Pro Dynamic Island 尺寸

Lehane 确认 OpenAI 将于 2026 年底推出首款消费级硬件

Recent Posts

Recent Comments

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

Qwen3显示开放型号仍然可以与封闭巨头竞争

Related Posts

奥特曼打破反广告立场 "赞助的" ChatGPT 答案下方的链接

DeepSeek 在 V4 之前在 GitHub 更新中揭示了 MODEL1 架构

英业达警告 H200 芯片在中国延迟上市，英伟达股价下跌

全球手机出货量下降 20%，一加面临拆解索赔

苹果将​​通过隐藏 Face ID 传感器来缩小 iPhone 18 Pro Dynamic Island 尺寸

Lehane 确认 OpenAI 将于 2026 年底推出首款消费级硬件

Recent Posts

Recent Comments

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

Follow Us

苹果将通过隐藏 Face ID 传感器来缩小 iPhone 18 Pro Dynamic Island 尺寸