中国初创公司Z.AI,以前称为Zhipu, 发行 该公司宣称的一种新的开源AI模型的运营成本低于DeepSeek。
Z.AI引入了三个不同的模型,作为本版本的一部分。旗舰产品被指定为GLM-4.5。除此之外,还提供了更轻巧的版本,名为GLM-4.5-Air。第三个模型GLM-4.5-Flash无需成本提供,专门设计用于编码任务,推理功能和各种基于代理的应用程序。
尽管这些模型与OpenAI,Google的Gemini和Anthropic的Claude AI等美国技术公司的产品具有功能相似性,但关键的区别在于GLM-4.5的完整开源性质。这种开源属性将其与目前在市场上可用的几种专有模型区分开来。
Z.AI被确定为几个“ AI Tigers”之一,该术语指的是中国人工智能公司,这些公司得到了中国政府的支持。 GLM-4.5的引入促成了来自中国的大量大语模型(LLM)。记录表明,GLM-4.5是近几个月内各种中国人工智能公司发布的1,509个大语模型之一。
尽管包括GLM-4.5在内的许多模型都提供开源和集成的开源系统,但某些考虑可能会影响西方国家用户的采用。一个主要问题涉及数据传输协议,因为已经观察到像DeepSeek这样的模型将用户数据传输回中国。这种做法产生了隐私的影响,特别是考虑到美国与中国之间的地缘政治动态。

OpenAI的全球事务团队先前在公开报告中发布了有关Z.AI和其他类似中国初创公司的警告。中国人工智能公司的持续进步也促使了美国的政策回应。例如,特朗普政府发布了“美国的AI行动计划”。本文档概述了旨在维持美国人工智能开发领域领导地位的策略。
该计划的目标包括减少对AI公司不必要的法规,并在政府运营中更广泛地整合AI技术。这些措施旨在促进创新并增强美国在全球AI景观中的竞争优势。
关于其他中国AI模型(例如DeepSeek)的观察表明,与中国有关的内容进行了审查的能力。这一方面表明,像GLM-4.5这样的AI模型可能会遇到在西方地区广泛采用的局限性,这主要是由于对数据隐私和内容审查制度的担忧。出现了倡导,建议用户谨慎行事或避免使用DeepSeek和类似模型。尽管GLM-4.5是一种开源模型,但有关其数据收集和利用的用户提供的控制程度仍然有限。
这个问题不是中国人工智能模型的独特之处。许多AI模型,无论其起源如何,都保留用户数据,并经常将其用于模型培训目的。尽管已经引入了某些以隐私为重点的AI模型,例如Proton的Lumo Chatbot,但主要技术公司对数据保留更广泛的挑战的全面解决方案尚未实现。大型技术公司归因于消费者数据所归因的重要经济价值表明,这种做法不太可能在不久的将来发生根本变化。
以下是共享基准:
| 基准 | GLM-4.5 | GLM-4.5-air | O3 | O4-mini-high | GPT-4.1 | Claude 4 Opus | 克劳德4十四行诗 | 双子座2.5 Pro | Qwen3 235b思维2507 | DeepSeek-R1-0528 | DeepSeek V3 0324 | Kimi K2 | Grok 4 |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| tau bench-Ortail | 79.7 | 77.9 | 70.4 | 65.6 | 75.1 | 81.4 | 80.5 | 77.0 | 71.9 | 63.9 | 74.7 | 73.9 | 76.5 |
| tau bench-airline | 60.4 | 60.8 | 52.0 | 49.2 | 48.8 | 59.6 | 60.0 | 48.0 | 58.0 | 53.5 | 40.4 | 51.2 | 58.4 |
| BFCL V3(完整) | 77.8 | 76.4 | 72.4 | 67.2 | 68.9 | 74.4 | 75.2 | 61.2 | 71.9 | 63.8 | 64.7 | 71.1 | 66.2 |
| 浏览 | 26.4 | 21.3 | 49.7 | 28.3 | 4.1 | 18.8 | 14.7 | 7.6 | 4.6 | 3.2 | 1.5 | 7.9 | 32.6 |
Z.AI的新模型的发布说明了人工智能领域中进化的快速速度,并突出了中国等国家在缩小美国先前持有的技术领先方面所取得的加速进步。这种发展有可能激励包括OpenAI在内的美国公司,以增强其现有的AI模型,并鼓励新兴的初创公司在各自产品中追求类似的进步。





