DeepSeek v3.1竞争对手GPT-5与685b参数模型

2025年1月，中国人工智能初创公司DeepSeek推出了R1，这是一种AI模型，与Openai和Anthropic的顶级LLM相媲美。 DeepSeek以较少的NVIDIA芯片的价格建造的成本很少，现在已发布了V3.1的v3.1，该v3.1的更新是其旗舰V3型号的更新，价格为buttone openai，并针对中国制造的芯片进行了优化。

DeepSeek的v3.1是通过微信上的一条消息，中国著名的消息传递和社交应用以及在拥抱面孔平台上悄悄推出的。这一发展强调了当前AI景观中的几个关键叙述。 DeepSeek的努力是中国独立于外国技术发展和控制高级AI系统的雄心。

新的DeepSeek V3模型专门针对中国制造的芯片有效地进行了优化，这反映了中国朝着技术自力更生的战略发展。尽管美国公司表明不愿采用DeepSeek的模型，但它们在中国获得了相当大的吸引力，并且越来越多地在全球其他地区使用。一些美国公司甚至将DeepSeek的R1推理模型整合到其应用中。但是，研究人员警告说，这些模型的产出通常与中国共产党批准的叙述非常一致，这引起了人们对其中立性和可靠性的担忧。

中国的AI野心超出了DeepSeek，其中包括阿里巴巴的Qwen，Moonshot AI的Kimi和Baidu的Ernie在内。 DeepSeek最近的发布，紧随其后 OpenAI的GPT-5发布，强调中国对以或超越的速度或超越美国AI实验室的承诺。 GPT-5的推出未达到行业期望，进一步凸显了DeepSeek进步的重要性。

Openai首席执行官Sam Altman承认，包括DeepSeek在内的中国开源车型的竞争影响了Openai发布自己的开放式体重模型的决定。在最近与记者的讨论中，奥特曼表示，如果Openai没有采取此步骤，则AI景观可能会受到中国开源模型的主导。他强调，这种考虑是他们决策过程中的重要因素。

美国政府授予了NVIDIA和AMD许可证，将特定的AI芯片出口到中国，包括NVIDIA的H20。这些许可证是有条件的，这些公司同意将收入的15％从这些销售汇给美国政府。作为回应，北京已开始限制购买NVIDIA芯片的购买。这是在商务秘书霍华德·卢特尼克（Howard Lutnick）关于 CNBC 美国不会出售中国最好的，第二好甚至是第三最好的技术。

DeepSeek对中国制造的芯片的优化表明，采取了反对美国出口控制并减少对NVIDIA的依赖的战略举措。该公司在其微信中表示，新的模型格式已针对“即将发布的下一代国内芯片”进行了优化。

阿尔特曼（Altman）表示担心美国可能会低估中国在AI中进步的复杂性和意义。他警告说，仅出口控制可能不足以应对中国快速进步所带来的挑战。他表达了他对中国在人工智能领域日益增长的能力的担忧。

DeepSeek v3.1模型结合了主要对开发人员有益的技术进步。与许多封闭且更昂贵的竞争模型相比，这些创新旨在降低运营成本并提高多功能性。 v3.1具有6850亿个参数，将其置于顶级“边境”模型之列。它的“专家混合物”设计仅激活每个查询模型的一小部分，从而降低了开发人员的计算成本。与早期的DeepSeek模型不同，将需要即时答案与需要分步推理的任务分开，v3.1将这两个功能集成到一个系统中。

GPT-5以及来自Anthropic和Google的最新模型还具有此集成功能。但是，很少有开放式模型达到了这种集成水平。 TechTalks博客的创始人Ben Dickson将V3.1的混合架构描述为“迄今为止最大的功能”。

Lightning AI的创始人兼首席执行官William Falcon指出，即使v3.1的持续发展也不如早期的R1模型，DeepSeek的持续改进也值得注意。他说，该公司继续进行“非分支机构的改进”，这给人留下了深刻的印象。 Falcon预计，如果Openai开源模型开始显着滞后，将做出回应。他还指出，与OpenAI的版本相比，DeepSeek模型对于开发人员而言更具挑战性，这相对容易部署。

DeepSeek的发布凸显了对AI的越来越多的看法，这是美国和中国之间技术竞争的关键组成部分。中国公司声称以降低的成本建立出色的AI模型这一事实使美国竞争对手有理由仔细评估其在该领域保持领导地位的策略。

特色图像信用