DeepSeek是一家著名的中国人工智能公司,由于华为的上升筹码遇到了持续的技术困难,因此在发布其R2车型方面面临着意外的延误。中国当局鼓励DeepSeek利用NVIDIA的H20系统利用国内处理器。
尽管华为工程师在现场提供帮助,但DeepSeek仍无法使用Ascend Chips完成培训。因此,该公司依靠NVIDIA硬件来用于培训过程,同时部署了推理任务的上升芯片。这种双硬件方法强调了完全过渡到国内AI基础架构以进行复杂操作的挑战。
R2模型的发布会最初定于2025年5月推迟。这种延迟源于与上升芯片和更新的培训数据集的扩展数据标记要求相关的未解决的技术障碍。据报道,DeepSeek创始人Liang Wenfeng表达了对模型的发展进步的不满,这表明有必要额外的时间确保该模型可以维持DeepSeek的竞争地位。
竞争对手利用了DeepSeek的发展挫折。例如,阿里巴巴的Qwen3已集成了与DeepSeek相似的核心培训算法,同时提高了其自身系统的效率和灵活性。这一发展强调了AI生态系统内的快速发展,以及竞争对手利用各个初创企业遇到的困难的潜力。
北京针对人工智能自给自足的更广泛的战略倡议加剧了国内公司采用本地生产的硬件的压力。这种推动力旨在减少对外国技术的依赖,尤其是来自Nvidia等公司。但是,这种策略的实施揭示了将华为的芯片与NVIDIA的既定产品进行比较时,现有的稳定性,芯片间连接性和软件成熟度的差异。
NVIDIA强调了维持中国开发商访问权限的战略重要性,并指出对技术采用的限制可能会对经济和国家安全利益产生不利影响。中国人工智能公司正在浏览复杂的景观,平衡政府指令使用国内硬件与开发和部署大型语言模型的实际现实,这通常需要先进且可靠的处理能力。
尽管面临这些挑战,DeepSeek的R2车型仍可能在未来几周内发布。该模型最终的性能可能会受到审查,尤其是在针对使用更成熟和建立的硬件训练的竞争对手进行评估时。这种情况例证了国家政治目标,可用的技术能力和现实世界中AI部署的实际要求之间的持续紧张。





