DeepSeek将利用华为AI芯片而不是NVIDIA培训小型AI模型,因为该公司试图减少其对NVIDIA处理器的依赖。随着DeepSeek正在测试各种制造商的新AI GPU加速器,这种转变是出现的。
根据DeepSeek的说法,DeepSeek计划为其较小的AI模型采用华为芯片。该计划旨在减少公司对NVIDIA的依赖。 DeepSeek目前正在评估来自华为,Baidu和Cambricon的新的AI GPU加速器,用于培训模型,而不是其AI R2版本。
DeepSeek打算继续为其R2 AI大语言模型(LLM)继续使用NVIDIA处理器,将其视为其当前产品的可靠来源。该公司以前正在考虑其下一代AI推理模型的上升处理器,但可能会推迟该计划。
DeepSeek通过即将推出的R2 AI模型遇到了挑战。尽管华为的工程支持,开发问题导致了R2 AI模型的发布推迟。现在预计今年晚些时候,R2 AI模型的首次亮相。
DeepSeek依靠Nvidia的芯片组来构建功能更强大的R2 AI推理模型。同时,它将使用华为上升处理器进行训练和完善R2模型的较小迭代。该公司尚未为使用华为AI芯片驱动的LLM技术的消费者平台指定首次亮相日期。
NVIDIA发言人说:“比赛无可否认。世界将为运行最受欢迎的应用程序和开源车型选择最好的技术堆栈。要赢得AI竞赛,美国行业必须赢得包括中国在内的各地开发人员的支持。”





