中国AI独角兽DeepSeek下一代模型的发布让业界一直猜测, V4和R2。 尽管人们对即将到来的农历新年期间可能推出的猜测强烈, 该公司拒绝就具体日期发表评论。
反而, 该公司正在用研究来说话。 最近几周, DeepSeek 发表了多篇技术论文,概述了绕过当前硬件限制的新方法。 由于美国制裁限制中国获得先进的 Nvidia GPU, DeepSeek 的最新研究重点是算法效率。
周二, 公司介绍“印迹,“一种条件内存技术,旨在解决 GPU 高带宽内存短缺问题——这是扩展 AI 的一个关键瓶颈。 在此之前,首席执行官梁文峰与人合着了一篇关于“流形约束超连接”(mHC)的论文, 旨在以更具成本效益的方式培训大规模系统的框架。
分析师认为,这些创新是尽管面临地缘政治阻力仍保持发展势头的战略举措。 “DeepSeek 只是想证明人工智能基础设施创新能够提高效率,“张瑞旺说, 北京信息系统架构师。
虽然 V3 和 R1 型号的后继型号的发布日期仍然是个谜, 该公司确认其核心团队完好无损。 一篇关于 R1 模型的更新论文指出,所有 18 名原始核心科学家仍然在公司工作, 挑战中国高行业流动率。





