此前,由于其先前的型号R1的成功,DeepSeek将加速其新的AI模型R2的推出,该车型最近在全球股票市场促使了1万亿美元的抛售,这是由于其对西方同行的竞争性能。
R1成功后,DeepSeek加速了R2 AI模型的启动
据熟悉该公司的三位消息人士称,这家总部位于杭州的初创公司最初旨在在5月初发布R2,但现在正在推动加速推广。预计新模型将增强编码功能,并支持英语以外的多种语言中的推理。 DeepSeek尚未对这些发展发表评论。
R1使用较低强大的NVIDIA芯片开发,它与美国主要科技公司创建的模型保持竞争力,这些公司已投资了数千亿美元的AI技术。 Zensar的首席运营官Vijayasimha Alilughatta表示,R2的发布可能会对AI行业产生重大影响,从而挑战了现有市场领导者的统治地位。
创始人和运营精神
DeepSeek的创始人Liang Wenfeng和他的定量对冲基金高潮的亿万富翁自2024年7月以来一直保持低调。前雇员将DeepSeek描述为像研究实验室更像是一项研究实验室,而不是传统的业务,其特征是与中国技术领域的等级结构相反。
梁安(Liang)从事智能成像的职业生涯,后来又管理了一个研究团队,他因聘请顶级算法工程师并培养协作环境而受到赞誉。员工指出,许多人工作了八个小时,感到有能力为关键项目做出贡献。 Liang在广泛的应用程序开发中强调了质量,并评论说避免了大量支出而支持精炼AI模型。
据报道,DeepSeek和高飞行员的赔偿是慷慨的;高飞行员的高级数据科学家每年可以赚取150万元人民币,显着高于竞争对手。高飞行者本身被认为是中国最高的量化基金之一,尽管该行业施加了监管压力,但仍负责管理数万元基金。
DeepSeek一次震撼了市场,这就是为什么它可能再次发生的原因
DeepSeek的竞争优势源于高级飞行者在研究和计算能力上的重大投资。 The firm allocated 70% of its revenue towards AI research, building two supercomputing AI clusters, including one consisting of 10,000 Nvidia A100 chips during 2020 and 2021. The Chinese government initially raised concerns about the massive chip acquisition but ultimately allowed operations to proceed, which later benefited DeepSeek when the US banned A100 chip exports to China in 2022.
由于对此类资源的竞争有限,DeepSeek吸引了领先的研究人员。具有成本效益的技术的应用,例如Experts(MOE)和Multihead潜在注意力(MLA),使公司能够降低计算成本,同时保持竞争力。根据伯恩斯坦分析师的说法,据估计,DeepSeek的定价比Openai的类似模型便宜20至40倍。
自从引入R1以来,西方科技巨头已经调整了策略,反映了OpenAI的价格降低以及Google引入折现访问层。 UST的基准测试指出,与OpenAI的缩放模型相比,R1通常需要三倍的令牌才能推理。
政府支持
DeepSeek已与中国政府受到青睐,Liang参加了与Premier Li Qiang的备受瞩目的会议,作为AI部门的代表。地方政府和几家国有企业已经开始整合DeepSeek的模式,这表明中国领导人的认可旨在证明比美国技术的优势。
由于隐私问题,DeepSeek的模型在包括韩国和意大利在内的某些国家 /地区的应用商店中删除的时期,这种崛起是出现的。专家警告说,如果DeepSeek成为中国国家实体的首选AI模型,西方监管机构可能会对AI技术出口和合作的限制加强做出反应。
Liang承认禁运对先进的AI芯片所面临的挑战,强调资金并不是DeepSeek的主要问题。
特色图片来源: Matheus Bertelli/Pexels