在人工智能竞赛中消费的行业中,公司正在争先恐后地避免被抛在后面。然而,人们对错过的恐惧导致许多人在忽略基本面的同时追逐浮华的趋势,这是一个行业老兵称之为“疯狂”的实践。
斯坦尼斯拉夫·彼得罗夫(Stanislav Petrov),高级数据科学家 Capital.com 有十多年的经验,认为成功的关键不是采用最新的,最炒作的模型,而是促进“数据理智”文化。对于企业而言,这意味着优先考虑明确的目标和质量数据,而不是AI潮流的魅力。
挑战是重大的。 根据Alation的2024年报告,惊人的87%的员工引用 数据质量 问题作为其组织无法满足数据和分析目标的主要原因。
彼得罗夫告诉我:“当前AI繁荣的中心悖论是我们对结果的痴迷,同时忽略了来源。” “尽管令人兴奋,但成功的AI或数据科学项目的最关键因素仍然是输入数据的质量和相关性,但是由于这是不性和最困难的部分,因此通常会被忽略。”
为了解决这个问题,彼得罗夫在任何项目开始之前就支持一个简单但严格的框架:业务目标是什么?潜在的业务影响是什么?我们是否有数据实现?
他说:“如果那些没有明确的回答,我们就不会前进。”
蓝图撞击
彼得罗夫指出,开发客户寿命价值或CLV模型是这种行动中这种理念的主要例子。目标不仅是为了构建一种预测算法,还要解决核心业务需求:优化营销预算。
彼得罗夫说:“目标是在早期阶段了解活动或广告创意的预计表现,并相应地调整支出。”他指出,此类模型对于现代自动化策略至关重要,例如基于价值的竞标在Google Ads之类的平台上,这些平台依赖于预测的用户价值。
虽然当前的AI时代以复杂的神经网络为主,但彼得罗夫说,对于CLV等结构化数据问题,建立的方法通常效果最好。
彼得罗夫说:“一种梯度提升方法对结构化数据很好地效果很好。
最终,也许最重要的一步是确保实际使用该模型。他强调,影响测量通常需要复杂的技术(例如因果影响分析),以证明在简单的A/B测试不可行时证明了模型的价值。
彼得罗夫说:“这种模型的价值不仅在于其技术优点,还在于影响实际决策,跨系统扩展并适应业务需求的能力。”
导航不断发展的景观
这种务实的方法是必不可少的,因为数据科学家面临越来越多的逆风,特别是根据新的隐私法规和第三方饼干的长期以来的死亡。
Google正在计划为所有Chrome用户淘汰第三方Cookie的计划,此举 Lotame的研究 发现62%的营销人员认为会对他们的广告产生负面影响。
彼得罗夫认为这不是一个事件,而是一个需要适应的长期增量过程。
彼得罗夫说:“一个主要的转变是倾向于基于增量的框架和媒体混合建模,以了解频道的真正贡献,尤其是当直接路径归因分解时。”
这迫使数据和营销团队之间的整合更加紧密,更多地依赖于地理测试和概率建模等技术。
定义领导者的心态
在建立能够应对这些挑战的团队时,彼得罗夫认为,初级和高级数据科学家之间的区别不是一项技能,而是以所有权为中心的心态。
他说:“虽然大三学生可能会擅长执行精心策划的任务,但老年人是那些主动定义问题,吸引利益相关者并看到解决方案进行交付和迭代的人。”
他描述了任何希望成长的专业人员的关键认识:“关键的心态转变意识到’没有人会来告诉您该怎么做或正确的事。
对于彼得罗夫来说,这一课带来了经验。
他说:“写代码并不是工作中最难的部分,即使并不总是那么容易。” “真正的挑战是将其纳入产品,使其与业务需求保持一致,并说服利益相关者的价值。”
这种务实所有权的理念扩展到建立支持模型的基础架构,该领域称为MLOP。彼得罗夫倡导右尺寸解决方案,而不是建造过于复杂的“全功能平台”。
他说:“健壮的系统并不总是意味着最复杂的系统。” “在许多情况下,与关键模型输出和漂移指示器相关的简单,分布良好的日志记录和警报可以覆盖所需的80%。”
通过关注实际问题,质量数据和有形影响,彼得罗夫的信息很明显:在AI时代,一定剂量的理智可能是最有价值的算法。





