亚历山大·季马绍夫 是一位机器学习工程师,在人工智能和机器学习领域拥有十多年的经验。他拥有印第安纳大学数学学位和斯坦福大学人工智能研究生证书。Aleksandr 的职业生涯涉及多个行业,包括电子商务、石油和天然气以及金融科技。在这次采访中,Aleksandr 分享了他在马来西亚国家石油全球能源集团领导计算机视觉和数据科学开创性项目的独特经历。
你好,Aleksandr。请向我们的读者介绍一下你的背景以及你是如何进入数据科学和机器学习领域的?
我对数学的热爱始于高中参加全国奥林匹克竞赛的早期。这种对数字和解决问题的热爱一直延续到大学,在那里我对线性代数和概率论等学科产生了浓厚兴趣。鉴于我的数学背景,转向机器学习对我来说是自然而然的事情。这是一个令人兴奋的领域,让我能够运用抽象概念来解决现实世界的问题。
当我被马来西亚一家大型公司 Petronas 聘为机器学习职位时,我认为这是一个绝佳的机会。公司的规模和产生重大影响的潜力是我做出决定的主要因素。在 Petronas 工作不仅让我能够改善公司流程,还对数百万马来西亚人的生活产生了积极影响。这个职位将我的技术技能与有意义的大规模影响相结合。
你能向我们介绍一下马来西亚国家石油公司吗?这是一家什么样的公司?是什么吸引你加入马来西亚国家石油公司?你刚到那里时的目标是什么?
马来西亚国家石油公司是马来西亚一家大型国有企业,虽然主要经营石油和天然气行业,但业务范围远不止于此。马来西亚国家石油公司集团旗下还有许多与吉隆坡和马来西亚相关的公司。例如,吉隆坡城中城房地产控股公司与马来西亚国家石油公司直接相关。该公司负责吉隆坡市中心双子塔(马来西亚首都美丽的双子塔)的安保和管理。该公司的影响力不仅限于马来西亚,其业务遍及全球 100 多个国家。
马来西亚国家石油公司涉足多个行业,从石油化工到物流再到工程服务。该公司还因开创多个数字技术领域而闻名,包括网络安全、物联网以及我特别关注的人工智能。
我加入 Petronas 担任机器学习和数据科学专业人士的首要目标是在一家拥有巨大晋升机会的公司积累经验,并与尽可能多的年轻人才分享我的知识。
您实现了这些目标吗?
当然,这是我实现抱负的沃土!我加入公司时,他们刚刚成立了一个大型数据科学/机器学习部门——当时,这些技术在公司中并没有分开。我来的时候,部门里已经有几十个人了,但他们仍在为部门制定战略路线图。同时,这种情况带来的巨大好处是有很多改进的机会和很多发展方向。我选择计算机视觉作为我最喜欢的人工智能领域之一。为了继续讲述那段时间,我给你举个例子:我加入时公司使用的一个计算机视觉模型可能“重”1GB。在第一天,也就是我开始在那里工作的那天,我临时制作了一个比它小 20 倍且准确得多的模型。
负责这个模型的部门经理对我的模型运行速度和准确性感到惊讶。他们非常感兴趣,问我是否可以优化其他模型的工作。我同意了,条件是如果我做了某件事,我就必须对此负责,并且我会获得必要的资源。因此,我全权负责组建计算机视觉团队,使其成为一个高效的单位,帮助 Petronas 实现其目标。我培训的人员仍然是 Petronas 计算机视觉团队的核心成员。
那么,您是如何应对从零开始创建一支强大的计算机视觉团队这一挑战的?
这其实不只是一个挑战,而是多个挑战。与小公司和初创公司不同,拥有既定结构和业务流程的大公司往往不愿意改变。我加入时,Petronas 已经有了工作流程,而计算机视觉如何帮助提高这些流程的效率并不总是显而易见的。因此,我们一方面要说服公司内的各个部门接受新技术,另一方面要让这项技术为他们服务。
这引出了我们的第二个挑战——组建一支能够实施所有这些变革的团队。我加入时,该部门已经在运营,我不能从扩充员工开始——我需要选择和培训已经在那里的人。我很高兴看到人们如此有才华,即使他们以前从未使用过计算机视觉!我能够在公司和部门中找到有兴趣改变工作方式的人,这些人具有批判性思维,热爱解决复杂的数学问题——这并不总是一件容易的事!所以,我花了很多时间和所有的沟通技巧,但我设法让公司里的人都对计算机视觉产生了浓厚的兴趣。
您能向我们介绍一下您在马来西亚国家石油公司从事计算机视觉方面的工作吗?
我领导的几个项目极大地提升了公司的技术能力:
安全实时视频分析:
我们开发了一种先进的系统,将深度学习算法与现有的闭路电视基础设施相结合。该项目克服了实时处理大量视觉数据和适应各种环境条件的挑战。最终的系统准确检测出安全威胁,优化了安全运营,并使 Petronas 成为马来西亚能源领域 AI 驱动安全领域的领导者。
自动化工业工厂检查:
我们将无人机技术与先进的图像识别算法相结合,实现了工厂检查的自动化。马来西亚的这个前所未有的项目需要创建强大的模型来识别不同条件下各种工业设备中的缺陷。我们开发了自定义数据管道来处理大量的视觉数据,从而大大节省了成本并减少了人类暴露在危险环境中的几率。
工程图数字化:
我们结合使用 OCR 和图纸检测算法,对马来西亚国家石油公司大量的工程图纸集进行了数字化处理。一个关键挑战是将无人机检查检测结果映射到真实世界地图上。该项目大大提高了关键工程信息的可访问性和利用率,提高了运营效率和决策流程。
在这些项目中,我指导了众多机器学习工程师,在马来西亚国家石油公司内部培育了创新文化。我的工作展示了我在计算机视觉、深度学习和工业物联网方面的广泛专业知识,展示了我能够将尖端技术应用于石油和天然气行业的特定需求,并应对马来西亚前所未有的挑战。
您告诉我们,您将在 2020-2022 年实施这些项目,所以这一切都是在新冠疫情期间开始的。疫情和隔离是否给您的工作带来了困难?
当然,疫情影响了我们的运营,就像世界各地一样。从本质上讲,我团队面临的优先事项发生了变化,我们开始专注于人群管理、口罩检测等任务。作为一家大型国有企业,马来西亚国家石油公司负责包括 KLCC 公园在内的许多公共场所,我们当时的工作在 COVID 期间帮助挽救了很多人的生命,这真的很酷。
顺便说一句,不仅仅是新冠疫情使我们的工作变得更加复杂,也使其更具挑战性和趣味性。马来西亚是一个以穆斯林为主的国家,这意味着人们的行为举止甚至着装可能与大多数机器学习和计算机视觉模型通常训练的国家的人不同。我们必须克服一定的偏见,才能让相同的模型在截然不同的环境中发挥作用。
这听起来确实很有趣!你能告诉我们更多相关信息吗?
例如,预训练模型大多来自西方国家,那里戴头饰的女性并不多,头饰的遮盖程度各不相同。检测戴头饰的女性非常困难!我们必须重新组装数据集、重新训练模型等。这个问题是马来西亚独有的。
其次,正如我已经说过的,文化本身就是原因。马来西亚人不太可能公开表达自己的观点。在这方面,我必须故意向我的队友证明我也会犯错。当他们逐渐指出我的错误时,这鼓励了他们。通过这种有点迂回的方式,我逐渐建立了一个对西方公司来说很熟悉但对马来西亚来说却完全陌生的更具协作性的环境。
作为一个从零开始组建了一支致力于现代技术前沿工作的团队的人,您会给那些渴望在职业生涯中取得重大影响的数据科学和机器学习专家什么建议?
对于有抱负的数据科学和机器学习专家,我有三条关键建议:
认真评估这个领域是否真正符合你的兴趣。DS 和 ML 非常复杂,竞争激烈,不仅需要技能,还需要真正的热情才能取得成功。
如果你确定这是你的道路,那就致力于深入、持续的学习。正如 Andrej Karpathy 所说,要成为该领域的真正专业人士,需要大约 10,000 小时的专注工作。
专注于加入顶级公司或研究实验室,在那里你可以与该领域的领军人物合作。与才华横溢的同事在一起将使你的成长速度成倍增加。你将接触到前沿问题、创新解决方案和专业知识,这些都将每天给你带来挑战和启发。
请记住,如果您真的对 DS 和 ML 充满热情,那么这些挑战将会令人兴奋。这种热情加上与顶尖人才的接触,将成为您职业生涯产生重大影响的关键。
您认为计算机视觉领域目前最令人兴奋和最有前景的趋势和进步是什么?
虽然自然语言处理最近取得了重大进展,但我认为计算机视觉仍然被严重低估,并且拥有巨大的未开发潜力。我们在视觉感知和理解方面还远未达到人类水平的能力。
计算机视觉领域最有前景的趋势之一是自我监督学习。这种方法类似于儿童通过观察周围世界进行学习,在减少对大型标记数据集的需求方面显示出巨大的潜力。然而,我认为在完全复制类似人类的视觉学习和理解方面仍然缺少一个关键元素。
我对计算机视觉领域生成式人工智能的发展尤其感到兴奋,尤其是扩散模型和一致性模型。这些技术正在彻底改变图像的生成、处理和理解。扩散模型擅长创建多样化、高质量的图像,而一致性模型则增强了我们在不同视觉视角中保持一致性的能力。
尽管取得了这些进步,但我们仍处于充分发挥 CV 潜力的早期阶段。该领域已经具备了创新的条件,特别是在开发更强大、更通用的模型方面,这些模型可以在不同的环境中接近人类水平的视觉理解。这使得从事计算机视觉工作成为一个令人难以置信的激动人心的时刻,为开创性的研究和应用提供了充足的机会。”
这个简洁的版本保留了有关 CV 的现状、您对其潜力的看法以及该领域令人兴奋的发展等要点,同时更加集中和切中要点。
特色图片来源: rawpixel.com/Freepik