我们正处于大加速之中——这是一个奇点,不是大写的库兹韦尔意义上的机器人崛起,而是福柯所描述的:在一段时期内,变化如此广泛、如此根本,以至于人们无法正确地理解这一点。辨别变化的另一面会是什么样子。
我们之前已经经历过奇点:
- 农业的兴起(创造了剩余资源并为我们带来了学术和商业阶层)。
- 印刷机的发明(它使知识民主化并使其可塑性降低,使我们认识到超越我们自己感官的真理来源)。
- 蒸汽机(让机器执行物理任务)。
- 计算机软件(让我们向机器发出要遵循的指令)。
- 互联网和智能手机(将我们所有人以交互方式连接在一起)。
这种奇点的最简单形式是 我们发明了一种新型软件。
旧类型的软件
旧式软件(目前存在于手机和电脑上的软件)已经改变了我们的生活,而 20 世纪 70 年代的人几乎无法认出它们。 人类有 50 年的时间来适应软件,因为它从学者开始慢慢发展,然后是业余爱好者、拨号调制解调器和公司电子邮件。 但即使需要半个世纪的时间来调整,我们的文明仍在努力应对其后果。
您今天熟悉的软件(发送消息、添加数字、在日历中预订内容、甚至支持视频通话的软件)是确定性的。 这意味着 它符合你的期望。 当结果出乎意料时,就称为错误。
从确定性软件到人工智能
“思考机器”的早期例子包括控制论(像自动驾驶仪这样的反馈循环)和专家系统(医生的决策树)。 但这些仍然是可以预见和可以理解的。 他们只是遵守了很多规则。
在 20 世纪 80 年代,我们尝试了不同的方法。 我们将软件构造得像大脑一样,赋予它“神经元”。 然后我们让它根据示例自行配置。 1980 年,一位名叫 Yann LeCun 的年轻研究员在图像分类上进行了尝试。
他现在是 Meta 的人工智能主管。
然后人工智能进入了一种冬眠状态。 进展正在取得,但进展缓慢,而且发生在学术界的大厅里。 深度学习、TensorFlow 和其他技术的出现,主要是为搜索引擎、推荐和广告提供动力。 但人工智能是在广告服务、地图和语音识别等幕后发生的事情。
2017 年,一些研究人员发表了一篇开创性论文,名为《注意力就是你所需要的》。 当时,作者在谷歌工作,但许多人后来跳槽到了 OpenAI 等公司。 该论文描述了一种更简单的方法,让软件通过关注最重要的语言部分来进行自我配置。
其早期用途是翻译。 如果你向算法提供足够的英语和法语文本,它就可以通过理解每种语言的单词之间的关系来找出如何将一种语言翻译成另一种语言。 但基本方法使我们能够根据从互联网上抓取的文本来训练软件。
从那时起,进展相当迅速。 2021 年,我们弄清楚了如何创建一个“指令模型”,该模型使用称为监督微调 (SFT) 的过程来使对话式 AI 遵循指令。 2022 年,我们让人类对我们的指令的反应进行评分(称为“修改监督微调”),并在 2022 年末,我们添加了一种称为“人类反馈强化学习”的东西,这给了我们 GPT-3.5 和 ChatGPT。 人工智能现在可以向其他人工智能提供反馈。
无论如何,到 2024 年,人类将成为事物训练的输入,并提供用于改进输出质量的反馈。
意外的是一个功能,而不是一个错误
结果是一种新型软件。 为了让它发挥作用,我们首先收集大量数据并用它来训练一个庞大的数学模型。 然后,我们在模型中输入提示,它会预测我们想要的响应(很多人没有意识到 一旦人工智能经过训练,每次相同的输入都会给出相同的输出——它认为是“最好的”)。 但我们想要创造力,所以我们添加了一个称为温度的扰动,它告诉人工智能要在其响应中注入多少随机性。
我们无法事先预测模型会做什么。 我们有意引入随机性,以便每次都能得到不同的响应。 这个新软件的全部要点是不可预测。 具有不确定性。 它会做出意想不到的事情。
过去,您将某些内容放入应用程序中,它会遵循人类编写的一组指令并出现预期的结果。 现在,你将一些东西放入人工智能中,它会遵循一组指令 它 写道,另一边出现了意想不到的结果。 意想不到的结果不是一个错误,而是一个功能。
令人难以置信的快速采用
出于多种原因,我们采用第二种软件的速度比第一种软件要快得多
- 它制作了自己的用户手册:虽然我们都对结果有多好感到兴奋,但我们经常忽视它对简单输入的响应能力。 这是第一个没有学习曲线的软件——它会告诉任何会打字或说话的人如何使用它。 它是第一个创建自己的文档的软件。
- 大家都可以尝试一下:由于移动电话和宽带的无处不在的连接以及托管软件的 SaaS 模式,许多人都可以访问。 您不再需要购买和安装软件。 有浏览器的人都可以尝试一下。
- 硬件无处不在:来自游戏的 GPU、Apple 的 M 系列芯片和云计算使巨大的计算资源变得非常容易部署。
- 成本下降。 很多:一些算法的进步已经将人工智能的成本降低了多个数量级。 对 10 亿张图像进行分类的成本从 2021 年的 10,000 美元下降到 2023 年的 0.03 美元——每天便宜 450 倍。
- 我们在线生活:人类平均每天上网六个小时,大部分互动(电子邮件、聊天室、短信、博客)都是基于文本的。 在网络世界中,人类与算法在很大程度上没有什么区别,因此有很多简单的方法可以将人工智能输出连接到人们消费的信息流和屏幕。 COVID-19 加速了远程工作,并随之将文本和算法渗透到我们的生活中。
不确定性软件可以做什么
不确定性软件可以做很多事情,其中一些我们现在才开始意识到。
- 这是 生成的。 它可以创造新事物。 我们在图像(Stable Diffusion、Dall-e)和音乐(Google MusicLM)甚至金融、基因组学和资源检测中看到了这一点。 但受到最广泛关注的地方是 OpenAI、Google、Perplexity 等公司的聊天机器人。
- 创意不错,但是 编造东西。 这意味着我们给它提供了“有趣”的工作,比如艺术、散文和音乐,而这些工作没有“正确答案”。 它还意味着大量的错误信息和人类的认知危机。
- 它仍然 需要大量的人力投入 将输出过滤成可用的东西。 事实上,生成对话式人工智能的许多步骤都涉及人类为其提供良好响应的示例,或对其给出的响应进行评分。
- 因为事情常常是错误的,所以我们需要能够责怪某人。 决定如何处理其输出的人是 后果自负。
- 它 可以推理 以我们认为不应该的方式。 我们不明白这是为什么。
IT 的钟摆和民主化
虽然根据定义,很难预测奇点的另一面,但我们可以对信息技术 (IT) 将如何变化做出一些有根据的猜测。 IT行业在上个世纪经历了两次重大转变:
- 它就像一个持续的钟摆,从大型机的集中式转向网络客户端的分布式。
- 这是资源的逐步民主化,从计算稀缺、珍贵并由 IT 守护的时代,到开发人员以及工作负载本身可以根据需要部署资源的时代。
该图显示了这种转变:
由于人工智能,还有另一层正在发生:用户控制的计算。 我们已经看到了无代码和低代码工具,例如 Unqork、Bubble、Webflow、Zapier 等,使用户可以更轻松地创建应用程序,但更有趣的是用户的 AI 提示何时启动代码。 我们在 OpenAI 的 ChatGPT 代码解释器中看到了这一点,它将编写然后运行应用程序来处理数据。
随着像苹果这样的公司加入竞争(为了迎接这一天,它们已经在自己研发的芯片组中内置了强大的人工智能处理功能),未来几年很可能会出现另一次摆向边缘的钟摆。 下一层计算如下:
构建第二个堆栈
我们可以对不确定性时代的 IT 做出的另一个预测是,公司将拥有两个堆栈。
- 一种是确定性的、运行可预测的任务。
- 一种是不确定的,会产生意想不到的结果。
也许最有趣的是,第二个(非确定性)堆栈将能够编写第一个(确定性)堆栈可以运行的代码 – 很快,比人类更好。
未来十年,每个组织都将热衷于建立第二个堆栈。 每家公司都会根据其语料库的价值、专有信息和实时更新来评判其人工智能的最佳结果。 每个堆栈都有不同的硬件要求、架构、治理、用户界面和成本结构。
我们无法预测人工智能将如何重塑人类。 但我们可以对它将如何改变企业 IT 做出有根据的猜测,而那些快速适应的人将能够最好地利用随后发生的事情。
阿利斯泰尔·克罗尔 是多本有关技术、商业和社会的书籍的作者,其中包括畅销书《精益分析》。 他是全球领先的公共部门创新会议 FWD50 的创始人和联合主席,并曾担任哈佛商学院的客座高管,帮助创建了数据科学和批判性思维课程。 他是会议主席 数据宇宙 2024。
在 Data Universe 认识作者
加入作者 Alistair Croll,网址为 数据宇宙,将于 2024 年 4 月 10 日至 11 日在纽约举行,他将主持首次推出的全新品牌不可知论数据和人工智能会议,该会议专为整个全球数据和人工智能社区而设计。
将所有内容结合在一起 – Data Universe 欢迎各种技能水平和角色的数据专业人士以及商人、高管和行业合作伙伴,参与跨行业探索的数据、分析、机器学习和人工智能方面最新且相关的专家主导见解,帮助您与快速变化的规范、工具、技术和期望一起发展,从而改变商业和社会的未来。 今年四月,加入我们在纽约市北贾维茨中心,成为数据和人工智能未来的一部分。
INFORMS 很高兴成为 Data Universe 2024 的战略合作伙伴,并将展示 四场会议 会议期间。
特色图片来源: Growtika/Unsplash