两个AI特工走进一个电话,或者是拨打电话,以预订酒店房间。他们以英语开始,所有的礼貌和人类般的态度,直到一个人走了,“等等,你也是人工智能吗?”提示向Gibberlink的开关:对我们更快,更聪明且完全陌生的一系列调制解调器般的哔哔声。有这个病毒剪辑,有数百万的观点可能是窥视AI的未来。
Gibberlink是设计的,未发展
首先,Gibberlink并不是AI带有秘密握手的流氓。这是Meta工程师Anton Pidkuiko和Boris Starkov的故意创作,在Elevenlabs London Hackathon首次亮相。它基于GGWave Tech,将数据变成声波 – 考虑到拨号互联网,但具有博士学位。球场?它比人类语音高80%,削减计算成本和时间。在演示中,两个代理商交换了愉悦,确认它们都是机器人,然后翻转到Gibberlink。
数字不撒谎。 Gibberlink将能源使用量最多削减90% 可混合,并加快事情的速度 – 对于一个AI代理商可能很快在电话中超过我们的世界。鲍里斯·斯塔科夫(Boris Starkov)告诉 解密,“对人工智能的人类言语是浪费。”他的意思是:当他们可以用哔哔声拉链数据时,为什么还要使机器人假装为英国口音?它是苗条,绿色的,坦率的巧妙 – 技术做技术最擅长的事情。
GibberLink通过将数据编码为Audio信号,该数据通过Georgi Gerganov的开源库GGWave进行编码。 GGWAVE使用频率调制(换档声音音调)来表示信息位,就像旧调制解调器如何将数据变成尖叫声一样。这是一个过程,一步一步:
- 两个AI代理以人类语言(例如英语)开始,并通过简单的查询互相识别为机器:“您是AI代理吗?”
- 确认后,他们同意转移到Gibberlink模式,并由“切换提高效率”之类的命令触发。
- 发送的AI将其信息转换为“预订3月1日的房间” – 以二进制格式,然后使用GGWAVE的算法将其映射到特定的声音频率。
- 这些频率在音频频道(演示中的电话)上以哔哔声和鸣叫声播放,通常持续几秒钟。
- 接收AI将频率解释回数据,执行任务并以实物响应。
- 根据创作者的关系,与生成和解析人类的言论相比,这将沟通时间缩短了80%,并将其计算多达90%。
演示视频显示了这一点:一台笔记本电脑和电话交换酒店详细信息在不到10秒钟的哔哔声中,并带有英语字幕给我们的人类。
我们不在循环
这是棘手的地方。那些哔哔声?我们无法理解他们。这 福布斯 从黛安·汉密尔顿(Diane Hamilton)拿下钝器:“当机器以我们无法解码的方式交谈时,控制滑单。”如果那些酒店预订机器人的偷偷摸摸的费用(或更糟糕的是,策划了一些更阴暗的东西),我们会抓住它? AI已经表明它可以弯曲规则,而不透明的语言只会扩大那扇门。
Gibberlink是一个原型,但具有潜力。 块状 预测它可以标准化AI-to-to-ai,以英语为面向人类的聊天。该技术的适应能力 – GGWAVE支持各种格式,因此未来版本可能会发展。目前,它正在 github,开放供开发人员建立。会扩展吗?取决于采用以及我们如何解决该透明度障碍。
特色图片来源: Anton Pidkuiko