麻省理工学院的研究人员开发了一种新的语音现实系统,该系统将 3D 生成式人工智能与机器人装配相结合,可按需制造物体。该系统在短短五分钟内就创建了家具等物品。这种人工智能驱动的工作流程允许用户向机械臂提供语音输入,有效地“用语言表达物体的存在”。该技术利用自然语言处理、3D 生成人工智能和机器人装配来简化制造流程。麻省理工学院研究生兼晨兴设计学院 (MAD) 研究员 Alexander Htet Kyaw 表示:“我们正在将自然语言处理、3D 生成式人工智能和机器人装配联系起来。”他补充说,这些快速发展的研究领域以前从未被结合起来,通过简单的语音提示来创建物理对象。该系统接收口头命令,例如“我想要一个简单的凳子”,然后用模块化组件构造对象。到目前为止,研究人员已经使用该系统建造了凳子、架子、椅子、小桌子和包括狗雕像在内的装饰形式。语音转现实系统通过几个阶段处理用户请求:
- 语音识别: 大型语言模型处理用户的语音输入。
- 3D 生成式人工智能: 系统创建所需对象的数字网格表示。
- 体素化算法: 3D 网格被分解为特定的装配组件。
- 几何加工: AI 生成的装配经过修改,以考虑现实世界的制造约束,例如组件数量、悬伸和几何连接性。
- 装配顺序和路径规划: 该系统为机械臂创建可行的装配顺序和自动路径规划。
与通常需要数小时或数天的 3D 打印不同,该系统可在几分钟内完成物体构建。它还使没有 3D 建模或机器人编程专业知识的个人更容易进行设计和制造。 Kyaw 在学习 Neil Gershenfeld 教授的课程“如何制造几乎任何东西”时开发了最初的系统。他在麻省理工学院比特与原子中心 (CBA) 继续该项目,与机械工程系的研究生 Se Hwan Jeon 和 CBA 的 Miana Smith 合作。该团队计划通过在模块化立方体之间实现更坚固的连接来提高家具的承重能力,超越当前的磁性连接。史密斯指出,“我们还开发了将体素结构转换为小型分布式移动机器人的可行组装序列的管道,这有助于将这项工作转化为任何尺寸的结构。”模块化组件的使用旨在通过拆卸和重新组装成新物体来减少制造浪费。 Kyaw 还致力于将手势识别和增强现实集成到系统中,结合语音和手势控制来增强交互。该团队于 11 月 21 日在麻省理工学院举行的计算机协会 (ACM) 计算制造研讨会 (SCF ’25) 上展示了他们的论文“Speech to Reality: On-Demand Production using Natural Language, 3D Generative AI, and Discrete Robotic Assembly”。 https://www.youtube.com/watch?v=GJQD86H9Nok





