Openai宣布发布Sora 2(其旗舰视频和音频生成模型)。新模型具有增强的身体准确性,更大的用户控制以及将现实世界元素插入生成场景中的能力,该模型正在通过称为“ Sora”的新社交应用程序部署。该版本标志着2024年2月推出的原始SORA模型向前迈出的重要一步。Openai将这一进步描述为潜在的“视频GPT-3.5时刻”,这表明功能和性能取得了重大飞跃。
Sora 2的主要改进
Sora 2在其前任方面引入了几个重大进步,更接近创建功能性世界模拟器的目标。
- 增强的身体准确性: 以前的视频模型通常是“过度充实的”,无视现实的物理来满足用户的提示。 Sora 2展示了对物理定律的更扎实的模拟,可以准确地对结果进行建模,例如错过的篮球射门从篮板上篮板,而不是传送到篮筐中。
- 高级用户可控性: 该模型可以遵循复杂的多拍说明,同时在不同的场景和相机角度保持生成世界的状态,从而更加复杂且连贯的视频叙述。它还显示了各种美学风格的熟练程度,包括现实,电影和动漫。
- 现实世界元素集成: 用户现在可以将现实世界的元素注入生成的环境。通过录制一个人,动物或物体的视频,该模型可以将该元素放入任何索拉生成的场景中,从而准确地描绘出其外观和声音。
Sora Social应用程序和客串功能
OpenAI正在通过旨在创建和共享视频内容的社交iOS应用程序部署新模型。该应用程序的主要功能是“客串”,它可以操作该模型插入现实世界元素的能力。要创建一个客串,用户在应用程序中记录了一个简短的视频和音频剪辑,该视频和音频剪辑捕获了他们几代人使用的相似性和声音。用户可以完全控制自己的个人形象,可以决定谁被允许使用他们的客串。他们还可以随时撤销访问权限或删除任何包括客串的视频。
专注于用户健康和安全
在启动该应用程序时,OpenAI概述了解决数字成瘾和社会隔离等问题的措施。
- 饲料理念: 该应用程序的提要算法旨在“最大化创建而不是消费”,优先考虑用户遵循的人的内容和内容可能会激发自己的创造性工作。 Openai指出,它“不优化用于饲料中的时间”。
- 青少年安全: 针对青少年用户的特定保障措施包括对他们可以查看的几代人数的默认每日限制,以及有关使用客串的更严格的权限。 Openai还通过Chatgpt启动父母控制,以管理青少年帐户的设置。
- 适度: 除了自动化安全系统外,该公司还在扩大其人类主持人团队以审查潜在的欺凌案件。
可用性和访问
Sora IOS应用程序现在可以在美国和加拿大下载,并计划扩展到其他国家。正在基于邀请的系统上推出访问,以鼓励用户与朋友一起加入。
- 定价: 该服务最初将是免费的,并具有“慷慨的限制”。 OpenAI表示,其当前唯一的货币化计划是,如果需求超过可用的计算资源,则最终允许用户为额外的代价支付。
- Sora 2 Pro: Chatgpt Pro的订阅者将可以访问名为Sora 2 Pro的实验性,更高质量的版本,该版本将在Sora.com网站上找到。
- API访问: Openai计划通过其API供开发人员发布Sora 2。先前的型号Sora 1 Turbo将保持可用。
Openai将视频模型的快速改善视为发展通用世界模拟器和机器人代理的关键一步,将Sora 2作为“朝着该目标迈出的重大进展”。





