Amazon Nova 系列可在 Amazon Bedrock 上使用,包括 Nova Micro(一种高效的文本到文本模型)、Nova Lite、Nova Pro 和 Nova Premier(处理文本、图像和视频以生成文本内容的多模式模型)。
亚马逊还推出了另外两款型号: 亚马逊 Nova 画布,旨在产生工作室品质的视觉效果,以及 亚马逊 Nova 卷轴,它生成专业级视频。
亚马逊通用人工智能高级副总裁 Rohit Prasad 强调了亚马逊的独特视角,他表示:
“在亚马逊,我们使用近 1,000 个人工智能应用程序。这让我们对开发人员继续面临的挑战有一个高层次的了解。我们新的 Amazon Nova 模型旨在帮助亚马逊内外的开发人员克服这些障碍。它们提供卓越的智能和内容生成功能,同时提高延迟、成本效益、个性化、检索增强生成 (RAG) 和基于代理的功能。”
Amazon Nova:行动中的智能和速度
Nova 系列包括四种型号: 亚马逊 Nova 微 具有超低延迟和成本,使其成为需要快速响应的纯文本应用程序的理想选择。其余三个模型突破了多模式人工智能的界限:
- 亚马逊 Nova Lite 是一种经济高效的选择,可以以惊人的速度处理图像、视频和文本。
- 亚马逊 Nova Pro 结合了各种任务的准确性、速度和成本效率,提供跨多种模式的高级功能。
- 亚马逊 Nova Premier 是亚马逊最强大的多模态模型,擅长复杂的推理任务,是提炼更小、专业模型的理想“老师”。
Amazon Nova Micro、Nova Lite 和 Nova Pro 已可供一般使用,而 Nova Premier 将于 2025 年第一季度推出。
性能基准测试结果
Nova 型号经过了行业标准基准的严格测试。结果表明,这些模型的表现始终与领先的替代方案相当或超过。
- 亚马逊 Nova 微 提供有竞争力的结果,匹配或超越 元拉玛 3.1 8B(跨 11 个基准)和 Google Gemini 1.5 Flash-8B(跨 12 个基准)。凭借每秒 210 个令牌的业界领先输出速度,非常适合需要快速响应的应用。
- 亚马逊 Nova Lite 在基准测试中展示了强大的性能,包括文本任务和视频、图表和文档理解的准确性,在 VATEX、ChartQA 和 DocVQA 测试中表现出色。
- 亚马逊 Nova Pro 通过在 20 个基准测试中的 17 个中超越 OpenAI GPT-4o,并为 RAG 工作流程、指令遵循和基于代理的任务提供出色的结果,展示了其功能。
支持长上下文、多语言和多模式任务
Amazon Nova Micro、Lite 和 Pro 型号支持 200 多种语言。 Nova Micro 可处理多达 128,000 个令牌的输入上下文,而 Nova Lite 和 Nova Pro 支持多达 300,000 个令牌或 30 分钟的视频处理。亚马逊计划在 2025 年初将其数量扩大到超过 200 万个代币。
高性价比、高速性能
Amazon Nova 型号旨在提供卓越的速度和成本效益。与 Amazon Bedrock 上的智能类别中的其他表现最佳的型号相比,Nova Micro、Nova Lite 和 Nova Pro 至少 成本效益提高 75% 同时提供最快的性能。
与 Amazon Bedrock 无缝集成
Amazon Nova 模型直接与 Amazon Bedrock 集成,后者是 AWS 的完全托管服务,使客户可以通过单个 API 调用访问来自领先 AI 提供商和 Amazon 本身的基础模型。借助 Bedrock,开发人员可以轻松测试和评估 Nova 模型以及其他选项,以确定最适合其应用程序的模型。
通过微调实现个性化
Amazon Nova 模型支持个性化微调,允许客户通过使用自己数据中的示例来指导模型来提高准确性。这些模型了解对客户最重要的内容(无论是文本、图像还是视频),然后 Amazon Bedrock 提供量身定制、微调的响应。
适用于小型专用模型的高效蒸馏
除了微调之外,Nova还支持 模型蒸馏,能够在不牺牲准确性的情况下将知识从大型、高性能模型转移到更小、更快、更具成本效益的模型。
通过检索增强生成提高准确性
Amazon Nova 型号无缝集成 亚马逊基岩知识库,使检索增强生成 (RAG) 能够根据组织自己的数据提供响应,以实现最高的准确性。
针对代理应用程序进行了优化
Nova 模型专为在多步骤任务中表现出色而设计,针对需要通过多个 API 与专有系统和数据进行交互的基于代理的应用程序进行了优化。
生产质量的视觉内容
亚马逊 Nova 画布 根据文本或图像提示生成专业品质的图像,并具有用于编辑、颜色调整和布局的内置控件。综合保障措施包括水印和内容审核,以确保负责任的人工智能使用。在评估中,Nova Canvas 的表现优于 OpenAI DALL·E 3 和 Stable Diffusion 等模型。
亚马逊 Nova 卷轴 使客户能够从文本和图像创建高质量的视频。它专为广告、营销和教育内容而设计,允许控制视觉风格、节奏和相机效果。 Nova Reel 的表现始终优于竞争对手,评论家更喜欢它的输出而不是 Runway Gen-3 Alpha。 Nova Reel 目前支持六秒视频,但将在未来几个月内扩展到两分钟视频生成。
展望未来:语音和多模态到多模态模型
亚马逊计划在 2025 年第一季度发布 语音到语音模型 旨在将人工智能应用程序转变为自然语音交互。该模型将解释口语、语气和节奏,以最小的延迟提供类似人类的响应。
此外,亚马逊正在开发 多模态到多模态模型 能够将文本、图像、音频和视频作为输入并通过任何这些模式生成输出。该模型将于 2025 年中期推出,将简化需要内容翻译、编辑和多模式理解的应用程序。
早期采用
一些领先的组织已经采用 Nova 模型:
- 树液 将 Nova 模型集成到 SAP AI Core 中,为自动化、个性化和供应链规划方面的人工智能驱动解决方案提供支持。
- 德勤 正在利用 Nova 先进的个性化功能在全球范围内提供定制的生成人工智能服务。
- 电通数码株式会社 使用 Nova Reel 简化创意视频制作,将活动时间从几周缩短到几天。
- 音乐匹配 将 Nova Reel 纳入其平台,帮助新兴艺术家制作高质量的音乐视频。
- 123RF 正在使用 Nova Canvas 和 Nova Reel 简化内容创作者的设计流程。
- 凯伦特 使用 Nova 模型加速媒体、体育和零售客户的视频理解工作流程。
- 帕兰提尔科技 Nova Pro 与其本体系统集成,以增强跨行业人工智能驱动的决策工作流程。
- Shutterstock 将 Nova Canvas 融入其 AI 图像生成器中,为高质量视觉内容创建提供直观的解决方案。
AWS已发布详细 人工智能服务卡 对于 Nova 模型,提供用例、限制和负责任的人工智能实践的透明度: