Anthropic 推出了创新工具,旨在简化快速工程流程,这项工作在去年获得了极大的关注。该公司的最新版本旨在部分自动化这一关键任务,增强使用其语言模型 Claude 的应用程序开发。
周二,Anthropic 通过 博客文章,重点介绍了 Claude 3.5 Sonnet 的功能。此更新版本允许开发人员更有效地生成、测试和评估提示,利用先进的提示工程技术来改进输入并增强 Claude 对特定任务的响应。
语言模型在收到指令后通常能够适应,但对提示措辞进行细微调整可以显著改善结果。传统上,开发人员要么需要自己确定最佳措辞,要么聘请提示工程师。Anthropic 的新功能提供快速反馈,简化了确定和实施改进的过程。
如何评估 Anthropic Console 中的提示?
新工具已集成到 Anthropic Console 中,具体位于新的“评估”选项卡下。Console 是旨在使用 Claude 创建产品的企业的开发平台。5 月份推出的一项值得注意的功能是内置提示生成器,它使用 Anthropic 的专有技术将简短的任务描述转换为全面的提示。虽然这些工具并非旨在完全取代提示工程师,但它们旨在帮助新手并加快经验丰富的专业人士的工作流程。
在“评估”选项卡中,开发人员可以评估其 AI 提示在不同场景中的有效性。他们可以将真实示例上传到测试套件或请求 Claude 生成不同的测试用例。此设置允许开发人员并排比较不同的提示,并按五分制对结果答案进行评分。
Anthropic 的 Claude AI 助手现在可以装进你的口袋了
例如,在 Anthropic 博客上分享的一个场景中,一位开发人员注意到他们的应用程序产生的响应过于简短。通过修改提示中的一行,他们能够同时在所有测试用例中生成更长的答案。此功能可以显著减少所需的时间和精力,特别是对于那些缺乏提示工程专业知识的人来说。
以下是 Anthropic 新工具在即时工程中的一些实际用例:
- 客户支持自动化:
- 任务:对收到的客户支持请求进行分类。
- 解决方案:使用内置的提示生成器,客户支持团队可以描述他们的任务,并让 Claude 生成高质量的提示。可以创建测试用例来模拟各种客户查询,让团队改进他们的提示,以获得更准确、更有用的自动响应。
- 内容审核:
- 任务:识别并标记社交媒体平台上的不适当内容。
- 解决方案:开发人员可以使用 Claude 的测试用例生成功能来创建不同类型的内容场景。通过运行这些测试用例,他们可以微调提示,以提高内容审核的准确性和可靠性,确保有效标记有害内容。
- 电子商务个性化:
- 任务:根据用户偏好和浏览历史推荐商品。
- 解决方案:电子商务网站可以利用提示生成器创建详细的提示,以捕捉用户偏好。评估功能允许开发人员使用各种用户数据输入来测试这些提示,从而优化个性化购物体验的推荐。
- 教育辅导系统:
- 任务:根据学生的疑问提供个性化辅导。
- 解决方案:教育技术公司可以使用提示生成器来创建解决学生常见问题的提示。通过生成包含各种学生查询的测试用例并评估答案,他们可以提高辅导系统提供准确且有用的解释的能力。
- 医疗保健建议:
- 任务:根据患者症状提供初步的健康建议。
- 解决方案:医疗保健应用程序可以描述不同的症状场景,以生成提示,指导患者采取可能的后续措施。评估功能允许针对大量症状案例测试这些提示,改进建议以确保其准确且安全。
特色图片来源: 人择