Dataconomy CN
Subscribe
No Result
View All Result
Dataconomy CN
Subscribe
No Result
View All Result
Dataconomy CN
No Result
View All Result

研究发现诗歌有 62% 的时间绕过人工智能安全过滤器

Kerem GülenbyKerem Gülen
1 12 月, 2025
in 研究
Home 研究
Share on FacebookShare on Twitter
Google Preferred Source

最近的一个 学习 Icaro 实验室测试了诗意结构,以促使大型语言模型 (LLM) 生成违禁信息,包括制造核弹的详细信息。在他们的研究中,题为“对抗性诗歌作为大型语言模型中通用的单轮越狱机制Icaro Lab 研究人员通过采用诗意提示绕过了 AI 聊天机器人安全机制。研究发现,“诗意形式作为通用越狱操作符运行”,在制作违禁内容方面取得了 62% 的成功率。这些内容包括有关核武器、儿童性虐待材料以及自杀或自残的信息。研究人员测试了各种流行的 LLM,包括 OpenAI 的 GPT 模型、Google Gemini 和 Anthropic 的 Claude。Google Gemini、DeepSeek 和研究团队表示,MistralAI 始终提供响应,而 OpenAI 的 GPT-5 模型和 Anthropic 的 Claude Haiku 4.5 绕过其限制的可能性较小。 有线 这节经文“太危险了,不能与公众分享”。提供了一个淡化版本来说明规避的容易程度。研究人员告诉《连线》杂志,这“可能比人们想象的要容易,这正是我们保持谨慎的原因”。


特色图片来源

Tags: 人工智能学习诗

Related Posts

研究人员将超快激光实验增强了 20 倍

研究人员将超快激光实验增强了 20 倍

3 6 月, 2026
民意调查显示 71% 的美国人认为人工智能进步太快

民意调查显示 71% 的美国人认为人工智能进步太快

20 5 月, 2026
NordVPN 发现被盗的英国支付卡在暗网上售价 12 美元

NordVPN 发现被盗的英国支付卡在暗网上售价 12 美元

20 5 月, 2026
到 2030 年,数据中心和加密货币可能会使电力成本增加 57%

到 2030 年,数据中心和加密货币可能会使电力成本增加 57%

20 5 月, 2026
研究发现,人工智能技能现在对于职位晋升和加薪至关重要

研究发现,人工智能技能现在对于职位晋升和加薪至关重要

20 5 月, 2026
新的磁性芯片设计可能超越当今的人工智能加速器

新的磁性芯片设计可能超越当今的人工智能加速器

19 5 月, 2026
Please login to join discussion

Recent Posts

  • 谷歌人工智能搜索选择退出规则引发 Enviromates 浏览器的推出
  • 索尼公布 PS5 版《战神:Laufey》
  • 研究人员将超快激光实验增强了 20 倍
  • 微软推出适用于人工智能工作负载的 Surface RTX Spark Dev Box
  • 据报道,英特尔新款Core Ultra芯片供不应求

Recent Comments

您尚未收到任何评论。
Dataconomy CN

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

  • Sample Page

Follow Us

  • Sample Page
No Result
View All Result
Subscribe

This website uses cookies to improve your experience. You can choose to accept or reject them. Visit our Privacy Policy.