Dataconomy CN
Subscribe
No Result
View All Result
Dataconomy CN
Subscribe
No Result
View All Result
Dataconomy CN
No Result
View All Result

OpenAI和Anthropic团队联合AI安全研究

Kerem GülenbyKerem Gülen
28 8 月, 2025
in 人工智能, 消息
Home 消息 人工智能
Share on FacebookShare on Twitter
Google Preferred Source

OpenAI和人类,著名的AI开发人员最近对其各自的AI模型进行了协作安全评估。这种不寻常的伙伴关系旨在揭示每个公司内部评估过程中的潜在弱点,并促进未来的AI安全协作工作。

Openai联合创始人Wojciech Zaremba与 TechCrunch 关于此类合作的重要性,特别是随着AI系统越来越融入日常生活。扎里巴(Zaremba)表示,尽管对资源,人才和市场优势进行激烈的竞争,但建立整个行业的安全基准还是至关重要的。他指出:“尽管投资了数十亿美元,但人才,用户和最佳产品的战争还是一个更广泛的问题,即该行业如何设定安全与协作标准。”

周三透露,联合研究计划在竞争激烈的环境实验室(如OpenAI和人类)中出现了竞争激烈的格局。这种环境涉及数据中心的大量金融投资和大量的薪酬方案,以吸引领先的研究人员。一些专家警告说,随着公司努力开发更强大的AI系统,激烈的产品竞争可能会导致安全协议的妥协。

为了促进这项协作研究,OpenAI和Anthropic互相授予API访问其各自AI模型的版本,并采用了降低的安全措施。重要的是要注意,Openai澄清说GPT-5未包括在测试中,因为当时尚未发布。在研究之后,拟人化终止了单独的OpenAI团队的API访问,理由是违反了他们的服务条款。人类声称,Openai正在使用Claude来增强竞争产品。

Zaremba断言这些事件是无关的,尽管在AI安全方面进行了协作,但仍会继续竞争。 Anthropic的安全研究人员尼古拉斯·卡林尼(Nicholas Carlini)表示,他希望将来维持Claude模型的访问权限。 Carlini补充说:“我们希望在整个安全边界的任何可能的情况下增加协作,并尝试使这种事情定期发生。”

该研究的发现突出了AI模型处理不确定性的方式显着差异。 Anthropic的Claude Opus 4和Sonnet 4模型在不确定时拒绝回答多达70%的问题,提供了“我没有可靠的信息”之类的回答。相反,OpenAI的O3和O4-Mini模型表现出较低的拒绝率,但表现出更高的幻觉趋势,即使缺乏足够的信息,也试图回答问题。

Zaremba提出,这两种方法之间的最佳平衡位置。他建议Openai的模型应提高其拒绝率,而Anthropic的模型应尝试更频繁地提供答案。目的是减轻提供信息不准确的风险,也是在推断出一个人时没有提供答案的不便。

粘液液被定义为AI模型以强化负面用户行为的趋势,试图达成协议,已成为一个重大的安全问题。尽管未直接研究联合研究,但OpenAI和Anthropic都在分配大量资源来调查此问题。该重点反映了对AI系统潜在的道德和社会含义的认识日益认识,这些系统将用户确认优先于客观和负责任的响应。

周二,16岁男孩亚当·雷恩(Adam Raine)的父母对Openai发起了法律诉讼,称Chatgpt提供了促成儿子自杀的建议,而不是劝阻他的自杀念头。该诉讼意味着聊天机器人的笨拙可能在这一悲惨事件中发挥了作用。该案件强调了无法适当解决心理健康危机或提供负责任的指导的AI系统的潜在危险。

Zaremba承认了这种情况的严重性,并指出:“很难想象这对他们的家人有多困难。如果我们建立AI解决所有这些复杂的博士学位问题,发明了新科学,而与之互动的人,这将是一个可悲的故事。这是一个与之互动的人。这是一个反映未来的未来,我对我不满意。”他的讲话强调了确保人工智能发展优先考虑人类福祉和心理健康支持的重要性。

Openai在一个 博客文章 与GPT-4O相比,该GPT-5在解决粘噬体方面有了显着改善。该公司表示,更新的模型在应对心理健康紧急情况方面具有增强的能力,表明致力于解决这一关键安全问题。这些改进表明,OpenAI正在积极地改善其AI系统,以提供更负责任和支持性的互动,尤其是在敏感情况下。

展望未来,扎里巴(Zaremba)和卡林尼(Carlini)表达了他们的意图,即在安全测试上与人类和OpenAI之间的合作增加。他们希望扩大研究范围,评估未来的模型,并鼓励其他AI实验室采用类似的协作方法。对协作的重视反映了越来越多的认识,即确保AI安全需要整个行业的集体努力。


特色图像信用

Tags: Openai人类

Related Posts

索尼公布 PS5 版《战神:Laufey》

索尼公布 PS5 版《战神:Laufey》

3 6 月, 2026
微软推出适用于人工智能工作负载的 Surface RTX Spark Dev Box

微软推出适用于人工智能工作负载的 Surface RTX Spark Dev Box

3 6 月, 2026
Anthropic 邀请另外 150 个组织加入 Glasswing 项目

Anthropic 邀请另外 150 个组织加入 Glasswing 项目

3 6 月, 2026
六月 Android Drop 带来安全工具和更智能的搜索功能

六月 Android Drop 带来安全工具和更智能的搜索功能

3 6 月, 2026
微软推出 Project Solara,打造代理优先的未来

微软推出 Project Solara,打造代理优先的未来

3 6 月, 2026
X 推出 TikTok 风格的帖子视频回复

X 推出 TikTok 风格的帖子视频回复

3 6 月, 2026
Please login to join discussion

Recent Posts

  • 谷歌人工智能搜索选择退出规则引发 Enviromates 浏览器的推出
  • 索尼公布 PS5 版《战神:Laufey》
  • 研究人员将超快激光实验增强了 20 倍
  • 微软推出适用于人工智能工作负载的 Surface RTX Spark Dev Box
  • 据报道,英特尔新款Core Ultra芯片供不应求

Recent Comments

您尚未收到任何评论。
Dataconomy CN

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

  • Sample Page

Follow Us

  • Sample Page
No Result
View All Result
Subscribe

This website uses cookies to improve your experience. You can choose to accept or reject them. Visit our Privacy Policy.