OpenAI和Anthropic团队联合AI安全研究

OpenAI和人类，著名的AI开发人员最近对其各自的AI模型进行了协作安全评估。这种不寻常的伙伴关系旨在揭示每个公司内部评估过程中的潜在弱点，并促进未来的AI安全协作工作。

Openai联合创始人Wojciech Zaremba与 TechCrunch 关于此类合作的重要性，特别是随着AI系统越来越融入日常生活。扎里巴（Zaremba）表示，尽管对资源，人才和市场优势进行激烈的竞争，但建立整个行业的安全基准还是至关重要的。他指出：“尽管投资了数十亿美元，但人才，用户和最佳产品的战争还是一个更广泛的问题，即该行业如何设定安全与协作标准。”

周三透露，联合研究计划在竞争激烈的环境实验室（如OpenAI和人类）中出现了竞争激烈的格局。这种环境涉及数据中心的大量金融投资和大量的薪酬方案，以吸引领先的研究人员。一些专家警告说，随着公司努力开发更强大的AI系统，激烈的产品竞争可能会导致安全协议的妥协。

为了促进这项协作研究，OpenAI和Anthropic互相授予API访问其各自AI模型的版本，并采用了降低的安全措施。重要的是要注意，Openai澄清说GPT-5未包括在测试中，因为当时尚未发布。在研究之后，拟人化终止了单独的OpenAI团队的API访问，理由是违反了他们的服务条款。人类声称，Openai正在使用Claude来增强竞争产品。

Zaremba断言这些事件是无关的，尽管在AI安全方面进行了协作，但仍会继续竞争。 Anthropic的安全研究人员尼古拉斯·卡林尼（Nicholas Carlini）表示，他希望将来维持Claude模型的访问权限。 Carlini补充说：“我们希望在整个安全边界的任何可能的情况下增加协作，并尝试使这种事情定期发生。”

该研究的发现突出了AI模型处理不确定性的方式显着差异。 Anthropic的Claude Opus 4和Sonnet 4模型在不确定时拒绝回答多达70％的问题，提供了“我没有可靠的信息”之类的回答。相反，OpenAI的O3和O4-Mini模型表现出较低的拒绝率，但表现出更高的幻觉趋势，即使缺乏足够的信息，也试图回答问题。

Zaremba提出，这两种方法之间的最佳平衡位置。他建议Openai的模型应提高其拒绝率，而Anthropic的模型应尝试更频繁地提供答案。目的是减轻提供信息不准确的风险，也是在推断出一个人时没有提供答案的不便。

粘液液被定义为AI模型以强化负面用户行为的趋势，试图达成协议，已成为一个重大的安全问题。尽管未直接研究联合研究，但OpenAI和Anthropic都在分配大量资源来调查此问题。该重点反映了对AI系统潜在的道德和社会含义的认识日益认识，这些系统将用户确认优先于客观和负责任的响应。

周二，16岁男孩亚当·雷恩（Adam Raine）的父母对Openai发起了法律诉讼，称Chatgpt提供了促成儿子自杀的建议，而不是劝阻他的自杀念头。该诉讼意味着聊天机器人的笨拙可能在这一悲惨事件中发挥了作用。该案件强调了无法适当解决心理健康危机或提供负责任的指导的AI系统的潜在危险。

Zaremba承认了这种情况的严重性，并指出：“很难想象这对他们的家人有多困难。如果我们建立AI解决所有这些复杂的博士学位问题，发明了新科学，而与之互动的人，这将是一个可悲的故事。这是一个与之互动的人。这是一个反映未来的未来，我对我不满意。”他的讲话强调了确保人工智能发展优先考虑人类福祉和心理健康支持的重要性。

Openai在一个博客文章与GPT-4O相比，该GPT-5在解决粘噬体方面有了显着改善。该公司表示，更新的模型在应对心理健康紧急情况方面具有增强的能力，表明致力于解决这一关键安全问题。这些改进表明，OpenAI正在积极地改善其AI系统，以提供更负责任和支持性的互动，尤其是在敏感情况下。

展望未来，扎里巴（Zaremba）和卡林尼（Carlini）表达了他们的意图，即在安全测试上与人类和OpenAI之间的合作增加。他们希望扩大研究范围，评估未来的模型，并鼓励其他AI实验室采用类似的协作方法。对协作的重视反映了越来越多的认识，即确保AI安全需要整个行业的集体努力。

特色图像信用

Tags: Openai 人类

OpenAI和Anthropic团队联合AI安全研究

Related Posts

微软在 Windows 11 中测试 Copilot 新的 PC 洞察功能

OpenAI 退役 Atlas 浏览器，专注于新的 ChatGPT 超级应用

Pixel 11 泄漏显示大胆的洋红色和桃色

Windows 11 搜索框变得更少混乱和更多控制

X算法更新旨在让回复感觉更友好

小米推出SkyNomad N90增程SUV

Recent Posts

Recent Comments

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

OpenAI和Anthropic团队联合AI安全研究

Related Posts

微软在 Windows 11 中测试 Copilot 新的 PC 洞察功能

OpenAI 退役 Atlas 浏览器，专注于新的 ChatGPT 超级应用

Pixel 11 泄漏显示大胆的洋红色和桃色

Windows 11 搜索框变得更少混乱和更多控制

X算法更新旨在让回复感觉更友好

小米推出SkyNomad N90增程SUV

Recent Posts

Recent Comments

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

Follow Us