Dataconomy CN
Subscribe
No Result
View All Result
Dataconomy CN
Subscribe
No Result
View All Result
Dataconomy CN
No Result
View All Result

GPT-4.5在新测试中人类

Kerem GülenbyKerem Gülen
3 4 月, 2025
in Artificial Intelligence, News
Home Artificial Intelligence

Openai的GPT-4.5 表现优越 人类在加州大学圣地亚哥分校最近的Turing测试中,表明人们可以通过并排聊天来轻松地将AI误认为是真实的对话。

图灵测试长期以来已经测量了机器是否可以通过基于文本的互动作为人类。在此更新的版本中,来自加州大学圣地亚哥分校语言和认知实验室的近300名参与者都与人和AI聊天,然后再决定哪个。

GPT-4.5配备了精通流行文化的角色,他说服参与者是人类的73%,超过了50%的基准,历史上用于定义通行证。实际的人并不经常欺骗参与者。

其他系统包括Meta的Llama 3,OpenAI的GPT-4O和Eliza,这是最早的聊天机器人之一。没有定义的角色,GPT-4.5的成功率降至36%,而GPT-4O仅得分21%。

研究人员指出,通过图灵测试并不意味着人工智能像人一样真正理解语言。尽管如此,结果仍强调了这些模型如何模仿人类对话,尤其是在扮演特定角色时。这些发现当前在预印式服务器上发布,并在同行评审的版本待处理上发布。


特色图像信用

Tags: GPT-4.5Openai

Related Posts

Alphaevolve:Google的新AI如何以自我纠正为目标

Alphaevolve:Google的新AI如何以自我纠正为目标

15 5 月, 2025
Tiktok正在实施AI生成的ALT文本,以提高可获得性

Tiktok正在实施AI生成的ALT文本,以提高可获得性

15 5 月, 2025
特朗普迫使苹果重新考虑其印度iPhone策略

特朗普迫使苹果重新考虑其印度iPhone策略

15 5 月, 2025
YouTube的AI现在知道您何时要购买

YouTube的AI现在知道您何时要购买

15 5 月, 2025
SoundCloud首席执行官承认AI术语还不够清楚,因此新承诺

SoundCloud首席执行官承认AI术语还不够清楚,因此新承诺

15 5 月, 2025
准备好一个真正认识你的chatgpt了吗?

准备好一个真正认识你的chatgpt了吗?

14 5 月, 2025
Please login to join discussion

Recent Posts

  • 智能面料对战术服装性能的影响
  • Databricks在无服务的Postgres上赌注,其10亿美元的霓虹灯收购
  • Alphaevolve:Google的新AI如何以自我纠正为目标
  • Tiktok正在实施AI生成的ALT文本,以提高可获得性
  • 特朗普迫使苹果重新考虑其印度iPhone策略

Recent Comments

您尚未收到任何评论。
Dataconomy CN

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

  • Sample Page

Follow Us

  • Sample Page
No Result
View All Result
Subscribe

This website uses cookies. By continuing to use this website you are giving consent to cookies being used. Visit our Privacy Policy.