Dataconomy CN
Subscribe
No Result
View All Result
Dataconomy CN
Subscribe
No Result
View All Result
Dataconomy CN
No Result
View All Result

随着 xAI 与 GPT 5.1 的竞争,Grok 4.1 现已免费发布

Emre ÇıtakbyEmre Çıtak
18 11 月, 2025
in 人工智能, 消息
Home 消息 人工智能
Share on FacebookShare on Twitter
Google Preferred Source

埃隆·马斯克 (Elon Musk) 旗下的 xAI 已开始推出 Grok 4.1,这是 Grok 4 模型的升级版。该版本提高了质量和速度,所有用户都可以免费访问以增强大型语言模型的性能。 xAI推出了两个版本的新模型:Grok 4.1和Grok 4.1 Thinking。两者都比之前的迭代进行了渐进式改进。免费用户可以立即访问这些模型,而付费客户则可以从减少的使用限制中受益。 xAI 表示,与之前的模型相比,Grok 4.1 将幻觉率降低了三倍。这一进步使该版本成为 xAI 迄今为止最强大的产品之一。模型生成不准确信息的幻觉是大型语言模型开发中的一个关键挑战,而这种减少源于有针对性的训练增强。与最近推出的 GPT 5.1 等竞争对手的性能相比,GPT 5.1 在性能和情商方面都有所提高,但仍无法通过直接比较得到证实。 GPT 5.1 的更新重点是提高交互中的响应准确性和上下文理解。 LMArena 的 Text Arena 提供了 Grok 4.1 的早期性能数据。这个开源工具可以对大型语言模型进行并排、盲式和随机比较。用户提交提示,平台配对匿名响应,根据人类偏好对模型进行排名。 Text Arena 的早期基准测试将 Grok 4.1(思考)以 1510 分在 Arena Expert 排行榜上排名第一。Grok 4.1 以 1437 分排名第 19 位。这些结果表明这两个模型在竞争激烈的 Text Arena 环境中取得了新的位置。该基准平台观察到,“自两个月前登陆 Arena 的 Grok 4 fast 以来,这是 40 多点的改进。” Grok 4 于 2025 年 9 月快速进入排行榜,建立了 Grok 4.1 现在大幅超越的基线。 https://twitter.com/arena/status/1990530978943787291


特色图片来源

Tags: 格罗克4.1赛

Related Posts

索尼公布 PS5 版《战神:Laufey》

索尼公布 PS5 版《战神:Laufey》

3 6 月, 2026
微软推出适用于人工智能工作负载的 Surface RTX Spark Dev Box

微软推出适用于人工智能工作负载的 Surface RTX Spark Dev Box

3 6 月, 2026
Anthropic 邀请另外 150 个组织加入 Glasswing 项目

Anthropic 邀请另外 150 个组织加入 Glasswing 项目

3 6 月, 2026
六月 Android Drop 带来安全工具和更智能的搜索功能

六月 Android Drop 带来安全工具和更智能的搜索功能

3 6 月, 2026
微软推出 Project Solara,打造代理优先的未来

微软推出 Project Solara,打造代理优先的未来

3 6 月, 2026
X 推出 TikTok 风格的帖子视频回复

X 推出 TikTok 风格的帖子视频回复

3 6 月, 2026
Please login to join discussion

Recent Posts

  • 谷歌人工智能搜索选择退出规则引发 Enviromates 浏览器的推出
  • 索尼公布 PS5 版《战神:Laufey》
  • 研究人员将超快激光实验增强了 20 倍
  • 微软推出适用于人工智能工作负载的 Surface RTX Spark Dev Box
  • 据报道,英特尔新款Core Ultra芯片供不应求

Recent Comments

您尚未收到任何评论。
Dataconomy CN

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

  • Sample Page

Follow Us

  • Sample Page
No Result
View All Result
Subscribe

This website uses cookies to improve your experience. You can choose to accept or reject them. Visit our Privacy Policy.