埃隆·马斯克 (Elon Musk) 旗下的 xAI 已开始推出 Grok 4.1,这是 Grok 4 模型的升级版。该版本提高了质量和速度,所有用户都可以免费访问以增强大型语言模型的性能。 xAI推出了两个版本的新模型:Grok 4.1和Grok 4.1 Thinking。两者都比之前的迭代进行了渐进式改进。免费用户可以立即访问这些模型,而付费客户则可以从减少的使用限制中受益。 xAI 表示,与之前的模型相比,Grok 4.1 将幻觉率降低了三倍。这一进步使该版本成为 xAI 迄今为止最强大的产品之一。模型生成不准确信息的幻觉是大型语言模型开发中的一个关键挑战,而这种减少源于有针对性的训练增强。与最近推出的 GPT 5.1 等竞争对手的性能相比,GPT 5.1 在性能和情商方面都有所提高,但仍无法通过直接比较得到证实。 GPT 5.1 的更新重点是提高交互中的响应准确性和上下文理解。 LMArena 的 Text Arena 提供了 Grok 4.1 的早期性能数据。这个开源工具可以对大型语言模型进行并排、盲式和随机比较。用户提交提示,平台配对匿名响应,根据人类偏好对模型进行排名。 Text Arena 的早期基准测试将 Grok 4.1(思考)以 1510 分在 Arena Expert 排行榜上排名第一。Grok 4.1 以 1437 分排名第 19 位。这些结果表明这两个模型在竞争激烈的 Text Arena 环境中取得了新的位置。该基准平台观察到,“自两个月前登陆 Arena 的 Grok 4 fast 以来,这是 40 多点的改进。” Grok 4 于 2025 年 9 月快速进入排行榜,建立了 Grok 4.1 现在大幅超越的基线。 https://twitter.com/arena/status/1990530978943787291





