随着埃隆·马斯克宣布 xAI 的 Grok 2 AI 聊天机器人的发布日期,打造最全面的 AI 聊天机器人的竞赛正在白热化。
Grok 2 的灵感来自《钢铁侠》中的贾维斯 (JARVIS) 和《银河系漫游指南》中的导游,旨在提供实时知识并全面回答问题。
此公告是在成功推出 Grok AI 1.5,在理解长上下文和高级推理能力方面表现出了实质性的进步。
Grok 2 之旅
Grok 2 的开发建立在其前身 Grok AI 1.5 奠定的基础之上,Grok AI 1.5 在处理复杂查询和在扩展交互中保持连贯对话方面表现出色。Grok AI 1.5 设定了高标准,增强了 基准测试表现 喜欢 数学 (50.6%,4次射门)和 人力评估 (74.1%,0 次),展示了其在解决数学问题和编码任务方面的潜力。
伊隆·马斯克的 xAI 一直处于推动人工智能发展的最前沿,专注于改进用于训练模型的底层数据集。从互联网训练数据中清除大型语言模型 (LLM) 的这种细致努力解决了数据质量和相关性问题。马斯克强调了这一过程中面临的挑战,并强调 Grok 2 将在数据清洁度和模型准确性方面取得显著进步。
对 Grok 2 有何期待?
Grok 2 是 将于八月发布,并承诺提供超越其前代产品的先进 AI 功能。新版本有望在实时知识获取方面表现出色,并为用户查询提供更准确、更符合上下文的答案。这一增强功能对于确保 AI 能够精确、深入地处理各种主题尤为重要。
Grok 2 的改进归功于对高质量数据集的广泛训练和先进硬件的使用,特别是 Nvidia H100 GPU。这些 GPU 以其卓越的处理能力而闻名,能够更快、更高效地训练复杂的 AI 模型。与戴尔科技的合作进一步凸显了利用尖端技术增强 Grok 能力的决心。
Grok 2 发布后, 伊隆·马斯克 还宣布了 Grok 3 的计划,预计将于今年年底推出。Grok 3 将进行更大规模的训练,利用 100,000 个 Nvidia H100 GPU。这种巨大的计算能力预计将推动 Grok 3 超越当前的 AI 基准,在人工智能领域树立新标准。
在对 10 万辆 H100 进行训练后,Grok 3 年底应该会很特别
— 伊隆·马斯克(@elonmusk) 2024 年 7 月 1 日
Grok 2 是另一个基础的 LLM 还是什么特殊的东西?
Grok 2 的突出特点之一是它能够集成 实时网络搜索结果,为用户提供各种主题的最新信息。此功能可确保 AI 能够使用最新的可用数据响应查询,从而增强其相关性和实用性。此外,Grok 2 还集成了 图像生成能力,使其能够根据用户提示创建视觉内容。
虽然现在谈论这些还为时过早,但 MATH 和 HumanEval 基准对于评估人工智能处理复杂推理和解决问题场景的能力至关重要,而 Grok 2 的预期表现表明这些领域取得了重大进展。
与戴尔科技的合作
xAI 与戴尔科技的合作在 Grok 2 及其后续产品的开发中发挥着关键作用。戴尔科技正与 Nvidia 合作,致力于打造一个 AI 工厂,为训练和部署先进的 AI 模型提供必要的基础设施。
Nvidia H100 GPU 的使用是此次合作的关键组成部分,可提供有效训练大规模 AI 模型所需的计算能力。这些 GPU 专为高性能计算而设计,特别适合 AI 训练的苛刻要求。
展望未来
xAI 准备在 8 月发布 Grok 2,并在年底发布 Grok 3,其重点仍然是通过细致的数据准备和使用尖端技术来提升人工智能的能力。Grok 系列的不断改进凸显了人工智能处理日益复杂的任务并提供更准确、更符合情境的信息的潜力。
很明显,埃隆·马斯克的人工智能公司在 B 轮融资 帮助他攻读法学硕士学位。
特色图片来源: 人工智能