在一个由云端的臃肿人工智能模型主导的世界中,Mistral AI 正在颠覆剧本。这家法国初创公司刚刚 释放 两个新模型 – Ministral 3B 和 8B – 设计用于在边缘设备上运行。
Les Ministraux:Ministral 3B 和 8B
Mistral 的新产品被称为“Les Ministraux”,听起来可能像一部法国艺术电影,但这些模型有望撼动人工智能世界。 Ministraux 系列分别仅有 30 亿和 80 亿个参数,注重效率。忘记那些需要数据中心才能运行的占用资源的人工智能模型吧。
“我们最具创新性的客户和合作伙伴越来越多地要求对关键应用程序进行本地、隐私优先的推理,”米斯特拉尔解释道。
上下文长度前所未有
这就是真正棘手的地方:3B 和 8B 模型都可以处理 128,000 个令牌的上下文窗口。这相当于一本 50 页的书。作为比较,即使是 OpenAI GPT-4涡轮增压 上限大约相同的代币数量,这是一个不小的壮举。
凭借这种能力,Ministraux 型号不仅优于其前身 Mistral 7B,而且还超越了 Google 的产品 杰玛2 2B 和 Meta 的 Llama 模型 早餐。

根据 Mistral 自己的基准测试,3B 模型在多任务语言理解评估中得分为 60.9,而 Llama 3.2 3B 和 Gemma 2 2B 等竞争对手分别以 56.2 和 52.4 落后。

对于“较小”的模型来说还不错,对吧?
当人工智能世界中的其他人都在争先恐后地制造更大、更糟糕、消耗能量的模型时,米斯特拉尔却在玩不同的游戏。通过在本地设备上运行,Les Ministraux 消除了对大型云服务器的需求,从而提供了更加环保的选择。这一举措完全符合科技公司日益增加的环保意识压力。人工智能可能是未来,但没有人希望这个未来以牺牲地球为代价。
还有隐私角度。由于一切都在本地运行,您的数据保留在您的设备上,这对于医疗保健和金融等行业来说是一个巨大的胜利,这些行业越来越多地关注如何处理敏感信息。你可以将其视为没有窥探的人工智能——在每个应用程序似乎都比美国国家安全局收集更多数据的世界中,这是一个令人耳目一新的变化。
米斯特拉尔的总体规划:构建、破坏、重复
但我们不要自欺欺人了——米斯特拉尔这样做不仅仅是为了更大的利益。该公司由 Meta 和谷歌 DeepMind 的校友共同创立,致力于掀起波澜。他们已经筹集了 6.4 亿美元的风险投资,并专注于构建人工智能模型,这些模型不仅可以与 OpenAI 的 GPT-4 和 Anthropic 的 Claude 等产品相媲美,而且还能在此过程中实现盈利。
虽然在生成人工智能领域赚钱就像中彩票一样容易,但米斯特拉尔并没有退缩。事实上,他们从去年夏天开始创造收入,这比他们的许多竞争对手都多。
通过提供用于研究目的的 Ministral 8B 并通过其云平台 La Platforme 提供这两种模型,Mistral 将自己定位为 AI 领域的酷孩子——足够开放以吸引开发人员,但又足够聪明,可以通过战略合作伙伴关系将其技术货币化。这是一种混合方法,类似于红帽等开源巨头在 Linux 世界中所做的事情,在保持收银机响亮的同时培育社区。
图片来源: 米斯特拉尔