一段时间以来,一直有传言称谷歌可能会对人工智能增强的搜索结果收取费用,特别是通过拟议的包含生成人工智能的高级搜索服务。 这一发展的未来仍不确定,但随着谷歌停止免费访问其 Gemini API,一个明显的转变是显而易见的,这标志着其人工智能金融方法的战略支点。
谷歌最初提供对其人工智能产品的免费访问,以吸引开发人员并与 OpenAI 的早期市场份额竞争。 OpenAI 已经开始利用其 API 和大型语言模型。 现在,谷歌的目标是通过其云和 AI Studio 产品中的服务货币化来效仿,这表明不受限制的免费访问时代可能即将结束。
PaLM API 早已不复存在
在一封发给开发者的电子邮件中 技术雷达之后,谷歌宣布将于 8 月 15 日起通过 AI Studio 停止使用 PaLM API,PaLM API 是用于制作自定义聊天机器人的 Gemini 模型的前身。该 API 已于 2 月份逐步淘汰。 谷歌的策略是通过推广更可靠的Gemini 1.0 Pro来让用户从免费服务过渡。 该电子邮件建议:
“我们鼓励使用稳定的 Gemini 1.0 Pro 来测试提示、调整、推理和其他功能,以避免中断。 您可以使用与 PaLM API 相同的 API 密钥通过 Google AI SDK 访问 Gemini 模型。”
付费版本的成本结构从 100 万个输入代币 7 美元开始,到相同数量的输出代币为 21 美元。 谷歌的计划中有一个例外: PaLM 和 Gemini 将继续向在 Google Cloud 内订阅 Vertex AI 的客户提供。
帕尔姆和 双子座 将继续向那些在 Google Cloud 上投资 Vertex AI 的人提供。 相比之下,对于预算紧张、发现 Vertex AI 成本过高的开发人员来说,AI Studio 仍然是更容易获得的选择。
谷歌的 API 由公司自己的数据中心内的硬件提供支持,Gemini 在专门为训练和推理任务设计的 TPU 上运行。
在对基础设施的重大投资中,谷歌已拨款数十亿美元用于建设新的数据中心,其中包括最近承诺在英国建设一座设施的 10 亿美元。
由于缺乏既定的人工智能收入模式,为支持人工智能运营而对数据中心进行大量投资意味着相当大的风险。 然而,随着大型语言模型 (LLM) 的采用不断扩大,来自 API 等服务的适度收入流可能有助于抵消与开发必要的硬件和数据中心相关的大量成本。
同样,其他人工智能公司也在新数据中心投资数十亿美元,旨在产生足够的人工智能驱动收入来支付这些巨额开支。
特色图片来源: 罗米切尔/Unsplash