Google已向公众开放了其最新的AI模型套件Gemini 2.0,这标志着它推向高级AI代理的重要一步。该套件包括Gemini 2.0 Pro实验,设计用于编码和复杂任务,以及Gemini 2.0 Flash Thinking,现在在Gemini应用中可用。
双子座2.0家庭现在向所有人开放
Gemini 2.0 Pro实验被描述为Google迄今为止最强大的模型,在编码和处理复杂的提示方面表现出色。它拥有200万个令牌的上下文窗口,使其能够一次处理约150万个单词。该模型可以调用Google搜索和代表用户执行代码之类的工具。最初在上周在Gemini App的ChangElog中取笑,现在可以通过Google的AI开发平台,Vertex AI和Google AI Studio以及Gemini App中的Gemini Advanced订户访问。
Gemini 2.0 Flash于12月推出,现在通常可用。它被称为“主力模型”,它针对大量,高频任务和成本进行了优化,开发人员的文本,图像和视频输入为每百万个代币10美分。此外,Google推出了Gemini 2.0 Flash-Lite,它的最具成本效益的型号,其前身Gemini 1.5 Flash的性能以相同的价格和速度匹配。 Flash-Lite的价格为每百万个令牌0.75美分。
专注于AI代理商
这 发布 与Google的更广泛的策略相吻合,该策略可以自主执行复杂的多步骤任务。在12月的博客文章中,Google强调了其专注于开发模型,这些模型“更多地了解您周围的世界,思考未来的多个步骤,并代表您采取行动。” Gemini 2.0推出了新的多模式功能,包括本机图像和音频输出以及工具使用,使Google更加接近其对通用助手的愿景。
这推动了Google与其他科技巨头和初创公司直接竞争,例如Meta,Amazon,Microsoft,Openai和人类 代理AI。例如,人类的AI代理可以类似于人类的计算机导航,以数十个或数百个步骤完成任务。 Openai最近发布了操作员,该操作员能够自动化假期计划和杂货店订购等任务,而深入研究则为用户编写了复杂的报告。
Google还在12月推出了自己的深入研究工具,该工具是探索主题并编译详细报告的研究助理。首席执行官Sundar Pichai强调了执行对第一次的重要性,并在12月的战略会议上说:“我认为这就是2025年的全部意义。”
与DeepSeek竞争
Google的发行越来越多,因为对中国AI初创公司DeepSeek的关注越来越多,其模型与美国领先的公司相抗衡。 DeepSeek的R1模型 由于其负担能力和性能,获得了大量的吸引力。为了解决这个问题,Google正在使其Gemini 2.0 Flash Thinky模型通过Gemini应用程序更易于访问,从而有可能吸引人们对其产品的更多关注。