对于开发人工智能的公司来说,最重要的持续挑战之一是将大量企业数据集成到其人工智能模型中。
这些数据是许多人工智能应用程序的命脉,但其管理可能是一个复杂且耗时的过程。 Snorkel Flow 是 Snorkel AI 平台的最新更新,旨在为希望利用该平台的企业简化这一流程 骆驼3,来自 Meta AI 的强大 AI 模型,以及 双子座人工智能,谷歌的另一个先进的人工智能模型。
为什么管理企业数据至关重要?
企业数据包含企业在日常运营过程中收集的广泛信息。 这可以包括客户数据、财务记录、营销活动结果、机械传感器数据等等。 出于多种原因,有效管理这些数据至关重要。
首先,它使企业能够识别否则可能会被错过的趋势和模式。 例如,通过分析客户购买历史记录,公司可以发现哪些产品经常被一起购买,从而使他们能够定制促销和产品植入策略。
其次,企业数据可用于改进决策。 例如,金融机构可能会分析历史贷款数据以开发更准确的风险评估模型。 最后,企业数据对于训练人工智能模型至关重要。 这些模型需要大量标记数据才能有效地学习和执行任务。
然而,管理这些数据可能是一项重大挑战。 企业数据通常以各种格式驻留在不同的位置,因此难以访问和集成。 为人工智能训练标记数据的过程也可能既昂贵又耗时。
这是哪里 通气管流量 进来。
遏制数据洪流
Snorkel Flow 是 Snorkel AI 平台的更新,旨在简化企业数据与 AI 模型(特别是 Llama 3 和 Gemini AI)的集成。 Snorkel 使用一种称为弱标记的技术,允许用户利用未标记的数据进行训练。 这是通过定义启发式或“标记函数”来实现的,“标记函数”可以根据特定标准自动将标签分配给数据点。
例如,想象一家公司想要训练人工智能模型来识别需要紧急关注的客户支持请求。 可以创建标签功能来识别包含特定关键字或短语(例如“紧急”或“关键”)的票证。 虽然这些标签可能并不完美,但它们对于训练人工智能模型仍然很有价值。
Snorkel Flow 在此概念的基础上引入了简化的工作流程来管理数据标记流程。 它允许用户定义标签功能、管理数据源并监控生成标签的质量。 这可以显着减少为人工智能培训准备企业数据所需的时间和资源。
扩展的法学硕士和数据源集成
在一个 博客文章,Snorkel AI 详细解释了他们为 Snorkel Flow 带来的创新。 以下是新版 Snorkel Flow 的特点:
- 法学硕士整合:Snorkel Flow 现在不仅支持已建立的模型的微调,还支持 Google 的 Gemini 系列和 Meta 的 Llama 3。这拓宽了企业选择最适合其需求的 LLM 的选择范围。
- 数据源集成:与 Databricks Unity Catalog、Vertex AI 和 Microsoft Azure 机器学习的新集成简化了用于标记、管理和开发目的的数据访问。 企业可以利用 Snorkel Flow 中现有的数据基础设施。
多模式数据支持(测试版)
- 图像处理:Snorkel Flow 引入了图像编程标记功能(目前处于测试阶段)。 这使得企业能够利用图像数据和文本数据进行法学硕士培训。 企业可以使用此功能从视觉数据中提取见解并将其与人工智能解决方案集成。
增强的安全性和可访问性
- 基于角色的访问控制 (RBAC):此功能使管理员能够对 Snorkel Flow 中的数据访问进行精细控制。 这可以确保通过限制对特定用户和数据源的访问来保护敏感信息。
改进的文档处理: - 基于基础模型 (FM) 的 PDF 工作流程:Snorkel Flow 现在包含一个专用的 PDF 提示 UI,用于标记 PDF。 这利用先进的基础模型来简化从复杂文档中提取有价值的见解的过程。
简化的法学硕士整合:
- 增强型SDK:升级后的SDK可以更轻松地与各种定制的LLM服务集成,为企业的AI开发流程提供更大的灵活性。
- 数据块集成:与 Databricks Unity Catalog 无缝兼容,可以在现有工作流程中轻松部署模型。 Vertex AI 和 Azure 机器学习也提供类似的集成。
简化的数据注释
- 多任务注释(R2 发布预览):此功能目前处于预览阶段,允许 SME(主题专家)为单个项目中的多个任务注释数据。 这通过减少项目设置时间和简化工作流程来提高效率。
与 Llama 3 和 Gemini AI 集成
Snorkel Flow 专门与 Llama 3 和 Gemini AI 这两个强大的 AI 模型集成。 Llama 3 由 Meta AI 开发,是一种事实语言模型,在海量文本和代码数据集上进行训练。 这使得它能够以信息丰富的方式理解和响应复杂的查询。 另一方面,Gemini AI 是一种生成语言模型,能够创建不同的创意文本格式,如诗歌、代码、脚本、音乐作品、电子邮件、信件等。
通过将 Snorkel Flow 与这些模型集成,企业可以利用人工智能的力量从企业数据中提取见解并自动执行各种任务。 例如,Llama 3 可用于分析客户评论并识别常见主题或投诉。 与此同时,Gemini AI 可用于根据现有数据生成创意营销文案或产品描述。
通过简化数据标记流程并提供与 Llama 3 和 Gemini AI 等强大模型的兼容性,Snorkel Flow 有望为寻求利用 AI 力量的企业释放新的可能性。
特色图片来源: rawpixel.com/Freepik