IBM公布了开源版的Granite 3.0工智能模型

AI资讯 2024-10-22
来源:www.aifind.com.cn
Granite 3 0 阵容包括一系列针对各种应用设计的模型: 通用 语言:有 8B 和 2B 变体,分为指令(Instruct)和基础(Base)配置。

IBM公布了开源版的Granite 3.0工智能模型

IBM 在其年度 TechXchange 活动上揭开了迄今为止其最先进的人工智能模型系列的面纱,该系列被称为 Granite 3.0。 Granite 3.0 阵容包括一系列针对各种应用设计的模型: 通用/语言:有 8B 和 2B 变体,分为指令(Instruct)和基础(Base)配置。

安全:有 8B 和 2B 大小的守护者(Guardian)模型,旨在实施防护栏。 混合专家(Mixture-of-Experts):一系列针对不同部署场景优化的模型。 IBM 声称,其新的 8B 和 2B 语言模型可以在众多学术和行业基准测试中与领先供应商的类似规模产品相媲美或超越它们的性能。这些模型被定位为企业人工智能的多功能主力,在检索增强生成(RAG)、分类、总结和实体提取等任务中表现出色。

Granite 3.0 系列的一个关键区别在于 IBM 对开源人工智能的承诺。这些模型在宽松的 Apache 2.0 许可证下发布,为企业客户和更广泛的人工智能社区提供了性能、灵活性和自主性的独特组合。 IBM 认为,通过将紧凑的 Granite 模型与专有的企业数据相结合,特别是使用其新颖的 InstructLab 对齐技术,企业可以以较低的成本实现与更大模型相媲美的特定任务性能。

早期的概念验证表明,潜在成本节省可高达大型前沿模型的 23 倍。 据 IBM 称,透明度和安全性仍然是其人工智能战略的前沿。该公司已为 Granite 3.0 发布了技术报告和负责任使用指南,详细说明了所使用的数据集、数据处理步骤和基准测试结果。此外,IBM 在其 watsonx.ai 平台上为所有 Granite 模型提供知识产权赔偿,为企业在将这些模型与自己的数据集成时提供更大的信心。

Granite 3.0 的 8B 指令模型显示出特别有前景的结果,在标准学术基准测试中超越了来自 Meta 和 Mistral 的类似规模的开源模型。它在 IBM 的 AttaQ 安全基准测试的所有测量安全维度上也处于领先地位。 IBM 还推出了 Granite Guardian 3.0 模型,旨在通过检查用户提示和语言模型响应中的各种风险来实施安全防护栏。这些模型提供了一套全面的风险和危害检测能力,包括对特定于 RAG 的问题(如基础扎实性和上下文相关性)的独特检查。

整个 Granite 3.0 模型套件可在 HuggingFace 上下载,在 IBM 的 watsonx 平台上有商业使用选项。IBM 还与生态系统合作伙伴合作,将 Granite 模型集成到各种产品中,为全球企业提供更多选择。 随着 IBM 继续推进其人工智能产品组合,该公司表示,它正专注于开发更复杂的人工智能代理技术,这些技术能够实现更大的自主性和复杂问题解决能力。这包括计划在 IBM watsonx Orchestrate 中引入新的人工智能代理功能,并在 2025 年在其整个产品组合中构建代理能力。

© 版权声明

相关文章

返回顶部