![translation](https://cdn.durumis.com/common/trans.png)
这是AI翻译的帖子。
选择语言
durumis AI 总结的文章
- Snowflake 推出同級最佳效能和效率的開放原始碼大型語言模型 (LLM)「Arctic」。
- Arctic 採用 Apache 2.0 授權,可免費進行商業使用,並支援各種框架,可進行客製化。
- 透過 Arctic,Snowflake 為企業提供所需的數據基礎和最先進的 AI 構建積木,讓他們可以利用自己的數據來建立實用的 AI/機器學習應用程式。
Snowflake Arctic 模型家族中增加了同类最佳性能和效率的开放式大型语言模型
基于 Apache 2.0 许可证的开源软件……提供支持各种框架的灵活性,可以进行自定义
全球数据云公司 Snowflake 推出了企业级大型语言模型 (LLM)“Snowflake Arctic”,它具有业界领先的开放性和性能。
Arctic 基于 Snowflake 独有的专家混合 (MoE·Mixture-of-Experts) 方式设计,支持同类最佳的性能和生产力。 它经过优化,可以处理企业的复杂需求,并在各种标准(包括 SQL 代码生成、命令执行等)中满足最高条件。
特别是,Arctic 采用 Apache 2.0 许可证,可免费用于商业用途。Snowflake 公开有关 AI 训练方法的详细信息,为企业级 AI 技术建立了新的开放标准。 Arctic LLM 是 Snowflake Arctic 模型家族的一部分,还包括用于搜索的文本嵌入模型。
Snowflake 首席执行官 Sridhar Ramaswamy 表示:“Snowflake AI 研究团队在 AI 领域的最前沿推动着创新,为我们公司带来了重要的转折点。” “Snowflake 通过将业界领先的性能和效率开源,为 AI 社区敞开大门,扩展了开源 AI 的可能性。 Snowflake 的 AI 能力也得到了提升,能够为客户提供强大且值得信赖的 AI 模型。”
◇ Arctic,支持广泛合作的开源 LLM
市场研究机构 Forrester 最近发布的一份报告显示,全球企业的 AI 决策者中约有 46% 表示,他们会“利用现有的开源 LLM 将生成式 AI 纳入其公司的 AI 战略”。 Snowflake 数据云平台目前为全球 9400 多家企业和机构提供数据基础。 这些企业可以通过提供业界领先的开放性的 LLM 来利用数据。
作为采用 Apache 2.0 许可证的开源模型,Arctic 还提供灵活的推理和训练方法选择,以及代码模板。 用户可以使用企业最喜爱的框架(如 NVIDIA NIM、NVIDIA TensorRT-LLM、vLLM、Hugging Face 等)来使用和自定义 Arctic。 Snowflake Cortex 可以通过无服务器推理立即使用 Arctic。 Snowflake Cortex 是一款完全托管的服务,在数据云中提供机器学习和 AI 解决方案,包括各种模型列表,如 Hugging Face、Lamini、Microsoft Azure、NVIDIA API Catalog、Perplexity 和 Together AI。 Arctic 也将很快在亚马逊网络服务 (AWS) 上可用。
◇ 出色的资源效率和最高水平的性能
Snowflake AI 研究团队由业界领先的研究人员和系统工程师组成。 Arctic 的构建耗时不到三个月。 模型训练使用了 Amazon Elastic Compute Cloud (Amazon EC2) P5 实例,训练成本仅为类似模型的八分之一。 Snowflake 为最先进的开源企业级模型的训练速度设定了新的标准,最终帮助用户以最佳规模创建具有成本效益的定制模型。
Arctic 的差异化 MoE 设计通过根据企业需求精心设计的精细数据组装,提高了学习系统和模型性能。 此外,通过一次激活 17 个包含 4800 亿个参数,实现了出色的令牌效率和业界领先的质量,从而提供最佳结果。 为了显著提高效率,Arctic 在推理或训练过程中激活的参数比 DBRX 少约 50%,比 Llama 3 70B 少约 75%。 在编码 (HumanEval+、MBPP+) 和 SQL 生成 (Spider) 方面,Arctic 的性能优于现有的开源模型(例如 DBRX 和 Mixtral-8x7B),同时在通用语言理解 (MMLU,大型多任务语言理解) 方面表现出顶尖的性能。
◇ Snowflake 引领的 AI 创新,惠及所有人
Snowflake 为企业提供构建实用的 AI/机器学习应用程序所需的数据基础和最先进的 AI 构建块,以便他们能够利用自己的数据。 当客户通过 Snowflake Cortex 使用 Arctic 时,构建生产级 AI 应用程序的难度会降低,并且可以适当地扩展到数据云的安全性和治理范围内。
Snowflake Arctic 模型家族包括 Arctic LLM,其中还包括 Snowflake 最近发布的最先进的文本嵌入模型之一,即 Arctic embed。 该产品在 Apache 2.0 许可证下开源,社区可以免费使用。 该家族由五个模型组成,可以在 Hugging Face 上直接使用,并将内置于 Snowflake Cortex 中,以私人预览版的方式发布。 该嵌入模型的尺寸仅为同类模型的三分之一,经过优化,可以提供最佳的搜索性能,为企业在将独特的的数据集与 LLM 结合使用以构建搜索增强生成 (RAG) 或语义搜索服务时,提供了经济高效的解决方案。
最近,Snowflake 还添加了 Reka 和 Mistral AI 的模型,帮助客户在数据云中访问性能最高的最新 LLM。 此外,Snowflake 近期宣布与 NVIDIA 扩展合作伙伴关系,持续推动 AI 创新。 Snowflake 的数据云与全栈 NVIDIA 加速平台相结合,为各个行业提供了安全、强大的基础设施和计算能力,可以充分利用 AI 的生产力。 Snowflake Ventures 最近还投资了 Landing AI、Mistral AI 和 Reka 等公司,帮助客户利用他们自己的企业数据从 LLM 和 AI 中获取价值。