스타트업 커뮤니티 씬디스 (SeenThis.kr)

Snowflake 發布業界頂尖開放性企業級大型語言模型「Arctic」

  • 撰写语言: 韓国語
  • 基准国家: 所有国家country-flag
  • 信息技术

撰写: 2024-04-25

撰写: 2024-04-25 11:41

Snowflake Arctic 模型系列新增業界最佳效能與效率的開放式大型語言模型

基於 Apache 2.0 授權的開源軟體… 支援各種框架,提供可自訂的彈性

全球資料雲端企業 Snowflake 宣布推出業界頂尖的開放性和效能的企業級大型語言模型 (Large Language Model,簡稱 LLM)「Snowflake Arctic」。

Arctic 採用 Snowflake 專屬的專家混合 (MoE,Mixture-of-Experts) 架構設計,提供業界最佳效能和生產力。它經過最佳化,可以處理企業複雜的需求,在 SQL 程式碼產生、指令執行等各種標準中達到最佳狀態。

特別的是,Arctic 採用 Apache 2.0 授權,允許免費且商業用途,Snowflake 公開了 AI 訓練方法的詳細資訊,建立了企業級 AI 技術的新開放標準。此外,Arctic LLM 作為 Snowflake Arctic 模型系列的一部分,也包含用於搜尋使用的文字嵌入模型。

Snowflake 首席執行長舒里達·拉馬斯沃米 (Sridhar Ramaswamy) 表示:「Snowflake 的 AI 研究團隊在 AI 領域最前沿推動創新,為公司創造了重要的轉折點。」他進一步指出:「Snowflake 將業界最佳效能和效率的 AI 技術以開源方式公開給 AI 社群,擴展了開源 AI 的潛力。這也提升了 Snowflake 在提供客戶強大且值得信賴的 AI 模型方面的能力。」

◇ Arctic:支援廣泛合作的開源 LLM

市場研究機構 Forrester 最近發布的一份報告顯示,全球企業的 AI 決策者中,約有 46% 的人表示「為了將生成式 AI 納入其企業的 AI 戰略,他們將利用現有的開源 LLM」。Snowflake 資料雲端平台目前已在全球 9,400 多家企業和機構中使用,用於資料基礎。透過提供業界頂尖開放性的 LLM,讓他們可以利用這些資料。

作為基於 Apache 2.0 授權的開源模型,Arctic 提供了靈活性,可以選擇推理和訓練方法,並搭配程式碼範本。使用者可以使用企業偏好的框架,例如 NVIDIA NIM、NVIDIA TensorRT-LLM、vLLM 和 Hugging Face,來使用和自訂 Arctic。在 Snowflake Cortex 中,可以使用無伺服器推理立即使用 Arctic。Snowflake Cortex 是一項完全受管理的服務,提供資料雲端上的機器學習和 AI 解決方案,並包含 Hugging Face、Lamini、Microsoft Azure、NVIDIA API 目錄、Perplexity 和 Together AI 等各種模型清單。未來也將支援在 Amazon Web Services (AWS) 上使用 Arctic。

◇ 優異的資源效率和頂尖效能

Snowflake AI 研究團隊由業界頂尖的研究人員和系統工程師組成。Arctic 的建立不到 3 個月。模型訓練使用 Amazon Elastic Compute Cloud (Amazon EC2) P5 執行個體,訓練成本僅為類似模型的八分之一。Snowflake 為最先進的開放式企業級模型的訓練速度設定了新的標準,最終目標是讓使用者能夠以最佳規模建立具成本效益且自訂的模型。

Arctic 與眾不同的 MoE 設計透過精心設計的資料組裝來滿足企業的需求,從而改善訓練系統和模型效能。此外,它一次激活 4,800 億個參數中的 17 個,從而實現出色的 token 效率和業界最佳品質,提供最佳結果。為了實現突破性的效率提升,Arctic 在推理或訓練期間啟用的參數比 DBRX 少約 50%,比 Llama 3 70B 少約 75%。在編碼 (HumanEval+、MBPP+) 和 SQL 產生 (Spider) 方面,它也超越了 DBRX、Mixtral-8x7B 等其他主要開源模型的效能,同時在一般語言理解 (MMLU、大型多任務語言理解) 方面也展現出頂尖的效能。

◇ Snowflake 引領的全民 AI 創新

Snowflake 為企業提供資料基礎和最先進的 AI 建構積木,讓企業可以利用其自身資料建立實用的 AI/機器學習應用程式。當客戶透過 Snowflake Cortex 使用 Arctic 時,他們可以更容易地在資料雲端的安全和治理範圍內,以適當的規模建立生產就緒的 AI 應用程式。

包含 Arctic LLM 的 Snowflake Arctic 模型系列還包括 Snowflake 最近發布的最先進文字嵌入模型之一,Arctic Embed。此產品以 Apache 2.0 授權提供給開源社群免費使用。此產品系列包含 5 個模型,可在 Hugging Face 上立即使用,並將內建於 Snowflake Cortex 中,並以私人預覽的形式公開。此嵌入模型的大小約為類似模型的三分之一,經過最佳化以提供最佳搜尋效能,為企業提供有效且經濟的解決方案,以便將其獨特的資料集與 LLM 結合用於 RAG 或語義搜尋服務的一部分。

最近,Snowflake 還新增了 Reka 和 Mistral AI 的模型,以確保客戶能夠在資料雲端上使用最新且效能最高的 LLM。此外,Snowflake 最近宣布與 NVIDIA 擴展合作夥伴關係,繼續推動 AI 創新。Snowflake 的資料雲端與全堆疊 NVIDIA 加速平台相結合,提供安全且強大的基礎架構和運算能力,在各個產業中積極利用 AI 的生產力。Snowflake Ventures 最近也投資了 Landing AI、Mistral AI 和 Reka 等公司,以協助客戶透過其企業資料中的 LLM 和 AI 創造價值。



评论0