- 스노우플레이크, 업계 최고 수준의 개방성 갖춘 엔터프라이즈급 LLM ‘아크틱’ 출시 > 뉴스 - 스타트업 커뮤니티 씬디스
- 스노우플레이크 아크틱 모델군에 동급 최고 성능·효율 갖춘 개방형 대규모언어모델 추가아파치 2.0 라이선스 기반 오픈소스… 다양한 프레임워크 지원…, 스타트업에 종사하시는 여러분들의 놀이터 씬디스는 스타트업 커뮤니티 입니다.
Snowflake Arctic 模型系列新增業界最佳效能與效率的開放式大型語言模型
基於 Apache 2.0 授權的開源軟體… 支援各種框架,提供可自訂的彈性
全球資料雲端企業 Snowflake 宣布推出業界頂尖的開放性和效能的企業級大型語言模型 (Large Language Model,簡稱 LLM)「Snowflake Arctic」。
Arctic 採用 Snowflake 專屬的專家混合 (MoE,Mixture-of-Experts) 架構設計,提供業界最佳效能和生產力。它經過最佳化,可以處理企業複雜的需求,在 SQL 程式碼產生、指令執行等各種標準中達到最佳狀態。
特別的是,Arctic 採用 Apache 2.0 授權,允許免費且商業用途,Snowflake 公開了 AI 訓練方法的詳細資訊,建立了企業級 AI 技術的新開放標準。此外,Arctic LLM 作為 Snowflake Arctic 模型系列的一部分,也包含用於搜尋使用的文字嵌入模型。
Snowflake 首席執行長舒里達·拉馬斯沃米 (Sridhar Ramaswamy) 表示:「Snowflake 的 AI 研究團隊在 AI 領域最前沿推動創新,為公司創造了重要的轉折點。」他進一步指出:「Snowflake 將業界最佳效能和效率的 AI 技術以開源方式公開給 AI 社群,擴展了開源 AI 的潛力。這也提升了 Snowflake 在提供客戶強大且值得信賴的 AI 模型方面的能力。」
◇ Arctic:支援廣泛合作的開源 LLM
市場研究機構 Forrester 最近發布的一份報告顯示,全球企業的 AI 決策者中,約有 46% 的人表示「為了將生成式 AI 納入其企業的 AI 戰略,他們將利用現有的開源 LLM」。Snowflake 資料雲端平台目前已在全球 9,400 多家企業和機構中使用,用於資料基礎。透過提供業界頂尖開放性的 LLM,讓他們可以利用這些資料。
作為基於 Apache 2.0 授權的開源模型,Arctic 提供了靈活性,可以選擇推理和訓練方法,並搭配程式碼範本。使用者可以使用企業偏好的框架,例如 NVIDIA NIM、NVIDIA TensorRT-LLM、vLLM 和 Hugging Face,來使用和自訂 Arctic。在 Snowflake Cortex 中,可以使用無伺服器推理立即使用 Arctic。Snowflake Cortex 是一項完全受管理的服務,提供資料雲端上的機器學習和 AI 解決方案,並包含 Hugging Face、Lamini、Microsoft Azure、NVIDIA API 目錄、Perplexity 和 Together AI 等各種模型清單。未來也將支援在 Amazon Web Services (AWS) 上使用 Arctic。
◇ 優異的資源效率和頂尖效能
Snowflake AI 研究團隊由業界頂尖的研究人員和系統工程師組成。Arctic 的建立不到 3 個月。模型訓練使用 Amazon Elastic Compute Cloud (Amazon EC2) P5 執行個體,訓練成本僅為類似模型的八分之一。Snowflake 為最先進的開放式企業級模型的訓練速度設定了新的標準,最終目標是讓使用者能夠以最佳規模建立具成本效益且自訂的模型。
Arctic 與眾不同的 MoE 設計透過精心設計的資料組裝來滿足企業的需求,從而改善訓練系統和模型效能。此外,它一次激活 4,800 億個參數中的 17 個,從而實現出色的 token 效率和業界最佳品質,提供最佳結果。為了實現突破性的效率提升,Arctic 在推理或訓練期間啟用的參數比 DBRX 少約 50%,比 Llama 3 70B 少約 75%。在編碼 (HumanEval+、MBPP+) 和 SQL 產生 (Spider) 方面,它也超越了 DBRX、Mixtral-8x7B 等其他主要開源模型的效能,同時在一般語言理解 (MMLU、大型多任務語言理解) 方面也展現出頂尖的效能。
◇ Snowflake 引領的全民 AI 創新
Snowflake 為企業提供資料基礎和最先進的 AI 建構積木,讓企業可以利用其自身資料建立實用的 AI/機器學習應用程式。當客戶透過 Snowflake Cortex 使用 Arctic 時,他們可以更容易地在資料雲端的安全和治理範圍內,以適當的規模建立生產就緒的 AI 應用程式。
包含 Arctic LLM 的 Snowflake Arctic 模型系列還包括 Snowflake 最近發布的最先進文字嵌入模型之一,Arctic Embed。此產品以 Apache 2.0 授權提供給開源社群免費使用。此產品系列包含 5 個模型,可在 Hugging Face 上立即使用,並將內建於 Snowflake Cortex 中,並以私人預覽的形式公開。此嵌入模型的大小約為類似模型的三分之一,經過最佳化以提供最佳搜尋效能,為企業提供有效且經濟的解決方案,以便將其獨特的資料集與 LLM 結合用於 RAG 或語義搜尋服務的一部分。
最近,Snowflake 還新增了 Reka 和 Mistral AI 的模型,以確保客戶能夠在資料雲端上使用最新且效能最高的 LLM。此外,Snowflake 最近宣布與 NVIDIA 擴展合作夥伴關係,繼續推動 AI 創新。Snowflake 的資料雲端與全堆疊 NVIDIA 加速平台相結合,提供安全且強大的基礎架構和運算能力,在各個產業中積極利用 AI 的生產力。Snowflake Ventures 最近也投資了 Landing AI、Mistral AI 和 Reka 等公司,以協助客戶透過其企業資料中的 LLM 和 AI 創造價值。
评论0