- 스노우플레이크, 업계 최고 수준의 개방성 갖춘 엔터프라이즈급 LLM ‘아크틱’ 출시 > 뉴스 - 스타트업 커뮤니티 씬디스
- 스노우플레이크 아크틱 모델군에 동급 최고 성능·효율 갖춘 개방형 대규모언어모델 추가아파치 2.0 라이선스 기반 오픈소스… 다양한 프레임워크 지원…, 스타트업에 종사하시는 여러분들의 놀이터 씬디스는 스타트업 커뮤니티 입니다.
स्नोफ्लेक आर्कटिक मॉडल लाइनअप में उद्योग-अग्रणी प्रदर्शन और दक्षता वाला एक ओपन-सोर्स लार्ज लैंग्वेज मॉडल जोड़ा गया
अपाचे 2.0 लाइसेंस के तहत ओपन-सोर्स... विभिन्न फ्रेमवर्क के समर्थन के साथ अनुकूलन क्षमता प्रदान करता है
वैश्विक डेटा क्लाउड कंपनी स्नोफ्लेक (Snowflake) ने उद्योग-अग्रणी खुलापन और प्रदर्शन के साथ एक एंटरप्राइज़-ग्रेड लार्ज लैंग्वेज मॉडल (LLM) 'स्नोफ्लेक आर्कटिक (Snowflake Arctic)' लॉन्च किया है।
स्नोफ्लेक के स्वामित्व वाले मिश्रण-विशेषज्ञ (MoE - Mixture-of-Experts) दृष्टिकोण का उपयोग करके डिज़ाइन किया गया, आर्कटिक उद्योग-अग्रणी प्रदर्शन और उत्पादकता प्रदान करता है। यह व्यावसायिक रूप से जटिल आवश्यकताओं को पूरा करने के लिए अनुकूलित है, जो SQL कोड जेनरेशन, कमांड निष्पादन और अन्य मानदंडों में सर्वोत्तम परिणाम प्रदान करता है।
विशेष रूप से, आर्कटिक अपाचे 2.0 लाइसेंस के तहत मुफ्त और वाणिज्यिक उपयोग के लिए उपलब्ध है, और स्नोफ्लेक ने एआई प्रशिक्षण विधियों के बारे में विस्तृत जानकारी साझा की है, जिससे एंटरप्राइज़-ग्रेड एआई तकनीक के लिए एक नया खुला मानक स्थापित होता है। आर्कटिक एलएलएम स्नोफ्लेक आर्कटिक मॉडल परिवार (Snowflake Arctic model family) का हिस्सा है, जिसमें खोज उपयोग के लिए पाठ एम्बेडिंग मॉडल भी शामिल है।
स्नोफ्लेक के सीईओ श्रीधर रामस्वामी (Sridhar Ramaswamy) ने कहा, "स्नोफ्लेक की एआई अनुसंधान टीम एआई के क्षेत्र में अग्रणी है और हमारे लिए एक महत्वपूर्ण मोड़ का प्रतीक है।" उन्होंने आगे कहा, "स्नोफ्लेक ओपन-सोर्स एआई की क्षमता को बढ़ाते हुए, उद्योग-अग्रणी प्रदर्शन और दक्षता के साथ एआई समुदाय के लिए ओपन-सोर्स बनाकर इसे साझा कर रहा है। इससे स्नोफ्लेक की एआई क्षमताएं भी मजबूत होती हैं, जो ग्राहकों को सक्षम और भरोसेमंद एआई मॉडल प्रदान करने में सक्षम बनाती हैं।"
◇ आर्कटिक: एक ओपन-सोर्स एलएलएम जो व्यापक सहयोग का समर्थन करता है
फोरेस्टर (Forrester) द्वारा हाल ही में प्रकाशित एक रिपोर्ट में पाया गया कि वैश्विक संगठनों में लगभग 46% एआई निर्णय निर्माता अपनी एआई रणनीति के हिस्से के रूप में जेनेरेटिव एआई को अपनाने के लिए मौजूदा ओपन-सोर्स एलएलएम का उपयोग करते हैं। स्नोफ्लेक डेटा क्लाउड प्लेटफॉर्म वर्तमान में दुनिया भर के 9,400 से अधिक संगठनों द्वारा उपयोग किया जा रहा है। वे उद्योग-अग्रणी खुलेपन के साथ एलएलएम के माध्यम से अपने डेटा का उपयोग कर सकते हैं।
अपाचे 2.0 लाइसेंस के तहत एक ओपन-सोर्स मॉडल के रूप में, आर्कटिक कोड टेम्पलेट के साथ-साथ अनुमान और प्रशिक्षण विधियों को चुनने की लचीलापन प्रदान करता है। उपयोगकर्ता आर्कटिक को अपने पसंदीदा फ्रेमवर्क जैसे एनवीडिया (NVIDIA) एनआईएम (NIM), एनवीडिया टेंसरआरटी-एलएलएम (TensorRT-LLM), vLLM और हगिंग फेस (Hugging Face) के साथ उपयोग और अनुकूलित कर सकते हैं। स्नोफ्लेक कॉर्टेक्स (Snowflake Cortex) में, सर्वरलेस अनुमान के माध्यम से आर्कटिक को तुरंत उपयोग किया जा सकता है। स्नोफ्लेक कॉर्टेक्स एक पूरी तरह से प्रबंधित सेवा है जो डेटा क्लाउड में मशीन लर्निंग और एआई समाधान प्रदान करता है, जिसमें हगिंग फेस (Hugging Face), लैमिनी (Lamini), माइक्रोसॉफ्ट एज़्योर (Microsoft Azure), एनवीडिया एपीआई कैटलॉग (NVIDIA API Catalog), परपलेक्सिटी (Perplexity), टुगेदर एआई (Together AI) और कई अन्य मॉडल शामिल हैं। आर्कटिक का उपयोग अमेज़ॅन वेब सर्विसेज (AWS) पर भी किया जा सकेगा।
◇ उत्कृष्ट संसाधन दक्षता और अग्रणी प्रदर्शन
स्नोफ्लेक की एआई अनुसंधान टीम में उद्योग के सर्वश्रेष्ठ शोधकर्ता और सिस्टम इंजीनियर शामिल हैं। आर्कटिक के निर्माण में तीन महीने से भी कम समय लगा। मॉडल प्रशिक्षण के लिए अमेज़ॅन इलास्टिक कंप्यूट क्लाउड (Amazon Elastic Compute Cloud, Amazon EC2) P5 इंस्टेंस का उपयोग किया गया था, और प्रशिक्षण लागत तुलनीय मॉडल की तुलना में 8 गुना कम थी। स्नोफ्लेक अत्याधुनिक ओपन-सोर्स एंटरप्राइज़-ग्रेड मॉडल प्रशिक्षण गति के लिए एक नया मानक स्थापित कर रहा है, जिसका अंतिम लक्ष्य उपयोगकर्ताओं को लागत-प्रभावी और अनुकूलित मॉडल को इष्टतम पैमाने पर बनाने में सक्षम बनाना है।
आर्कटिक का विशिष्ट MoE डिज़ाइन प्रशिक्षण प्रणाली और मॉडल प्रदर्शन दोनों को बढ़ाता है, जो व्यवसाय की आवश्यकताओं के अनुरूप डेटा संग्रह का उपयोग करता है। इसके अतिरिक्त, 480 बिलियन पैरामीटर को एक बार में 17 तक सक्रिय करके, यह उत्कृष्ट टोकन दक्षता और उद्योग-अग्रणी गुणवत्ता प्रदान करता है, जिससे सर्वोत्तम परिणाम प्राप्त होते हैं। अनुमान या प्रशिक्षण के दौरान, आर्कटिक नाटकीय दक्षता में सुधार के लिए DBRX की तुलना में लगभग 50% और Llama 3 70B की तुलना में लगभग 75% कम पैरामीटर को सक्रिय करता है। कोडिंग (HumanEval+, MBPP+) और SQL जेनरेशन (Spider) में, यह DBRX, Mixtral-8x7B जैसे प्रमुख मौजूदा ओपन-सोर्स मॉडल को बेहतर बनाता है, जबकि सामान्य भाषा समझ (MMLU, बड़े पैमाने पर बहु-कार्य भाषा समझ) में शीर्ष प्रदर्शन करता है।
◇ स्नोफ्लेक द्वारा संचालित: सभी के लिए एआई क्रांति
स्नोफ्लेक व्यवसायों को उनके डेटा का उपयोग करके व्यावहारिक एआई/मशीन लर्निंग एप्लिकेशन बनाने के लिए आवश्यक डेटा नींव और अत्याधुनिक एआई बिल्डिंग ब्लॉक प्रदान करता है। स्नोफ्लेक कॉर्टेक्स के माध्यम से आर्कटिक का उपयोग करने वाले ग्राहक डेटा क्लाउड के भीतर सुरक्षा और शासन के दायरे में उत्पादन-तैयार एआई एप्लिकेशन को इष्टतम पैमाने पर बनाना आसान पाते हैं।
स्नोफ्लेक आर्कटिक मॉडल परिवार में आर्कटिक एलएलएम के साथ-साथ स्नोफ्लेक द्वारा हाल ही में जारी किए गए अत्याधुनिक टेक्स्ट एम्बेडिंग मॉडल में से एक, आर्कटिक एम्बेड (Arctic embed) भी शामिल है। यह उत्पाद अपाचे 2.0 लाइसेंस के तहत ओपन-सोर्स समुदाय के लिए मुफ्त है। इस परिवार में 5 मॉडल शामिल हैं जो हगिंग फेस (Hugging Face) पर उपलब्ध हैं और स्नोफ्लेक कॉर्टेक्स में निजी पूर्वावलोकन के लिए उपलब्ध कराए जाएंगे। तुलनीय मॉडल के आकार का लगभग एक-तिहाई, यह एम्बेडिंग मॉडल इष्टतम खोज प्रदर्शन के लिए अनुकूलित है, जो व्यवसायों को अपने डेटासेट को एलएलएम के साथ जोड़ने के लिए एक कुशल और किफायती समाधान प्रदान करता है, चाहे वह आरएजी (RAG) या सिमेंटिक खोज सेवा हो।
हाल ही में, स्नोफ्लेक ने अपने ग्राहकों को डेटा क्लाउड में नवीनतम और उच्च-प्रदर्शन वाले एलएलएम तक पहुंच प्रदान करने के लिए रेका (Reka) और मिस्ट्रल एआई (Mistral AI) मॉडल भी जोड़े हैं। साथ ही, स्नोफ्लेक एआई इनोवेशन को आगे बढ़ाने के लिए एनवीडिया (NVIDIA) के साथ अपनी बढ़ी हुई साझेदारी की घोषणा की है। स्नोफ्लेक का डेटा क्लाउड पूर्ण-स्टैक एनवीडिया-त्वरित प्लेटफॉर्म के साथ मिलकर उद्योगों में एआई उत्पादकता को बढ़ाने के लिए एक सुरक्षित और शक्तिशाली बुनियादी ढांचा और कम्प्यूटिंग क्षमता प्रदान करता है। स्नोफ्लेक वेंचर्स (Snowflake Ventures) ने हाल ही में लैंडिंग एआई (Landing AI), मिस्ट्रल एआई (Mistral AI) और रेका (Reka) में भी निवेश किया है ताकि ग्राहकों को उनके व्यावसायिक डेटा से एलएलएम और एआई मूल्य प्राप्त करने में मदद मिल सके।
टिप्पणियाँ0