सियोल नेशनल यूनिवर्सिटी ऑफ साइंस एंड टेक्नोलॉजी की शोध टीम ने हिंदी के लिए विशिष्ट विजुअल-भाषा मॉडल 'Bllossom-V 3.1' को HuggingFace पर जारी किया है, जो हिंदी में पहला LMM है।
यह मॉडल टेक्स्ट और इमेज दोनों को संभाल सकता है और हिंदी और अंग्रेजी दोनों भाषाओं को सपोर्ट करता है। इसे विज्ञान और प्रौद्योगिकी मंत्रालय की परियोजना के तहत बनाए गए उच्च-गुणवत्ता वाले डेटा पर आधारित है।
खासतौर पर हिंदी में बेहतर प्रदर्शन के लिए, हिंदी-अंग्रेजी समानांतर विजुअल कॉर्पस डेटा का इस्तेमाल किया गया है। इसके अलावा, हाइरार्किकल कनेक्शन विधि के इस्तेमाल से दोनों भाषाओं का स्थिर सपोर्ट सुनिश्चित किया गया है।
सियोल साइंस एंड टेक्नोलॉजी यूनिवर्सिटी (इसके बाद सियोल साइंस एंड टेक्नोलॉजी यूनिवर्सिटी के रूप में जाना जाता है) की मल्टीमॉडल लैंग्वेज प्रोसेसिंग रिसर्च लैब (एमएलपी) के प्रोफेसर इम क्युंग-टे की टीम ने 4 सितंबर को हगिंगफेस लीडरबोर्ड के माध्यम से कोरियाई भाषा के लिए पहला विशेष दृश्य-भाषा मॉडल 'ब्लॉसम-वी 3.1' जारी करने की घोषणा की।
यह मॉडल सियोल साइंस एंड टेक्नोलॉजी यूनिवर्सिटी और टेडीसम द्वारा संयुक्त रूप से विकसित भाषा मॉडल 'ब्लॉसम' पर आधारित है, जिसे छवि प्रसंस्करण के लिए अतिरिक्त प्रशिक्षण प्रक्रिया से गुजरकर विकसित किया गया है। यह कोरियाई और अंग्रेजी दोनों भाषाओं का समर्थन करता है और न केवल टेक्स्ट बल्कि छवियों को भी संसाधित कर सकता है। ब्लॉसम-वी 3.1 की यह रिलीज हगिंगफेस पर कोरियाई भाषा-विशिष्ट एलएमएम को पेश करने के मामले में महत्वपूर्ण है।
पहले कोरियाई भाषा-विशिष्ट एलएमएम, ब्लॉसम-वी 3.1 के विकास में एक महत्वपूर्ण भूमिका निभाने वाले डेटा को विज्ञान और सूचना संचार प्रौद्योगिकी मंत्रालय द्वारा आयोजित और कोरिया इंस्टीट्यूट ऑफ इंटेलिजेंट इंफॉर्मेशन सोसाइटी (एनआईए) द्वारा प्रबंधित 'दस्तावेज़ निर्माण और सूचना पुनर्प्राप्ति डेटा' परियोजना के माध्यम से बनाया गया था। इस परियोजना में मल्टीमॉडल डेटा विशेषज्ञ कंपनी मीडिया ग्रुप साराम और सुप (इसके बाद साराम और सुप के रूप में जाना जाता है) ने कुल मिलाकर यूक्लिड सॉफ्ट के साथ भागीदारी की और विशेषज्ञता वाले उच्च-गुणवत्ता वाले डेटा का निर्माण किया।
इसके अतिरिक्त, ब्लॉसम-वी 3.1 सियोल साइंस एंड टेक्नोलॉजी यूनिवर्सिटी और टेडीसम द्वारा संयुक्त रूप से विकसित परत संरेखण (लेयर अलाइनिंग) विधि को लागू करता है, और यह एक मॉडल है जिसने बड़ी मात्रा में कोरियाई और अंग्रेजी पूर्व-प्रशिक्षण पूरा कर लिया है, जिससे यह दोनों भाषाओं का स्थिर रूप से समर्थन करता है। इसके अतिरिक्त, शोध दल द्वारा निर्मित एमवीआईएफ कोरियाई-अंग्रेजी समानांतर दृश्य कॉर्पस डेटा लागू करके, अंग्रेजी प्रदर्शन को कम किए बिना कोरियाई भाषा के प्रदर्शन में काफी सुधार किया गया है। दृश्य-भाषा मॉडल के पूर्व-प्रशिक्षण के लिए आवश्यक विशाल मात्रा में कंप्यूटिंग संसाधनों को आर्टिफिशियल इंटेलिजेंस इंडस्ट्री फ्यूजन बिजनेस यूनिट (एआईसीए) से प्राप्त किया गया था।
डेटा निर्माण के लिए समग्र जिम्मेदारी संभालने वाले साराम और सुप के सीईओ हान यून-गी ने कहा, “उच्च-गुणवत्ता वाले डेटा निर्माण के माध्यम से, पहले कोरियाई-अंग्रेजी दृश्य-भाषा सार्वजनिक मॉडल को बनाने में योगदान करने पर हमें बहुत गर्व है।” उन्होंने आगे कहा, “हम भविष्य में भी विभिन्न उद्देश्यों के लिए उपयोग किए जा सकने वाले सार्वजनिक डेटा के निर्माण में योगदान देंगे।”
ब्लॉसम-वी 3.1 मॉडल यहाँ उपलब्ध है।
मीडिया ग्रुप साराम और सुप परिचय
लेखकवादी व्यक्तित्व वाले क्रिएटर्स के एक समूह द्वारा स्थापित मीडिया ग्रुप साराम और सुप, विजुअल डेटा पर आधारित डिजिटलाइजेशन, आर्टिफिशियल इंटेलिजेंस (एआई), बिग डेटा, स्वायत्त ड्राइविंग, वर्चुअल रियलिटी (वीआर) आदि जैसे क्षेत्रों में उत्कृष्ट उपलब्धियां हासिल कर चुका है। यह कंपनी अपनी तकनीक और सेवा विकास पर आधारित विभिन्न व्यावसायिक विस्तार के माध्यम से वैश्विक बाजार में प्रवेश करने का प्रयास कर रही है। यह डेटा को माध्यम बनाकर मानव-केंद्रित संस्कृति और मानव-केंद्रित कंपनी बनने और साथ मिलकर विकसित होने और खुशहाल होने वाली कंपनी के रूप में विकसित हो रही है।