Zespół badawczy z Seoul National University of Science and Technology udostępnił na platformie HuggingFace koreański model wizualno-językowy „Blossom-V 3.1”, prezentując tym samym pierwszy koreański model LMM.
Model ten może przetwarzać jednocześnie tekst i obrazy, obsługuje język koreański i angielski, a jego rozwój został oparty na wysokiej jakości danych zebranych w ramach projektu Ministerstwa Nauki i Technologii Informacji i Komunikacji.
W celu poprawy wydajności w języku koreańskim wykorzystano równoległe dane wizualne w języku koreańskim i angielskim. Zastosowanie metody łączenia hierarchicznego umożliwiło stabilne obsługiwane obu języków.
Zespół profesora Im Kyung-tae z Laboratorium Przetwarzania Języka Wielomodalnego (MLP) na Uniwersytecie Nauki i Technologii w Seulu (Seoul National University of Science and Technology, SeulTech) ogłosił, że 4 września udostępnił w serwisie HuggingFace pierwszy w swoim rodzaju koreański model językowo-wizualny „Bllossom-V 3.1”.
Model ten został opracowany na podstawie modelu językowego „Bllossom”, który został wspólnie stworzony przez SeulTech i TeddySum, poprzez dodanie dodatkowego etapu uczenia dla przetwarzania obrazów. Obsługuje dwa języki: koreański i angielski, a także umożliwia przetwarzanie nie tylko tekstu, ale i obrazów. Udostępnienie modelu Bllossom-V 3.1 ma ogromne znaczenie, ponieważ jest to pierwszy w historii model LMM (Large Multimodal Model) opracowany specjalnie dla języka koreańskiego w serwisie HuggingFace.
Kluczowe dane, które umożliwiły opracowanie pierwszego w swoim rodzaju koreańskiego modelu LMM, jakim jest Bllossom-V 3.1, zostały zebrane w ramach projektu „Tworzenie i wyszukiwanie danych dokumentów”, zorganizowanego przez Ministerstwo Nauki i Technologii Informacyjnych oraz Komunikacji (MSIT) i nadzorowanego przez Koreański Instytut Rozwoju Społeczeństwa Informacyjnego (NIA). W projekcie tym kluczową rolę odegrała firma Media Group Saramgwasup (Saramgwasup), która wraz z EuclidSoft, jako główny uczestnik, stworzyła wysoce jakościowe dane specjalistyczne.
Ponadto, Bllossom-V 3.1 to model, który przeszedł proces masowego uczenia w oparciu o koreański i angielski język, wykorzystując metodę wyrównywania warstw (Layer Aligning) opracowana wspólnie przez SeulTech i TeddySum, co zapewnia stabilne wsparcie dla obu języków. Dodatkowo, zastosowanie w modelu zbioru danych MVIF, stworzonego przez zespół badawczy, który zawiera równoległe dane wizualne w języku koreańskim i angielskim, pozwoliło na znaczne zwiększenie wydajności w języku koreańskim bez pogarszania wydajności w języku angielskim. Ogromne zasoby obliczeniowe niezbędne do wstępnego uczenia modelu językowo-wizualnego zostały udostępnione przez Centrum Innowacji Przemysłu Sztucznej Inteligencji (AICA).
Han Yun-gi, prezes firmy Saramgwasup, która odpowiadała za ogólne zarządzanie tworzeniem danych do uczenia modelu, powiedział: „Czujemy ogromną satysfakcję z faktu, że mogliśmy przyczynić się do powstania pierwszego publicznego modelu językowo-wizualnego koreańsko-angielskiego dzięki opracowaniu wysokiej jakości danych”. Dodał również: „W przyszłości będziemy nadal przyczyniać się do tworzenia publicznych zbiorów danych, które będą mogły być wykorzystywane w różnych celach”.
Model Bllossom-V 3.1 można znaleźć tutaj.
Informacje o Media Group Saramgwasup
Media Group Saramgwasup to firma założona przez twórców o indywidualnym stylu, którzy skupili się na tworzeniu danych wizualnych. Firma może pochwalić się imponującymi osiągnięciami w dziedzinie digitalizacji opartej na danych wizualnych, sztucznej inteligencji (AI), big data, autonomicznych pojazdów oraz wirtualnej rzeczywistości (VR). Na podstawie tych doświadczeń firma rozwija własne technologie i usługi, a także poszerza działalność w różnych obszarach, dążąc do ekspansji na rynek globalny. Firma dąży do tego, aby stać się organizacją, która skupia się na ludziach, zarówno pod względem kultury, jak i prowadzenia biznesu, umożliwiając wspólny rozwój i osiąganie szczęścia.
Model Bllossom-V 3.1: https://huggingface.co/Bllossom/llama-3.1-Korean-B...
Strona internetowa: https://humanf.co.kr/
Kontakt Media Group Saramgwasup Zespół DX Manager Eun-sil Lee 02-830-8583