บทสรุปของโพสต์โดย durumis AI
- ทีมวิจัยจากมหาวิทยาลัยวิทยาศาสตร์และเทคโนโลยีโซลได้เปิดตัวแบบจำลองภาษาและภาพเฉพาะภาษาเกาหลี 'Bllossom-V 3.1' บน HuggingFace นับเป็นแบบจำลองภาษาขนาดใหญ่ (LMM) ภาษาเกาหลีตัวแรก
- แบบจำลองนี้สามารถประมวลผลทั้งข้อความและภาพ รองรับทั้งภาษาเกาหลีและภาษาอังกฤษ พัฒนาขึ้นจากข้อมูลคุณภาพสูงที่สร้างขึ้นภายใต้โครงการของกระทรวงวิทยาศาสตร์และไอซีที
- โดยเฉพาะอย่างยิ่ง เพื่อยกระดับประสิทธิภาพของภาษาเกาหลี ได้มีการใช้ข้อมูลภาพแบบคู่ขนานภาษาเกาหลี-อังกฤษ และด้วยวิธีการเชื่อมต่อแบบลำดับชั้น ทำให้สามารถรองรับสองภาษาได้อย่างเสถียร
ภาควิชาวิทยาศาสตร์และเทคโนโลยีแห่งมหาวิทยาลัยโซล (ต่อไปนี้จะเรียกว่า มหาวิทยาลัยโซล) ห้องปฏิบัติการประมวลผลภาษาแบบมัลติโมดัล (MLP) ทีมศาสตราจารย์อิม คยองแท ประกาศว่าได้เปิดตัวแบบจำลองภาษาและภาพที่เน้นภาษาเกาหลีแบบแรกของโลก “Bllossom-V 3.1” ผ่าน HuggingFace ลีดเดอร์บอร์ด เมื่อวันที่ 4 กันยายนที่ผ่านมา
แบบจำลองนี้พัฒนาขึ้นจากแบบจำลองภาษา “Bllossom” ที่มหาวิทยาลัยโซลและเท็ดดี้ซัมร่วมกันสร้างขึ้น โดยผ่านกระบวนการฝึกฝนเพิ่มเติมเพื่อประมวลผลภาพ เป็นแบบจำลองภาษาและภาพที่รองรับทั้งภาษาเกาหลีและภาษาอังกฤษ สามารถประมวลผลทั้งข้อความและภาพได้ การเปิดตัว Bllossom-V 3.1 ในครั้งนี้มีความสำคัญอย่างยิ่ง เนื่องจากเป็น LMM ที่เน้นภาษาเกาหลีแบบแรกของโลกที่เปิดตัวผ่าน HuggingFace
ข้อมูลที่สำคัญต่อการพัฒนา Bllossom-V 3.1 ซึ่งเป็น LMM ที่เน้นภาษาเกาหลีแบบแรกของโลกนั้น สร้างขึ้นจากโครงการ ‘ข้อมูลการสร้างเอกสารและการค้นหาข้อมูล’ ที่กระทรวงวิทยาศาสตร์และไอซีทีเป็นผู้จัด และสถาบันส่งเสริมนวัตกรรมด้านข้อมูลอัจฉริยะแห่งเกาหลี (NIA) เป็นผู้ดำเนินการ โครงการนี้มีบริษัทสื่อกลุ่มคนและป่า (ต่อไปนี้จะเรียกว่า คนและป่า) เป็นผู้รับผิดชอบโดยรวม ร่วมกับยูคลิดซอฟต์ในการสร้างข้อมูลคุณภาพสูงอย่างมืออาชีพ
นอกจากนี้ Bllossom-V 3.1 ยังเป็นแบบจำลองที่ผ่านการฝึกฝนแบบพรีเทรนด์ด้วยภาษาเกาหลีและภาษาอังกฤษจำนวนมาก โดยใช้เทคนิคการจัดเรียงเลเยอร์ (Layer Aligning) ที่มหาวิทยาลัยโซลและเท็ดดี้ซัมร่วมกันพัฒนา ทำให้รองรับสองภาษาได้อย่างมีเสถียรภาพ นอกจากนี้ ทีมวิจัยยังใช้ข้อมูลภาษาเกาหลี-อังกฤษแบบขนาน MVIF ที่สร้างขึ้นเอง ทำให้สามารถปรับปรุงประสิทธิภาพของภาษาเกาหลีได้อย่างมากโดยไม่ลดทอนประสิทธิภาพของภาษาอังกฤษ ได้รับการประเมินว่าเป็นแบบจำลองที่มีประสิทธิภาพ ทรัพยากรคอมพิวเตอร์จำนวนมหาศาลที่จำเป็นสำหรับการฝึกฝนแบบจำลองภาษาและภาพได้รับการสนับสนุนจากหน่วยงานส่งเสริมอุตสาหกรรมปัญญาประดิษฐ์ (AICA)
ฮัน ยุนกี ผู้บริหารของคนและป่า ซึ่งรับผิดชอบการสร้างข้อมูลสำหรับฝึกฝนแบบจำลองกล่าวว่า “รู้สึกภาคภูมิใจอย่างยิ่งที่ได้มีส่วนร่วมในการสร้างแบบจำลองภาษาและภาพแบบเปิดที่รองรับภาษาเกาหลีและอังกฤษแบบแรกของโลก ผ่านการสร้างข้อมูลคุณภาพสูง” และกล่าวเสริมว่า “ในอนาคตจะยังคงมีส่วนร่วมในการสร้างข้อมูลเปิดที่สามารถนำไปใช้ในงานต่างๆ ได้อีกมากมาย”
สามารถดูแบบจำลอง Bllossom-V 3.1 ได้ที่นี่
แนะนำบริษัทสื่อกลุ่มคนและป่า
บริษัทสื่อกลุ่มคนและป่า ก่อตั้งขึ้นจากกลุ่มผู้สร้างสรรค์ที่มีเอกลักษณ์เฉพาะตัว มีผลงานโดดเด่นในด้านการแปลงสภาพเป็นดิจิทัล ฐานข้อมูลภาพ ปัญญาประดิษฐ์ (AI) บิ๊กดาต้า การขับขี่อัตโนมัติ ความเป็นจริงเสมือน (VR) ฯลฯ และกำลังขยายธุรกิจในหลายด้าน เช่น การพัฒนาเทคโนโลยีและบริการของตนเอง เพื่อก้าวสู่ตลาดโลก บริษัทมุ่งมั่นที่จะเติบโตเป็นองค์กรที่มุ่งเน้นมนุษย์ ทั้งในด้านวัฒนธรรมและการดำเนินธุรกิจ เพื่อสร้างความเจริญเติบโตและความสุขร่วมกัน
แบบจำลอง Bllossom-V 3.1: https://huggingface.co/Bllossom/llama-3.1-Korean-B...
เว็บไซต์: https://humanf.co.kr/
ติดต่อ
บริษัทสื่อกลุ่มคนและป่า
ทีมปฏิบัติการ DX
อี อึนซิล ผู้จัดการ
02-830-8583