- 스노우플레이크, 업계 최고 수준의 개방성 갖춘 엔터프라이즈급 LLM ‘아크틱’ 출시 > 뉴스 - 스타트업 커뮤니티 씬디스
- 스노우플레이크 아크틱 모델군에 동급 최고 성능·효율 갖춘 개방형 대규모언어모델 추가아파치 2.0 라이선스 기반 오픈소스… 다양한 프레임워크 지원…, 스타트업에 종사하시는 여러분들의 놀이터 씬디스는 스타트업 커뮤니티 입니다.
Thêm mô hình ngôn ngữ lớn (LLM) mở rộng, có hiệu năng và hiệu quả hàng đầu vào dòng sản phẩm Snowflake Arctic
Mã nguồn mở dựa trên giấy phép Apache 2.0… Cung cấp tính linh hoạt có thể tùy chỉnh với hỗ trợ cho nhiều framework khác nhau
Snowflake, công ty cung cấp dịch vụ đám mây dữ liệu toàn cầu, đã ra mắt mô hình ngôn ngữ lớn (LLM) cấp doanh nghiệp 'Snowflake Arctic' có khả năng mở rộng và hiệu năng hàng đầu ngành.
Được thiết kế dựa trên phương pháp kết hợp chuyên gia (MoE - Mixture-of-Experts) độc quyền của Snowflake, Arctic hỗ trợ hiệu năng và năng suất hàng đầu. Nó được tối ưu hóa để xử lý các yêu cầu phức tạp của doanh nghiệp, đáp ứng các tiêu chí khác nhau như tạo mã SQL, thực thi lệnh, v.v.
Đặc biệt, Arctic được cấp phép Apache 2.0, cho phép sử dụng thương mại miễn phí. Snowflake đã công khai thông tin chi tiết về phương pháp học AI, thiết lập một tiêu chuẩn mở mới cho công nghệ AI cấp doanh nghiệp. Ngoài ra, LLM Arctic là một phần của dòng sản phẩm mô hình Snowflake Arctic, bao gồm cả mô hình nhúng văn bản để sử dụng tìm kiếm.
Giám đốc điều hành của Snowflake, Sridhar Ramaswamy, cho biết: “Đội ngũ nghiên cứu AI của Snowflake đã dẫn đầu những đổi mới tiên phong trong lĩnh vực AI, tạo ra bước ngoặt quan trọng cho công ty chúng tôi”. Ông tiếp tục: “Bằng cách phát hành mã nguồn mở với hiệu năng và hiệu quả hàng đầu ngành cho cộng đồng AI, Snowflake đang mở rộng ranh giới về tiềm năng của AI mã nguồn mở. Khả năng AI của Snowflake cũng được nâng cao, cho phép chúng tôi cung cấp cho khách hàng những mô hình AI mạnh mẽ và đáng tin cậy”.
◇ Arctic, LLM mã nguồn mở hỗ trợ hợp tác rộng rãi
Theo một báo cáo gần đây của công ty nghiên cứu thị trường Forrester, khoảng 46% nhà hoạch định quyết định về AI của các doanh nghiệp toàn cầu cho biết họ đang sử dụng LLM mã nguồn mở hiện có để triển khai AI tạo sinh cho doanh nghiệp của mình như một phần của chiến lược AI. Nền tảng đám mây dữ liệu Snowflake hiện đang được sử dụng bởi hơn 9.400 doanh nghiệp và tổ chức trên toàn cầu. Họ có thể tận dụng dữ liệu của mình thông qua LLM mang đến khả năng mở rộng hàng đầu ngành.
Là mô hình mã nguồn mở với giấy phép Apache 2.0, Arctic cung cấp tính linh hoạt trong việc lựa chọn phương pháp suy luận và học tập cùng với các mẫu mã. Người dùng có thể sử dụng và tùy chỉnh Arctic với các framework ưa thích của họ như NVIDIA NIM, NVIDIA TensorRT-LLM, vLLM và Hugging Face. Arctic có thể được sử dụng ngay lập tức thông qua suy luận không máy chủ trong Snowflake Cortex. Snowflake Cortex là một dịch vụ được quản lý đầy đủ, cung cấp các giải pháp AI và máy học trên đám mây dữ liệu cùng với danh sách các mô hình đa dạng bao gồm Hugging Face, Lamini, Microsoft Azure, danh mục API của NVIDIA, Perplexity và Together AI. Arctic cũng sẽ sớm được hỗ trợ trên Amazon Web Services (AWS).
◇ Hiệu quả tài nguyên vượt trội và hiệu năng hàng đầu
Đội ngũ nghiên cứu AI của Snowflake bao gồm các nhà nghiên cứu và kỹ sư hệ thống hàng đầu. Arctic được xây dựng trong vòng chưa đầy 3 tháng. Việc đào tạo mô hình đã sử dụng các phiên bản Amazon Elastic Compute Cloud (Amazon EC2) P5, với chi phí đào tạo chỉ bằng 1/8 so với các mô hình tương tự. Snowflake đang thiết lập một tiêu chuẩn mới về tốc độ đào tạo các mô hình cấp doanh nghiệp, mở rộng, tiên tiến và cuối cùng là hỗ trợ người dùng tạo ra các mô hình được tối ưu hóa, hiệu quả về chi phí và được tùy chỉnh theo quy mô tối ưu.
Thiết kế MoE khác biệt của Arctic cải thiện cả hệ thống đào tạo và hiệu năng mô hình thông qua việc lắp ráp dữ liệu được thiết kế cẩn thận để phù hợp với nhu cầu của doanh nghiệp. Ngoài ra, bằng cách kích hoạt 480 tỷ tham số theo nhóm 17 tham số cùng lúc, nó đạt được hiệu quả mã thông báo vượt trội và chất lượng hàng đầu ngành, mang đến kết quả tối ưu. Arctic kích hoạt ít tham số hơn khoảng 50% so với DBRX và 75% so với Llama 3 70B trong quá trình suy luận hoặc đào tạo để cải thiện đáng kể hiệu quả. Nó cũng vượt trội hơn các mô hình mã nguồn mở phổ biến khác như DBRX và Mixtral-8x7B về khả năng mã hóa (HumanEval+, MBPP+) và tạo SQL (Spider), đồng thời đạt được hiệu năng hàng đầu trong lĩnh vực hiểu ngôn ngữ chung (MMLU, Hiểu ngôn ngữ đa nhiệm quy mô lớn).
◇ Đổi mới AI cho tất cả mọi người do Snowflake dẫn đầu
Snowflake cung cấp cơ sở dữ liệu và các khối xây dựng AI tiên tiến cần thiết để các doanh nghiệp xây dựng các ứng dụng AI/máy học thực tế bằng cách sử dụng dữ liệu của riêng họ. Khi khách hàng sử dụng Arctic thông qua Snowflake Cortex, việc xây dựng các ứng dụng AI sản xuất ở quy mô phù hợp trong phạm vi bảo mật và quản trị của đám mây dữ liệu trở nên dễ dàng hơn.
Dòng sản phẩm mô hình Snowflake Arctic, bao gồm cả LLM Arctic, cũng bao gồm Arctic Embed, một trong những mô hình nhúng văn bản tiên tiến mới được Snowflake phát hành gần đây. Sản phẩm này cũng có sẵn miễn phí cho cộng đồng mã nguồn mở theo giấy phép Apache 2.0. Gồm 5 mô hình, dòng sản phẩm này có sẵn trực tiếp trên Hugging Face và sẽ được cung cấp dưới dạng xem trước riêng tư tích hợp trong Snowflake Cortex. Với kích thước chỉ bằng khoảng 1/3 so với các mô hình tương tự, mô hình nhúng này được tối ưu hóa để mang lại hiệu năng tìm kiếm tối ưu, mang đến cho các doanh nghiệp một giải pháp hiệu quả và tiết kiệm chi phí khi kết hợp các bộ dữ liệu riêng của họ với LLM như một phần của dịch vụ tìm kiếm ngữ nghĩa hoặc Tìm kiếm tăng cường tạo (RAG).
Gần đây, Snowflake đã thêm các mô hình từ Reka và Mistral AI, nhằm hỗ trợ khách hàng truy cập vào các LLM mới nhất và có hiệu năng cao nhất trên đám mây dữ liệu. Ngoài ra, công ty cũng đang tiếp tục thúc đẩy đổi mới AI thông qua việc công bố mối quan hệ đối tác mở rộng với NVIDIA. Đám mây dữ liệu của Snowflake, kết hợp với nền tảng được tăng tốc NVIDIA đầy đủ, cung cấp năng lực tính toán và cơ sở hạ tầng mạnh mẽ và an toàn để tận dụng hiệu quả năng suất AI trên nhiều ngành nghề. Snowflake Ventures cũng đã đầu tư vào Landing AI, Mistral AI và Reka, nhằm hỗ trợ khách hàng khai thác giá trị từ LLM và AI trên dữ liệu doanh nghiệp của họ.
Bình luận0