스타트업 커뮤니티 씬디스 (SeenThis.kr)

Snowflake lanza 'Arctic', un LLM empresarial de nivel empresarial con la mayor apertura del sector

Creado: 2024-04-25

Creado: 2024-04-25 11:41

Snowflake agrega un modelo de lenguaje extenso (LLM) de código abierto de clase mundial a la familia de modelos Snowflake Arctic

De código abierto bajo la licencia Apache 2.0, ofrece flexibilidad para la personalización a través del soporte de varios marcos.

Snowflake, la empresa de datos en la nube global, ha lanzado Arctic, un modelo de lenguaje extenso (LLM) empresarial de clase mundial con un nivel de apertura y rendimiento sin precedentes.

Diseñado con el enfoque único de Snowflake de mezcla de expertos (MoE), Arctic ofrece un rendimiento y una productividad líderes en su clase. Está optimizado para manejar los complejos requisitos empresariales, cumpliendo con los más altos estándares en diversas métricas, incluida la generación de código SQL y la ejecución de instrucciones.

En particular, Arctic se publica bajo la licencia Apache 2.0, que permite el uso comercial gratuito, y Snowflake ha hecho públicas las minucias de sus métodos de entrenamiento de IA, sentando un nuevo estándar de apertura para la tecnología de IA empresarial. Además, el LLM Arctic forma parte de la familia de modelos Snowflake Arctic, que también incluye modelos de incrustación de texto para búsqueda.

«El equipo de investigación de IA de Snowflake ha logrado innovaciones de vanguardia en IA, marcando un punto de inflexión importante para nuestra empresa», afirma Sridhar Ramaswamy, director ejecutivo de Snowflake. «Al compartir un modelo de código abierto con el máximo rendimiento y eficiencia con la comunidad de IA, Snowflake está ampliando el horizonte de posibilidades de la IA de código abierto. También estamos mejorando las capacidades de IA de Snowflake para ofrecer a nuestros clientes modelos de IA potentes y fiables».

◇ Arctic, un LLM de código abierto que fomenta la amplia colaboración

Según un reciente informe de Forrester, aproximadamente el 46% de los responsables de la toma de decisiones de IA en empresas globales utilizan LLM de código abierto existentes como parte de su estrategia de IA para implementar IA generativa en sus organizaciones. La plataforma de datos en la nube de Snowflake ya se utiliza para impulsar las decisiones de más de 9400 empresas e instituciones de todo el mundo, y ahora pueden aprovechar un LLM con un nivel inigualable de apertura para aprovechar el poder de sus datos.

Como modelo de código abierto bajo la licencia Apache 2.0, Arctic proporciona flexibilidad para seleccionar el método de inferencia y entrenamiento junto con plantillas de código. Los usuarios pueden utilizar y personalizar Arctic con los marcos preferidos por las empresas, como NVIDIA NIM, NVIDIA TensorRT-LLM, vLLM y Hugging Face. También pueden utilizar Arctic de inmediato mediante inferencia sin servidor en Snowflake Cortex. Snowflake Cortex es un servicio totalmente gestionado que proporciona soluciones de IA y aprendizaje automático en la nube de datos, junto con una amplia lista de modelos de diversas fuentes, como Hugging Face, Lamini, Microsoft Azure, el catálogo de API de NVIDIA, Perplexity y Together AI. Arctic también estará disponible en Amazon Web Services (AWS) en el futuro.

◇ Eficiencia excepcional de recursos y rendimiento de primera clase

El equipo de investigación de IA de Snowflake está formado por algunos de los mejores investigadores y ingenieros de sistemas del sector. Arctic se construyó en menos de tres meses. El entrenamiento del modelo se realizó en instancias P5 de Amazon Elastic Compute Cloud (Amazon EC2) a un coste ocho veces menor que el de modelos similares. Snowflake está estableciendo un nuevo estándar para la velocidad de entrenamiento de modelos empresariales de código abierto de vanguardia, con el objetivo final de permitir a los usuarios crear modelos personalizados y rentables a la escala óptima.

El diseño MoE diferenciado de Arctic mejora tanto el sistema de entrenamiento como el rendimiento del modelo mediante la compilación meticulosa de datos adaptados a las necesidades empresariales. Además, la activación simultánea de 480 mil millones de parámetros en conjuntos de 17 produce una eficiencia de tokens excepcional y una calidad líder en el sector, lo que se traduce en resultados superiores. Para mejorar la eficiencia de forma revolucionaria, Arctic activa un número de parámetros aproximadamente un 50% menor que DBRX y un 75% menor que Llama 3 70B durante la inferencia y el entrenamiento. También supera el rendimiento de los principales modelos de código abierto existentes, como DBRX y Mixtral-8x7B, en tareas de codificación (HumanEval+, MBPP+) y generación de SQL (Spider), al mismo tiempo que ofrece un rendimiento superior en la comprensión del lenguaje natural (MMLU, comprensión del lenguaje natural multitarea a gran escala).

◇ La innovación en IA para todos, impulsada por Snowflake

Snowflake proporciona la base de datos y los bloques de creación de IA de vanguardia necesarios para que las empresas creen aplicaciones prácticas de IA/aprendizaje automático con sus propios datos. Cuando los clientes utilizan Arctic a través de Snowflake Cortex, les resulta más fácil crear aplicaciones de IA de producción a la escala adecuada dentro del perímetro de seguridad y gobernanza de la nube de datos.

La familia de modelos Snowflake Arctic, que incluye el LLM Arctic, también incluye Arctic Embed, uno de los modelos de incrustación de texto de vanguardia lanzados recientemente por Snowflake. Este producto también está disponible para la comunidad de código abierto bajo la licencia Apache 2.0, sin coste alguno. Esta familia, que consta de cinco modelos, está disponible en Hugging Face y se lanzará en una vista previa privada integrada en Snowflake Cortex. Con aproximadamente un tercio del tamaño de los modelos similares, este modelo de incrustación está optimizado para ofrecer el mejor rendimiento de búsqueda, lo que lo convierte en una solución eficaz y rentable para las empresas que buscan combinar sus conjuntos de datos exclusivos con LLM como parte de los servicios de búsqueda semántica o de generación de búsqueda aumentada (RAG).

Snowflake también está trabajando para garantizar que los clientes puedan acceder a los LLM más avanzados y de mayor rendimiento en la nube de datos, incluyendo recientemente los modelos de Reka y Mistral AI. La empresa también continúa impulsando la innovación en IA a través de su ampliada asociación con NVIDIA. La nube de datos de Snowflake, combinada con la plataforma NVIDIA acelerada de extremo a extremo, ofrece una infraestructura y capacidad de computación seguras y potentes que permiten aprovechar al máximo la productividad de la IA en todos los sectores. Snowflake Ventures también ha realizado inversiones recientes en empresas como Landing AI, Mistral AI y Reka para ayudar a los clientes a crear valor a partir de LLM e IA con sus propios datos empresariales.



Comentarios0