Ce grand modèle de langage rejoint la famille de modèles Snowflake Arctic déjà existante.
Snowflake lance Snowflake Arctic, un LLM conçu pour être le plus ouvert et le plus performant de niveau entreprise du marché et optimisé pour les charges de travail complexes des entreprises grâce à son architecture de mélange d’experts. Arctic est publié sous une licence Apache 2.0.
“Il s’agit d’un moment décisif pour Snowflake, avec notre équipe de recherche en IA.” déclare Sridhar Ramaswamy, CEO de Snowflake. “En offrant à la communauté, une intelligence et une efficacité à la pointe de l’industrie d’une manière véritablement ouverte, nous repoussons les frontières de ce que l’IA open source peut faire. Notre recherche avec Arctic améliorera considérablement notre capacité à fournir une Intelligence Artificielle fiable et efficace à nos clients.”
Snowflake propose un modèle puissant et ouvert avec une licence Apache 2.0 permettant une utilisation personnelle, de recherche et commerciale sans restriction. Snowflake fournit également des modèles de code, ainsi que des options flexibles d’inférence et de formation telles que NVIDIA NIM avec NVIDIA TensorRT-LLM, vLLM et Hugging Face. Arctic sera également disponible sur Amazon Web Services (AWS), aux côtés d’autres modèles et catalogues, qui incluront Hugging Face, Lamini, Microsoft Azure, le catalogue d’API de NVIDIA, Perplexity, Together AI.
L’équipe de recherche en IA de Snowflake a mis moins de trois mois pour l’élaboration d’Arctic. Arctic active 17 des 480 milliards de paramètres à la fois et activerait environ 50 % de paramètres en moins que DBRX et 75 % en moins que Llama 3 70B pendant l’inférence ou l’entraînement. Il surpasserait les principaux modèles ouverts, notamment DBRX, Mixtral-8x7B, et d’autres encore, en matière de codage (HumanEval+, MBPP+) et de génération SQL (Spider), tout en offrant des performances de premier plan en matière de compréhension du langage général (MMLU).
LLM Arctic fait partie de la famille de modèles Snowflake Arctic qui comprend également Arctic Embed, une famille de modèles d’incorporation de texte disponible à la communauté open source sous une licence Apache 2.0. La famille de cinq modèles sera bientôt disponible dans le cadre de la fonction d’incorporation de Snowflake Cortex (en private preview). Elle est actuellement disponible sur Hugging Face (start-up franco-américaine) pour une utilisation immédiate.
Pour une utilisation immédiate, Arctic est disponible pour l’inférence sans serveur dans Snowflake Cortex, le service entièrement géré de Snowflake qui offre des solutions de Machine Learning et d’IA dans le Data Cloud.