Cette solution innovante simplifie et accélère la création et la gestion des environnements de Data Science.
Data Science Stack (DSS) permet aux entreprises, chercheurs et développeurs de mettre en place des environnements data de manière efficace, avec des outils spécialement conçus pour répondre aux besoins spécifiques du machine learning, de l’intelligence artificielle (IA) et de la science des données.
Entièrement open source, gratuite et native pour Ubuntu, elle est également accessible sur d’autres distributions Linux, sur Windows à l’aide de Windows Subsystem Linux (WSL), et sur macOS avec Multipass. Par défaut, DSS comprend l’accès à Jupyter Notebook pour le développement de modèles, à MLflow pour le suivi des expériences et le registre des modèles, ainsi qu’à des frameworks de ML tels que Pytorch et Tensorflow. Cependant, les utilisateurs peuvent personnaliser Data Science Stack et ajouter de nouvelles bibliothèques en fonction de leur cas d’utilisation.
DSS peut être mis en place avec seulement trois commandes, ce qui permet une exploration initiale rapide sur les stations de travail d’IA. Il suffit de configurer la couche d’orchestration de conteneurs, installer le CLI DSS et initialiser le Data Science Stack afin d’accéder à l’environnement. Cela peut être fait en 10 à 30 minutes, selon le niveau d’expérience du technicien. DSS fournit également des voies de migration, les aidant à développer leurs initiatives d’IA au fur et à mesure que les projets mûrissent.
Afin d’accéder plus tôt aux améliorations de performance et aux capacités telles que la prise en charge des GPU Intel avant leur arrivée en amont, il est possible d’accéder à ITEX et IPEX, les distributions Intel de PyTorch et Tensorflow. IPEX et ITEX améliorent les performances d’optimisation en fonction du matériel, en tirant parti des extensions vectorielles avancées (AVX), des instructions de réseau neuronal vectoriel (VNNI) et des extensions matricielles avancées (AMX). En intégrant ces extensions, en plus de l’accélération GPU, DSS bénéficie d’une accélération pour les opérations courantes dans les cas d’utilisation de l’IA, réduisant le temps d’apprentissage du modèle et accélérant la phase d’expérimentation des projets ML.
Canonical assure la maintenance de la sécurité pour tous les paquets inclus dans la solution, ce qui permet de corriger les vulnérabilités en temps voulu et de protéger à la fois le logiciel et les artefacts créés. L’offre inclut également une gestion simplifiée des dépendances et des versions logicielles, réduisant ainsi les défis techniques fréquemment rencontrés par les data scientists lors du déploiement de modèles d’IA et de machine learning. Canonical a mis un accent particulier sur l’optimisation des infrastructures cloud pour le Data Science Stack. Grâce à l’intégration avec Kubernetes et le support natif d’Ubuntu, il devient plus facile de déployer et d’évoluer dans des environnements de cloud hybrides ou multi-clouds, en bénéficiant d’une infrastructure robuste et sécurisée.