L’éditeur originaire de Boston intègre à sa plateforme un catalogue de données automatisé, un support pour Python et une solution d’indexation et de mise en cache accélérée.
Starburst a dévoilé de nouveaux outils pour sa plateforme de gestion et d’analyse de données, qui simplifient et accélèrent les performances en matière de découverte, de migration, d’indexation et de mise en cache.
Un catalogue de données automatisé
Starburst Galaxy, l’offre SaaS de l’éditeur, s’enrichit d’un catalogue de données automatisé avec la possibilité de rechercher et de découvrir des données à travers de multiples sources. Cette fonctionnalité comprend des métadonnées automatisées à partir de rôles, de requêtes et d’autres comportements utilisateur tels que l’ajout d’un nouveau jeu de données. Ces nouveaux composants facilitent la recherche et la consommation des data products, augmentant considérablement la productivité des data analysts et des data scientists.
Des outils améliorés pour les data scientists et engineers
Starburst intègre l’écosystème Python, offrant aux data scientists la possibilité d’utiliser leurs outils favoris dans Starburst Enterprise et Starburst Galaxy pour accéder à la même infrastructure et aux mêmes données que le reste de l’organisation. Les clients peuvent désormais migrer les charges de travail PySpark vers Starburst & Trino pour améliorer les performances, sans réécrire leur code. Ces fonctionnalités, combinées à l’exécution tolérante aux pannes, permettent de construire des modèles plus précis et plus agiles sur davantage de données, avec des taux de réussite plus élevés pour les requêtes de longue durée.
Une indexation et une mise en cache accélérées
Warp Speed, la nouvelle solution d’indexation et de mise en cache intelligente de Starburst, accélère les requêtes jusqu’à 7 fois. Sa technologie brevetée identifie et met en cache de manière autonome les données les plus utilisées ou les plus pertinentes à partir de l’analyse des modèles, tandis que le reste des données reste proche de la source pour optimiser les performances du data lake. Cette stratégie d’accélération élimine la charge manuelle que représente la sélection des données du data lake à optimiser et à mettre en cache.
« La complexité de l’infrastructure des données ralentit leur contextualisation et limite leur impact pour les entreprises », a déclaré Ali Huselid, vice-présidente senior produit chez Starburst. « Starburst se concentre sur la simplification et l’accélération de la découverte des données en rationalisant la restitution des data products. Les récentes mises à jour de la plateforme relèvent considérablement la barre des performances pour l’analyse des data lake, améliorant ainsi la productivité des data engineer et des data scientist, tout en apportant des informations plus rapides et plus fiables à l’ensemble de l’entreprise. »