Accueil Cybersécurité Le chiffrement homomorphique, un facilitateur pour la gestion des données sensibles dans...

Le chiffrement homomorphique, un facilitateur pour la gestion des données sensibles dans le Cloud

Joseph Salameh

AVIS D’EXPERT. Le chiffrement homomorphique (FHE) permet le chiffrement des données au repos, en transit mais également pendant leur traitement. En amont d’une conférence qu’il doit donner sur le salon Big Data & AI, nous avons demandé à Joseph Salameh, DAS Competency Leader chez IBM Security France, de faire le point sur le sujet.

 

L’adoption du Cloud accélère la croissance dans la plupart des entreprises dans lesquelles les données sont de plus en plus souvent stockées et traitées dans le Cloud afin de servir des cas usages dans des domaines tels que le Big Data et l’IA.

Cependant, le Cloud reste un environnement public opéré par le fournisseur. Ainsi, le propriétaire des données n’a pas le contrôle complet sur ces dernières – notamment celles qui sont sensibles telles que les données personnelles des clients et employés – afin de garantir la conformité par rapport aux différentes régulations nationales en tant que contrôleur et utilisateur de données personnelles.

Bien que ces règlementations définissent la pseudonymisation1 ou le chiffrement comme des contrôles de sécurité permettant d’assurer la protection des données dans ces environnements, ces contrôles restent valables uniquement pour les données au repos ou en transit. Afin d’utiliser les données dans le Cloud, il faut absolument les déchiffrer, les exposant ainsi à des risques de brèche de confidentialité.

Le chiffrement homomorphique (FHE), remédie à cette problématique en permettant le chiffrement des données au repos, en transit mais également pendant leur traitement. Ainsi, les métiers peuvent exécuter l’ensemble de leurs analyses sur les données en toute sécurité dans le Cloud.

Pour une implémentation réussie, le FHE doit être mis en place selon 3 étapes

  1. Le propriétaire chiffre les données dans son environnement de confiance et partage seulement les données chiffrées dans les environnements externes tel que le Cloud.
  2. Au niveau du Cloud, les fonctions de type IA ou Machine Learning sont exécutées sur des données chiffrées grâce à des fonctions alternatives fournies par le modèle FHE. Les résultats de ces fonctions sont eux-aussi chiffrés.
  3. Le propriétaire des données récupère les résultats chiffrés du Cloud qu’il pourra déchiffrer avec la clé FHE utilisée pour le chiffrement des données dans la première étape.

Par exemple, si nous avons besoin de trier une liste de données dans un dataset, le modèle FHE nous fournira une fonction de triage alternative que nous pourrons exécuter sur le dataset chiffré avec FHE et générer une version chiffrée du triage attendu que seul le propriétaire pourra déchiffrer.

C’est là que réside la valeur ajoutée du FHE qui conserve les données, la fonction initiale exécutée dessus et le résultat généré chiffré à tous moments. L’opérateur Cloud n’aura accès en aucune circonstance à ces trois éléments.

Le FHE a déjà fait ses preuves dans plusieurs cas d’usages métier tels que la consolidation et le partage de données permettant par exemple aux équipes Marketing d’analyser les données sensibles des clients en toute sécurité pour lancer une campagne quelconque. Un autre exemple est l’analyse de sentiment où nous pouvons utiliser le FHE pour entrainer des modèles de Machine Learning et d’IA afin d’identifier le niveau de satisfaction des clients lors de leurs expériences digitales avec les produits proposés par les métiers.

Malgré tous ces progrès, l’adoption du FHE reste actuellement limitée par ses performances et sa facilité d’utilisation

Du point de vue des performances, nous constatons un décalage important entre le temps pour exécuter une même fonction sur les données en clair et sur celles chiffrées en FHE. Ainsi, pour y remédier, nous privilégions les cas d’usages asynchrones où la notion de temps de traitement est transparente. De plus, nous continuons nos recherches pour améliorer les performances des modèles FHE.

Concernant la facilité d’utilisation de la solution, nous constatons une émergence des SDK2 spécialisés tels que HE Layer qui permet aux développeurs d’utiliser la technologie FHE sans avoir besoin de compétences pointues en cryptographie.

Bien que la solution reste très novatrice, un grand nombre d’entreprises dans des secteurs tels que la banque assurance, les télécommunications, la distribution ont déjà entamé cette démarche et ont appliqué l’usage du FHE dans leur production. Le FHE n’est pas un mythe mais bien une réalité et les outils pour commencer à l’adopter sont à votre disposition afin de débuter votre « FHE Journey ».

 

1Traitement de données personnelles réalisé de manière à ce qu’on ne puisse plus attribuer les données relatives à une personne physique sans information supplémentaire.

2 Un kit de développement logiciel (SDK) est un ensemble d’outils fourni avec une plateforme matérielle (généralement), un système d’exploitation ou un langage de programmation.