Comme tous les géants de l'Internet, Google rencontre des difficultés pour gérer de façon fiable de très gros volumes de données. Jusqu'à présent, AdWords, qui est au cœur du système publicitaire de Google, s'appuie sur MySQL. Cependant Mountain View a entrepris de développer en parallèle son propre système de données.
Il s'agira d'un système de base de données relationnelles compatible SQL, s'appuyant sur un système de stockage distribué. La tolérances aux fautes est crucial pour Google et le système sera capable de faire de la réplication de données non pas “simplement' entre serveurs, mais entre datacenters.
Ce système de stockage distribué s'appelle le Google Spanner. Il s'agit d'une architecture de stockage/réplication capable de gérer plusieurs milliers de centre de données et plusieurs millions de serveurs. Au total c'est un exaoctet (10 puissance 18) de données qui peut être traité.
“Avec F1, nous avons construit un système hybride qui combine l'évolutivité, la tolérance de panne, le partitionnement dynamique, et tout cela à un coût bien inférieur, comparable aux systèmes “NoSQL” tout en conservant la facilité d'utilisation, les habitudes et la sécurisation que l'on attend d'une base de données relationnelle. ” explique Google.
Plus d'informations : le document de présentation de Google