spotify

Quelle base de données utilise Spotify ?

Le service suédois de streaming musical Spotify permet d’écouter quasiment instantanément 30 millions de titres. Alors pour servir plus de 100 millions d’utilisateurs premium et stocker 2 milliards de listes de lecture, il faut de belles machines et une pile de logiciels bien ordonnées. Parmi ces logiciels, Spotify utilise plusieurs bases de données : PostgreSQL, Cassandra et Google Cloud Storage.

PostgreSQL fût le choix originel : cette base de données relationnelle servait pour stocker les données persistantes. Ça a très bien fonctionné lorsque la charge était minime. Puis il a fallu répliquer les bases et mettre en place une architecture plus complexe avec des clusters de serveurs de bases de données.

Pour dépasser les limitations, Cassandra fût mise en place. Ce SGBD de type noSQL est idéal pour gérer les très importantes quantités de données. Cette nouvelle base de données fût meilleure pour Spotify que PostgreSQL notamment pour certaines erreurs et points de complexité tels que la réplication en écriture, les erreurs réseaux, les défaillances temporaires, les pannes de serveur…

Depuis la fin 2018, les bases de données directement dans le cloud de Google. Ça permet surtout aux équipes techniques de se décharger de la complexité liée à la croissance et de piloter plus simplement les différents clusters de serveurs.

Pour en savoir plus sur les technos derrière Spotify, direction le blog des développeurs.

Photo : Andrew Mager