base de données scientifique

Quelle est la plus grosse base de données au monde ?

Aucune idée et ça n’a pas beaucoup de sens. Une base de données peut être très importante mais elle doit :

  • Avoir des données structurées (pas de l’information en vrac)
  • Être utilisable (Walmart souvent cité dans les années 2000 pour sa base de données gigantesque mettait 30 jours pour afficher le début d’une simple instruction SELECT).

Et tout cela sans compter les questions de qualité de l’information (juste, à jour), de stockage (il faut compter les sauvegardes ou pas ?) et d’emplacement (les données doivent-elles être physiquement au même endroit ?).

Malgré ces remarques préliminaires, voici quelques bases de données parmi les plus importantes au monde :

  • La librairie du congrès américain : Plus de 20 To de données ;
  • Google : plus de 35 billions (mille milliards) d’informations et plus de 20Po seulement pour Maps ;
  • Les services secrets : beaucoup, beaucoup d’informations mais c’est secret (une petite idée de ce que stocke la NSA est disponible ici).
  • Sprint, opérateur télécom qui gère plus de 350 millions d’appels chaque jour et dispose d’une base de données de plus de 2,9 billions de lignes loin devant AT&T, autre opérateur télécom qui en a 1 billion de moins ;
  • Amazon : Plus de 45 To de données (produits et clients) ;
  • YouTube : 45 To de données en base (pas les vidéos) ;
  • Facebook : Plus de 30Po en base de données (et ça date de 2013) ;
  • Les services de cartographie basés sur des bases de données avec couches d’informations superposés ;
  • LexisNexis : une gigantesque base de données de plus de 250 To sur la population américaine ;
  • Les banques et les états (base de données de transactions, d’identité, de sécurité sociale…) ;
  • La recherche est elle aussi très consommatrice de données avec une base de données de 2,8 Po pour le NERSC (énergies) , 220 To pour le WDCC (météo) , 600 Po pour le CERN uniquement pour le LHC (physique) et 10Po chaque heure pour certains téléscopes ;
  • La médecine
  • Le web ? C’est bien une base de données relationnelle (les liens de pages en pages) et la masse d’information y est gigantesque.