un robot utilisant chatGPT

Quelle est la base de données de ChatGPT ?

Le très connu assistant et outil d’écriture générative basée sur l’intelligence artificielle d’OpenAI est capable de répondre à d’innombrables questions et mime des comportements humains qui le font paraître intelligent. C’est un outil qui connaît beaucoup de choses et qui a des compétences mais qui n’est pas vraiment intelligent. Bien utilisé et en en connaissant ces limitations, il est très utile et fait gagner beaucoup de temps.

Le cœur de ChatGPT n’est pas basé sur une base de données. Il n’y a pas de base de données qui stockerait toutes les informations collectées pour répondre aux besoins des utilisateurs. ChatGPT est basé sur un modèle de LLM (Large Language Model), une sorte de réseau de neurones spécifique au traitement du langage naturel qui est capable de digérer des sommes astronomiques de contenus et de produire des contenus par association et prédiction. Ces modèles sont entraînés et renforcés par les retours d’utilisateurs.

Pour alimenter le système, plus de 300 milliards de mots et plus de 500 Go de textes extraits du web ont été utilisés. Ces données sont stockées et traitées par du matériel et du logiciel :

  • Côté software : ChatGPT repose sur des frameworks d’apprentissage (deep learning) comme PyTorch ou TensorFlow. Ces outils permettent de monter et déployer les modèles IA classiques. Des composants supplémentaires pour entraîner les modèles et générer des textes viennent en surcouche ;
  • Côté hardware back : Dans la tambouille interne de ChatGPT, OpenAI utiliser des clusters de serveurs avec des processeurs et des processeurs spécialisés (GPU / TPU) dont l’architecture convient parfaitement pour exécuter rapidement les algorithmes d’IA. Les données sont stockées sur des NAS et des disques durs SSD à accès rapide ;
  • Côté hardware front : Pour délivrer les résultats en quasi temps-réel aux utilisateurs, ChatGPT se repose sur des serveurs et un environnement cloud permettant la montée en charge.

Source : ChatGPT 😉