Access architecture tables

Les bases de données les plus demandées

En France, quelles sont les compétences les plus recherchées en matière de base de données ? L’incontournable site Développez.com a mis à jour son étude sur les offres d’emplois liées aux bases de données. L’étude porte exclusivement sur les données internes du site pré-cité. C’est un site majeur pour l’informatique pro mais il ne représente pas l’intégralité du marché. Il peut donc y avoir des risques à extrapoler. Cette précision étant faite, il ressort de cette étude les informations suivantes :

  • MySQL est le SGBD incontournable. Cité dans presque 4 offres d’emplois sur 10, il est loin devant MongoDB, PostgreSQL et Oracle (16%, 15% et 13% des demandes). Arrive ensuite les outils Microsoft avec SQL Server (9%) et Access (6%).
  • Sur 5 ans, MySQL est toujours le plus demandé. Oracle, SQLServer, Access et DB2 sont toujours sur une pente descendante alors que MongoDB et PostgreSQL tire leur épingle du jeu.
  • L’influence du big data se fait sentir et c’est MongoDB qui en profite clairement.
  • Les salaires varient toujours beaucoup entre Paris et la province. Les salaires augmentent avec la rareté sauf pour Firebird. C’est la raison pourquoi MySQL, malgré une forte demande, paye assez mal. À l’inverse MongoDB, DB2, Sybase sont des expertises qui se monnaient plutôt bien.
bases de données à l'école

Est-ce aujourd’hui intéressant d’apprendre les bases de données ?

Oui et ce n’est pas prêt de changer. Les bases de données sont partout. Ce n’est pas pour rien que dans beaucoup de formations post-bac, les élèves approchent les bases de données. Ce n’est pas pour les transformer en informaticien ni pour trouver autre chose à faire que des maths, c’est pour leur faire voir l’envers du décor et leur donner les clés de compréhension pour mieux aborder les outils informatiques qu’ils vont utiliser au quotidien..

Alors certes, connaître la différence entre telle ou telle techno (SQL vs NoSQL)et savoir faire des requêtes SQL ne sert pas concrètement mais comprendre comment les données sont liées entre elles et pourquoi il y a des règles pour que tout fonctionne bien est fondamental.

C’est ce qui permettra plus tard de comprendre que l’on ne peut pas, par exemple, supprimer un client s’il a déjà des factures qui lui sont liées. Ou permettra de comprendre pourquoi il n’est pas possible de filtrer en fonction de certains critères ou d’extraire des données de tous types de champs (lorsque les chiffres et les lettres sont mélangés typiquement).

Oui, apprendre les briques fondamentales liées à la théorie des bases de données est important. Oui, manipuler quelques exemples simples permet de fixer les acquis et de rendre concret des savoirs abstraits.

Connaître les enjeux, les limites, les avantages et les écueils des bases de données permet aux futurs responsables et chefs de projets de faire de meilleurs cahier des charges, d’avoir des attentes raisonnables et de mieux piloter les projets sous leurs responsabilités.

IA et bases de données

Bases de données et intelligence artificielle

L’intelligence artificielle est de nouveau à la mode. Et c’est parti pour durer cette fois-ci. La puissance des composants informatiques et la baisse des coûts liés au matériel permet désormais de faire tourner des algorithmes d’IA. Ces programmes informatiques ne sont pas encore vraiment intelligents au sens ou un humain le comprend mais ils sont déjà très puissants pour le traitement de masses de données importantes.

Que ce soit pour faire des tris, des classifications, pour voir des regroupements et faire des associations là ou le cerveau humain ne le peut pas (car trop de paramètres), les algos de machine learning et de deep learning principalement mais aussi leurs ancêtres les réseaux de neurones et plus anciens encore les algorithmes de systèmes expert et les arbres de décisions reposent tous sur un point fondamental. Pour pouvoir travailler correctement, ces outils ont besoin d’informations propres et bien classées. Et qui donc garantit des informations validées, structurées, liées entre elles de façon logique ? Les bases de données.

Certes il est possible de travailler à partir de jeux de données (les fameux datasets) plus ou moins propres mais ce que le grand public ne sait pas c’est que :

  • Un temps important est consacré à nettoyer les données avant de les soumettre aux algorithmes d’IA ;
  • Des données pas très propres donnent des résultats pas forcément convaincants (ça on peut s’en douter) mais trop de données donnent aussi parfois des résultats aberrants.

Il existe bien sûr des outils de data-mining. L’approche entre big-data et informatique décisionnelle est d’ailleurs basée sur la difficulté à travailler avec des jeux de données propres (en informatique décisionnelle, on fait parler les chiffres qui sont déjà bien rangées dans des cases prévues à cet effet, en big-data on essaie de tirer des enseignements de données moins bien rangées). Dans les 2 cas, les bases de données servent à un moment ou un autre (en amont / en aval) pour organiser les données brutes et/ou les résultats.