DM – Data Mesh : Définition, Traduction et Origines
Accrochez-vous : le sujet de cet article va être un peu complexe (en tout cas plus que si on avait parlé de Direct Message). Car le “DM” que je vous propose de décortiquer ensemble, c’est le concept de Data Mesh. Il s’agit d’une façon d’organiser et d’architecturer les données en entreprise. Et autant vous dire que c’est un enjeu d’avenir ! Rassurez-vous : nous n’allons pas (trop) rentrer dans la technique.
Data Mesh : définition
Le Data Mesh (DM) désigne un modèle d’écosystème de données qui sont classées en fonction de différents domaines d’activité. Son but : permettre à des équipes interfonctionnelles (et fonctionnelles tout court !) de pouvoir gérer, utiliser et exploiter la data dans chaque sous-domaine.
Un Data Mesh efficace est capable de générer sur demande de véritables “produits” de données. Ces produits vont éclairer les prises de décisions dans les entreprises en fonction d’informations aussi précises qu’utiles. Ils prennent la forme d’architectures en microservices (pour la Data).
Qu’est-ce qu’une architecture en microservices ?
Le concept d’architecture en microservices est central dans le Data Mesh. L’idée derrière cette notion technique est de construire une base de données avec plusieurs sous-services (ou sous-domaines) indépendants plutôt qu’une seule grande base (souvent appelée monolith).
Ainsi, en Data Mesh, au lieu d’accéder à la totalité des données via une immense base de datas, chaque service (ou domaine métier) a sa propre base de données, beaucoup plus légère et adaptée à ses besoins. Les liens entre les microservices restent possibles. Ils sont essentiellement gérés par des API.
Quelle est la traduction de Data Mesh ?
Littéralement, Data Mesh se traduit en français par maillage de données. On peut aussi le traduire par structure de données. Dans tous les cas, l’expression désigne la façon dont est stockée et architecturée la data pour répondre à des besoins spécifiques à chaque service ou domaine de l’entreprise.
Le maillage de données est-il le futur du data management ?
L’enjeu de stocker les données ne date pas d’hier. Dès les années 1980, les entreprises ont eu besoin d’un espace pour entreposer la data en provenance de sources toujours plus nombreuses. C’est là tout le propos du Data Warehouse, ou entrepôt de données (EDD).
Mais le véritable enjeu pour les entreprises derrière le fait de simplement stocker de la donnée, c’est de pouvoir l’exploiter efficacement dans leur business. Dès les années 2000, les EDD sont donc devenus les pivots essentiels de la BI (Business Intelligence).
Pour utiliser la data à son plein potentiel, encore faut-il qu’elle soit correctement rangée. C’est pourquoi le développement d’architectures de données a fait son apparition (avec les Data Lakes par exemple). Le Data Mesh, ou organisation des données en maillage, est l’évolution de ce processus. Depuis 2019, il représente la dernière évolution marquante concernant les données d’entreprise.
Si vous voulez creuser le fonctionnement technique d’un Data Mesh, n’hésitez pas à lire cet article du site DataScientest.
Data Mart VS Data Mesh
Ces deux expressions peuvent générer des confusions, tant elles sont proches. Le Data Mart (ou DataMart) peut être une sous-partie d’un entrepôt de données plus complet. Il est limité à un type bien précis de data. En entreprise, les données contenues dans un Data Mart sont généralement spécialisées sur un métier particulier (DataMarts pour la fonction RH par exemple).
La différence entre Data Mart et Data Mesh ? Le Data Mesh va plus loin encore au niveau du classement des données sous forme d’architecture décentralisée (organisée en microservices, rappelons-le). Autrement dit, avec le DM, chaque service possède une base de données exploitable en toute autonomie.
Data Lake VS Data Mesh
Impossible de parler de Big Data sans évoquer les Data Lakes. Par opposition à l’organisation structurée des DM, les Data Lakes prennent la forme de vastes bases de données brutes (comme un lac profond !). La data reste dans ce cas sous sa forme d’origine.
La différence entre Data Lake et Data Mesh réside donc dans la façon de stocker, traiter et architecturer les données. Cela dit, les Data Lakehouses (mélange entre Data Lakes et Data Warehouses) viennent combler en partie ces différences en venant structurer la data (même si on est encore loin de l’architecture en microservices propre aux Data Meshs).
Comme vous le voyez à travers cet article, les outils de gestion de la Donnée Client sont en évolution permanente. Assurez-vous d’être prêt à vous adapter à ces changements pour rester compétitifs : oui, exploiter efficacement la data est la clé pour sortir du lot !
D’ailleurs, si vous voulez mettre le paquet sur vos données clients, rien de tel que la Customer Data Platform (CDP). La CDP est l’outil idéal pour avoir des données unifiées et exploitables. Ne manquez pas notre article dédié à la Customer Data Platform pour tout savoir à son sujet.
Antoine Coubray a créé CustUp pour aider les entreprises à optimiser leur data, leur Relation Client, et plus globalement leur MarTech. Dans cette série d’articles dédiés aux acronymes, il partage son retour d’expérience sur ces sujets.