DWH – Data Warehouse : Définition, Origines et Fonctionnement
Je ne vais rien vous apprendre en vous disant que les données sont aujourd’hui partout. Mais vous êtes-vous demandé où ces datas étaient stockées ? Car la donnée représente le pouvoir à l’ère de la technocratie. Ceux qui ont l’information ont le pouvoir (regardez les GAFA). Il est donc essentiel de prendre soin de ces précieuses données. Les Data Warehouses (DWH) sont là pour ça. Ils centralisent les datas afin de les analyser. Voici un résumé de ce que vous devez savoir sur le Data Warehouse.
Article mis à jour le 23 janvier 2024.
Data Warehouse : définition
Un Data Warehouse (DWH), parfois écrit Data Ware House ou Datawarehouse, désigne une plateforme utilisée pour recueillir et analyser des données issues de sources hétérogènes. Le but : faciliter la prise de décision des entreprises qui savent exploiter la data.
Le terme de Data Warehousing désigne quant à lui le processus de collecte et de gestion de la data. D’ailleurs, ce processus n’est pas forcément géré en interne. Il est plutôt confié à un prestataire externe qui prend en charge la récolte, le stockage et parfois l’analyse des données dans ses propres Data Warehouses.
Comment dit-on Data Warehouse en français ?
Littéralement, Data Warehouse se traduit en français par entrepôt de données (EDD). Ce terme désigne ainsi l’espace où sont collectées, ordonnées et stockées les datas.
L’origine des entrepôts de données
Depuis leur apparition, les ordinateurs sont devenus toujours plus complexes. Leur fonctionnement se résume à l’utilisation de données. De même pour les autres outils numériques ayant émergé ces dernières décennies : smartphones, tablettes, réseaux sociaux, CRM, etc.
En toute logique, le volume de données dans le monde a énormément augmenté. Cette augmentation est à la fois une aubaine et un défi pour les entreprises.
- Une aubaine, car les Données Clients permettent de connaître les besoins des clients et d’y répondre au mieux avec des produits adaptés.
- Un défi, car les datas ont besoin d’être récoltées, unifiées et correctement traitées, aussi bien pour des raisons marketing que pour des questions légales (RGPD entre autres).
C’est IBM qui a créé le premier Data Warehouse d’entreprise à la fin des années 1980. Cela dit, le concept d’entrepôt de données aurait été inventé par l’informaticien William H. Inmon. Selon ce dernier, un Data Ware House doit présenter 4 caractéristiques :
- Être orienté sujet : il peut analyser les données en fonction de leur typologie.
- Être intégré : il rassemble et harmonise des données issues de différentes sources.
- Être non volatile : il ne doit pas modifier les données qu’il stocke.
- Être « time-variant » : il permet des analyses par dates.
Comment fonctionne un Data Ware House ?
Pour mettre en application ces 4 caractéristiques, les entrepôts de données sont des assemblages complexes de plusieurs technologies. En plus de stocker un gros volume de datas, les Data Ware Houses sont capables de transformer les données brutes en informations pertinentes et exploitables par des utilisateurs humains (via des outils de Business Intelligence et des tableurs).
En ce qui concerne l’intégration des données, le fonctionnement d’un Data Warehouse applique le processus ETL (Extract, Transform, Load). Pour faire simple, ce processus permet de collecter et d’intégrer des données issues d’applications différentes. Ce qui fait que le Data Warehouse fonctionne comme un grand répertoire central.
L’agrégation et le stockage d’informations au même endroit permettent aux entreprises d’avoir une vue d’ensemble sur les données concernant leurs clients et leurs utilisateurs. Le Data Warehousing est là pour tirer profit autant que possible de ces données.
Data Warehouse ou Data Mart ?
Ces deux termes sont souvent confondus, tant ils sont proches. En fait, un Data Mart (ou DataMart) est un sous-ensemble du Data Warehouse. Alors que le DWH couvre plusieurs sujets au niveau de ses données, le Data Mart est spécialisé sur un seul type de data. Il sert à accéder plus facilement à des données bien spécifiques.
En entreprise, les données d’un Data Mart ciblent souvent un métier en particulier. Il y a par exemple des Data Marts commerciaux. Les données de ces DataMarts sont ainsi ciblées et regroupées pour faciliter le travail de l’équipe commerciale.
Data Warehouse ou Data Lake ?
Les expressions Data Warehouse et Data Lake sont souvent confondues, à tort, dès lors qu’on parle de Big Data. Contrairement au premier qui est un référentiel de données structurées, le Data Lake désigne un immense gisement de données brutes (à l’image d’un lac). Il prend la forme d’une banque de stockage qui contient une vaste quantité de datas dans leur format d’origine.
Pour résumer, Data Lake et Data Ware House se distinguent sur plusieurs aspects : la façon de traiter et de structurer les données, le mode de stockage, la sécurité et l’usage de la data.
Data Warehouse ou Customer Data Platform ?
La principale différence entre le Data Warehouse et la Customer Data Platform (CDP) réside dans le fait que cette dernière se concentre uniquement sur les données clients. C’est-à-dire sur la data exploitable par l’équipe marketing et sales.
Contrairement à la CDP, le DWH rassemble et stocke toutes les données, même celles qui ne sont pas utiles pour améliorer la Relation Clients. Notez bien que le DWH est implémenté et piloté par les équipes IT (bien souvent aidées par l’éditeur). Autrement dit, les marketeurs et autres commerciaux n’ont pas les compétences nécessaires pour gérer efficacement un Data Warehouse.
Au fond, le plus important n’est pas de connaître la différence entre Data Warehouse et CDP, mais plutôt de savoir lequel est le plus utile pour vous. Si vous voulez des données unifiées et immédiatement exploitables, vous savez vers quelle solution vous tourner. Pour aller plus loin sur le sujet, nous vous invitons à lire notre article sur la Customer Data Platform.
Créateur de l’agence CustUp, Antoine Coubray vous partage son expertise des sujets liés au MarTech, à la Relation Client et aux Centres de Contacts. Cette série d’articles sur les acronymes est là pour vous aider à les comprendre.