ETL – Extract Treat Load : Définition et Fonctionnement
Comprendre le concept de l’ETL (acronyme pour Extract Treat Load) est essentiel pour tous les spécialistes de la donnée. Mais attention : le sujet vous concerne également si vous êtes marketeur, professionnel de la Relation Client, consultant CRM, ou même en charge d’un Centre de Contacts. Car les méthodes d’extraction, de transformation et de chargement des données sont désormais omniprésentes dans tous les processus liés aux MarTech (technologies marketing). Pas de panique : je vous résume ce que vous devez savoir sur l’ETL, sans trop rentrer dans la technique (promis !).
Que veut dire ETL ?
L’acronyme ETL signifie Extract Treat Load. Il s’agit d’une méthode d’intégration de la donnée, qui consiste à transférer des données d’un endroit à un autre. Durant ce processus d’ETL, les données proviennent de différentes origines. Il faut donc les traiter et les combiner entre elles dans un grand référentiel central (souvent un Data Warehouse).
De quelles données parle-t-on ? Eh bien, elles peuvent être de tout type. Dans le cadre de cet article, nous parlerons surtout de la Donnée Client. L’intérêt étant de comprendre cette donnée afin de pouvoir l’exploiter au mieux dans le marketing de l’entreprise pour laquelle vous travaillez.
Quelle est la traduction de Extract Treat Load ?
Littéralement, Extract Treat Load se traduit en français par extraire, transformer et charger (ou extraction, transformation et chargement). Il s’agit ni plus ni moins que de la description de chaque action du processus d’ETL.
Quel est le but de l'intégration de données ?
L’intégration des données est la finalité derrière le processus d’ETL. Cette intégration consiste à rassembler toutes les données provenant de différentes sources en vue d’obtenir une vision globale et unifiée de la data (qui sera très utile pour aider votre entreprise à prendre de meilleures décisions). Car nous sommes bien d’accord : personne n’a envie de s’embêter à collecter et traiter des données pour le plaisir !
L’ETL ne date pas d’hier. Au fur et à mesure que les bases de données gagnaient en popularité dans les années 1970, cette méthode a été introduite pour le calcul et l’analyse de la data. Elle est finalement devenue la principale méthode de traitement des données utilisée.
Et ce n’est pas pour rien ! Le processus d’ETL est logique : il transforme un amas de données brutes en une donnée plus structurée et facile à analyser. Par exemple, il permet aux équipes marketing de comprendre le comportement des clients en étudiant les données issues du CRM. Cette compréhension est essentielle pour optimiser le ROI de leurs actions marketing.
Comment fonctionne un processus d’Extract Treat Load ?
Ah, la partie technique de l’article ! Rassurez-vous : mon but n’est pas de faire de vous un expert de la data. Mais plutôt de vous expliquer brièvement le fonctionnement du processus ETL (et de vous montrer en quoi il est logique).
L’extraction, la transformation et le chargement de données sont les 3 actions (dans l’ordre) de ce processus :
- Extract : l’extraction de données consiste à extraire des données issues de différentes sources (sous une forme homogène ou hétérogène d’ailleurs).
- Treat : c’est la phase de traitement de la donnée, qui inclut plusieurs méthodes de transformation des données (nettoyage, agrégation, déduplication, etc.) afin de les rendre plus faciles à stocker, catégoriser et analyser.
- Load : l’étape du chargement des données représente l’insertion des données dans le référentiel cible final (il peut s’agir par exemple d’un magasin de données, d’un entrepôt de données ou encore d’une Customer Data Platform dans le cas de Données Clients).
Toutes ces actions servent donc à transformer des données brutes en informations exploitables par des utilisateurs humains (via des tableurs ou des outils de Business Intelligence).
Quelle est la différence entre ETL et ELT ?
Qu’on dise ETL ou ELT, c’est du pareil au même, non ? Après tout, c’est “juste” l’ordre qui change (car les mots de ces deux acronymes sont identiques). Eh bien, non : ETL n’est pas égal à ELT. Car c’est justement l’ordre des actions qui change pour ces deux processus.
En mettant l’action de chargement (Load) avant le traitement (Treat), l’ELT charge les données brutes directement dans un entrepôt de données cible, au lieu de les transformer en données exploitables (ou de les déplacer vers un serveur de traitement). Et ça change beaucoup de choses !
Avec la méthode ELT, le nettoyage, l’enrichissement et la transformation des données se produisent tous à l’intérieur de l’entrepôt de données lui-même. Les données brutes sont ainsi stockées directement dans ce dernier. Contrairement à l’ETL (qui date des années 1970, rappelons-le), l’ELT est relativement nouveau. Il a été rendu possible par l’évolution des fonctionnalités des entrepôts de données (notamment basés sur la technologie Cloud).
Même si la finalité est la même avec l’ETL et l’ELT, leurs processus diffèrent dans l’ordre des actions, ainsi que dans les outils utilisés pour gérer le traitement de la donnée. Et si vous voulez un outil capable de vous fournir des Données Clients déjà unifiées et immédiatement exploitables par vos équipes, la Customer Data Platform va vous intéresser !
Antoine Coubray est le fondateur de l’agence CustUp. Il vous partage son expertise des sujets liés au MarTech, à la Relation Client et aux Centres de Contacts. Cette série d’articles sur les acronymes est justement là pour vous aider à mieux les appréhender dans votre quotidien.