Article
Les datamarts avec
Power BI
Article rédigé par Julien Oudille – Consultant BI Actinvision
Après l’apparition des Dataflows, Microsoft a choisi d’introduire une nouvelle manière d’ingérer de la donnée dans l’écosystème Power BI, par l’intermédiaire des Datamarts.
Au sein d’une organisation, les travailleurs de la donnée s’appuient souvent sur des sources de données diverses et régies de manière centralisée. Si bien qu’une demande de modification peut prendre des semaines avant d’être implémentée par les services informatiques.
Les Datamarts répondent à cette problématique par une volonté de démocratisation de la BI self-service au sein de l’organisation.
Qu’est-ce qu’un « datamart » ?
On peut voir un Datamart comme un équivalent de Power BI Desktop simplifié et disponible en ligne. Dans une approche « no-code » ou « low-code », les utilisateurs peu techniques auront toutes les fonctionnalités de Power BI Desktop accessibles depuis Power BI Service, et dans un seul et unique outil.
Création d’un datamart
Un complément bienvenu au sein de l’écosystème Power BI
Disponible dans le cadre d’une licence premium (capacitaire ou par utilisateur), le Datamart stocke les données dans une base de données SQL Azure auto-gérée, qui s’adresse principalement aux analystes ayant une appétence forte pour le SQL, et permettant surtout la mise à disposition d’un entrepôt de données accessible en dehors de l’écosystème Power BI grâce au point de terminaison XMLA.
Chaîne de connexion de la SQL Azure | Connexion via un outil d’administration de base de données (ex : SSMS) |
Selon Microsoft : « Cette technologie permet d’ingérer, de préparer, de stocker et d’explorer les données chargées dans une base de données Azure SQL entièrement gérée et partagée au sein d’une organisation, dans une approche self-service afin de s’affranchir de tout autre service, comme les équipes IT, et de tout autre outil, le datamart permettant un traitement de bout en bout ».
Aucune compétence de programmation n’est requise. Power Query est intégré aux datamarts et permet de préparer la donnée dans une démarche sans code.
Power Query Online
Une fois créé, le datamart génère automatiquement un jeu de données Power BI pouvant être utilisé dans des rapports. Ce jeu de données est entièrement personnalisable comme sur le client Desktop, et il est même possible d’y introduire du DAX (sous la forme de mesures uniquement) par voie manuscrite ou visuelle.
La vue « Données du datamart »
La vue « Modèle » du datamart
Création de mesures intéractives
Etant une base de données, un éditeur de requête SQL est intégré au Datamart pour l’analyse ad hoc. Les analystes peuvent ainsi facilement requêter et analyser les données de l’organisation, sans avoir besoin d’un administrateur de base de données dédié.
Un client SQL intégré au datamart
On peut donc voir le datamart comme étant à la fois un entrepôt de données ET un jeu de données Power BI consolidé et partagé au sein de l’organisation.
Ce jeu de données peut être consommé à la manière d’un jeu de données classique (en live ou en important certaines tables uniquement) et peut être combiné avec d’autres sources pour former un modèle local.
Connexion au jeu de données généré par le datamart depuis Power BI Desktop
Les cas d’utilisation des différents data-entities de Power BI
Dataset, Dataflow, Datamart… L’idée que l’on se fait de la frontière qui sépare les besoins couverts par ses différents outils est parfois très trouble. Faisons un rapide point de gouvernance :
Un jeu de données est obligatoirement à la base de tout rapport Power BI. Il est au bout de la chaîne mais peut être consolidé, certifié et partagé
Un flux de données peut être vu comme un outil d’ETL online intégré à Power BI Service. Il permet de mutualiser la partie ETL des données à exploiter dans les rapports.
Un datamart est à la fois un entrepôt de données, avec tous les cas d’utilisation qui en découlent, et un jeu de données Power BI.
En combinant flux de données et Datamart, on reproduit une architecture ETL complète entre préparation de données et intégration en base, et ce dans une approche « low-code »
En conclusion
Le Datamart est une solution complète et totalement innovante en matière de mise à disposition des données. Au-delà de pleinement s’inscrire dans l’écosystème Microsoft, le Datamart est un magasin de données à part entière, et peut par conséquent servir de source, pour Power BI bien sûr, ou d’autres environnements.
Côté Power BI, le Datamart introduit une nouvelle manière de collecter et de restituer la donnée. Il se débarrasse des contraintes d’orchestration entre flux de données et jeu de données, en embarquant la partie ETL et en mettant à disposition un jeu de données, le tout agrémenté d’expériences de requêtes visuelles pour la préparation, la restitution et l’analyse ad-hoc.
En somme, le Datamart peut répondre à de nombreux scenarii et s’il semble d’ores et déjà compléter à merveille la suite des Data – « entities » Power BI, il ne fait que poursuivre une démarche de BI en « self-service » qui continuera de se développer.