Tableau : extrait de tables multiples
Sécurité, jointures, densification des données : pensez aux extraits de tables multiples
Depuis la version 2018.3, il est possible d’extraire les données avec l’option « Tables multiples » – le schéma table unique était le seul disponible avant. Cette nouvelle fonctionnalité modifie la manière dont l’extrait est stocké.
Schéma dénormalisé
Table unique
- Stock la jointure des tables
- Un seul fichier .hyper en sortie
- Liaisons appliquées lors de la création de l’extrait
- Option par défaut
table unique
Schéma normalisé
Tables multiples
- Stock chaque table de la jointure de manière indépendante
- Un seul fichier .hyper en sortie
- Liaisons effectuées au moment de la requête
tables multiples
1. Fonctionnement – comment ?
- Connecter la source de données
- Créer une jointure
- Sélectionner « Extrait » en connexion
- Cliquer sur Modifier puis sur « Tables Multiples » en option de stockage
2. Cas d’usage – Quand?
L’extrait de Tables multiples permet d’améliorer les performances ainsi que de diminuer l’espace utilisé par l’extrait dans les cas suivants :
- Sécurité au niveau de la ligne de données – Row level Security
- Jointures avec fichiers volumineux – Shapefile
- Densification des données (nécessitant une duplication de lignes Sankey, Sunburst etc…)
Cas 1 –
Row Level Security
La sécurité au niveau de la ligne de données est une stratégie de gestion des accès à la donnée qui permet de filtrer les lignes d’une source de données en fonction de l’utilisateur qui s’y connecte.
En d’autres termes, cela permet à deux utilisateurs différents de voir sur le même tableau de bord uniquement les données qu’ils sont autorisés à consulter.
Dans ce cas de figure, toutes les lignes sont multipliés par le nombre d’utilisateur qui doit y accéder. Ainsi un extrait de table unique est soit impossible soit trop lent à mettre en place.
Avec la nouvelle fonctionnalité chaque table est stockée de manière indépendante – avant la jointure – ce qui permet de créer l’extrait plus rapidement et d’améliorer les performances.
Row Level Security
Cas 2 –
Shapefile
Les fichiers Shapefile sont très utiles lorsqu’il s’agit de représenter des regroupements géographiques n’étant pas connus ou bien non gérés par Tableau.
Le connecteur de données Tableau dédié aux fichiers spatiaux permet ainsi d’effectuer directement des jointures entre des fichiers de données et ces référentiels contenant les polygones à afficher.
Dans l’exemple ci-dessous, nous regardons les données démographiques françaises au niveau des codes IRIS. Ces codes n’étant pas disponibles parmi les rôles géographiques « de base » présents sur Tableau, nous allons joindre nos données au shapefile « base iris » permettant de représenter ces polygones.
ExtraitsTablesMultiples
Une fois la jointure paramétrée, il est très facile d’utiliser des représentations cartographiques en utilisant le champ « géométrie » présent dans la source.
Familles monoparentales dans le Bas-Rhin
S’il est possible de réaliser ce type de jointure avec tous les types d’extraits, l’extrait multiple apparait comme étant beaucoup moins volumineux, pour le même nombre de lignes retournées !
démonstration des volumes des fichiers
1. Limites d’utilisation des extraits de tables multiples
- Liaisons entre les tables sont uniquement des égalités
- Impossible donc de restreindre les données récupérées via un INNER JOIN
- Un extrait multiple récupérera l’ensemble des données de chacune des tables
- Aucun filtre d’extrait ne peut être appliqué
- Pas d’agrégation des données dans l’extrait
- Pas d’échantillonnage ni d’option N premiers
- Aucune actualisation incrémentielle ne peut être configurée
- L’agrégation permet de minimiser la taille du fichier d’extrait, de consolider les lignes et améliorer les performances
Solution au filtrage
par INNER JOIN
Gérer le filtrage des données
- Se connecter aux données à l’aide d’une requête SQL personnalisée permettant de filtrer les données à récupérer en amont
- Se connecter à une vue de base de données qui affiche déjà le niveau de filtrage approprié
Vous souhaitez en savoir plus sur les tables multiples dans Tableau Desktop ?
Contactez-nous !
A propos des auteurs
Manel Abdi / Analytics Consultant Actinvision
Maxime Baux / Analytics Consultant Actinvision