Gérer et découvrir les données avec Alteryx
Introduction
Alteryx est devenu en quelques années « Leader » dans le domaine de l’Automatisation des Processus Analytiques (APA) – cf. Magic Quadrants Gartner 2019 & 2020 relatifs aux plateformes dédiées à la Data Science & au Machine Learning – et ceci en dépit d’une concurrence plus que féroce sur ce secteur du marché (Dataiku, SAS, Databricks…). Ce succès, Alteryx le doit en grande partie à la création d’un outil de traitement et d’analyse de la donnée nommé Alteryx Designer. D’une manière générale, les processus analytiques visent à étudier les données pour en sortir des tendances et informations pertinentes permettant de prendre les bonnes décisions.
Pour mieux comprendre le fonctionnement d’Alteryx, parcourrons ensemble les différents processus analytiques qui le composent. On recense trois types de processus analytiques :
- L’analytique spatiale, qui permet de prendre des décisions en s’appuyant sur des analyses géospatiales, e.g. améliorer le transport et la logistique, les territoires de vente ou encore les campagnes marketing ;
- L’analytique statistique, qui a pour but de réaliser des statistiques comme donner un pourcentage sur la natalité dans un pays, l’utilisation des transports en commun ou le pourcentage de personne disposant d’un assistant vocal (Google Home, Alexa) ;
- L’analytique prédictive, qui tente d’identifier les probabilités ainsi que les tendances à venir. Il permet d’obtenir des informations sur ce qui peut ou va se produire à l’avenir.
Les différents outils qu’offre Alteryx pour effectuer des traitements analytiques
Alteryx Designer
Alteryx Designer permet d’effectuer des analyses de la donnée à travers différents outils. Dans la plupart des cas, les données proviennent de fichiers Excel et CSV (fichiers plats), ou de fichiers de types « .yxdb » (base de données propriétaire). L’interface de Designer, très « User-Friendly », permet une prise en main simple et rapide. Cette dernière est composée de quatre parties (Figure 1) :
- La palette d’outils ;
- Le Canvas ;
- La fenêtre de configuration ;
- La fenêtre des résultats.
Pour commencer, il faut tout d’abord importer la source qui contient les données. Il convient ensuite de préparer les données au moyen d’un certain nombre d’outils (ou « composants ») puis, enfin, d’afficher le résultat. Les outils se situent dans différentes catégories compte tenu des nombreuses fonctions diverses et variées qu’ils proposent. Parmi ces catégories, on retrouve :
- In/Out
- Preparation
- Join
- Parse
- Transform
Et bien plus encore puisque d’autres outils permettent de générer des analyses prédictives ou d’afficher les données sous forme de graphiques.
Designer affiche ses outils sous différentes formes et couleurs pour mieux les différencier afin que l’utilisateur s’y retrouve facilement. Pour une utilisation rapide et optimale, la sélection des différents outils se fait par « Drag & Drop » (action de « Glisser & Déposer »). Lorsqu’un outil nous est inconnu, il suffit simplement de cliquer dessus pour obtenir un résumé de sa fonctionnalité et de son utilisation, ainsi qu’un lien vers une documentation détaillée. Une fois les outils posés, ils sont interconnectés ce qui permet de ne pas perdre le fil de l’analyse.
La différence entre Alteryx Designer et les autres outils d’analyse de la donnée est qu’il offre une interface épurée et claire. Il est difficile de s’y perdre tant il est aisé de comprendre son organisation, sa logique. Designer un outil intuitif, simple et puissant, destiné au plus grand nombre des utilisateurs, qu’ils soient experts (e.g. Data Scientist) ou novices (e.g. utilisateur Métier). Alteryx permet d’optimiser le temps passé à manuellement éditer les données, par exemple dans un fichier Excel, et transforme facilement ces dernières en analyses prédictives, spatiales et/ou statistiques.
Alteryx Server
Un autre avantage d’Alteryx c’est qu’il dispose d’un outil nommé Serveur permettant de centraliser le stockage des Workflows, et ainsi de les mettre à disposition dans un référentiel centralisé pour qui souhaiterait voir ou étudier les résultats d’une analyse. Ce n’est pas seulement utile pour le partage des Workflows, mais également pour l’aide à la prise de décision. En effet, avoir un accès à toutes les données traitées offre un gain de temps précieux aux décideurs car il n’est plus question de se demander où se trouve telle ou telle étude ; avec Server, il suffit de se connecter à son compte pour avoir un accès direct aux données déjà traitées/analysées.
Le serveur peut être installé sur site, « On Premise », comme il peut être déployé sur le Cloud. L’avantage est qu’il est possible d’adapter horizontalement ou verticalement le type d’installation en fonction de la croissance de l’entreprise et des choix de celle-ci.
En général, il est aussi très apprécié par le département IT. En effet, Le fait de disposer d’options d’administration avancées donne le contrôle sur la gestion de la sécurité, la création de comptes, les droits d’ajout/suppression des Workflows ; le tout visant à optimiser l’environnement en sécurité et en efficacité. Le serveur est aussi plus performant que quelconque ordinateur lorsqu’il s’agit d’analyser des données. Certaines études pouvant être coûteuses en termes de ressources pour une simple machine ; le serveur, lui, n’aura que peu de difficulté à « Run » un Workflow. Pour ce faire, il est nécessaire de placer le Workflow, préalablement construit avec Designer, sur le Serveur puis de lancer l’analyse. Tout simplement !
Ce partage de Workflows et d’applications analytiques ce fait au travers d’une galerie privée. Je vous renvoie vers le Replay du Webinar réalisé par Yohan Mathis sur Alteryx Analytics Gallery dans lequel il détaille la création d’une application et son partage.
Les applications analytiques sont des Workflows avec une interface d’utilisateur qu’il est possible de réaliser au moyen « d’Interface Tool ». Ces interfaces permettent à l’utilisateur d’exécuter un Workflow, customisable avec ses propres données et paramètres. On y retrouve ainsi entre autres des outils qui permettent de lire un fichier en entrée ou en sortie, une liste déroulante où l’utilisateur peut effectuer des choix multiples, un message d’erreur personnalisable qui s’affiche si une condition n’est pas remplie ou encore un affichage d’une carte interactive sur laquelle l’utilisateur peut sélectionner un endroit où y dessiner. On peut facilement distinguer les outils de création d’une application analytique car ils sont de couleur noir et blanc (Figure 2).
Pour finir, Alteryx Server dispose d’un outil de Dashboarding offrant la possibilité d’une vue immédiate des résultats d’analyses (Figure 3) et des performances du serveur (Figure 4). Garder un œil sur l’état de la machine et les différentes alertes permet d’agir rapidement en cas de besoin, évitant ainsi de retarder ou de pénaliser le travail quotidien des utilisateurs.
Alteryx Connect
Pourquoi pas ajouter une plateforme collaborative pour explorer les données destinées à l’analyse ? Et bien… C’est ce qu’Alteryx propose avec son outil Connect .
Lorsqu’il s’agit de réaliser un projet autour de la donnée, on passe beaucoup de temps à la chercher pour pouvoir effectuer des analyses… C’est ce qui prend le plus de temps dans le processus ; et non l’analyse en elle-même. Le fait d’avoir des informations déjà collectées offre un gain de temps considérable. Il est possible de stocker ses informations collectées ou même les analyses effectuées au sein de l’entreprise. Avec cet outil, la collaboration est mise en avant ce qui permet d’échanger les idées et les connaissances entre utilisateurs afin d’optimiser les analyses. La gestion des informations accorde une accélération des processus analytiques, engendre une hausse de la productivité et avantage la prise de décisions.
En outre, Alteryx Connect permet de pleinement déterminer l’origine des données utilisées grâce au système de « Data Lineage ». La traçabilité des données techniques est établie via le chargement de métadonnées à partir des systèmes sources/cibles et à l’interprétation des Workflows existants.
Un bonus qui vient avec l’outil est le système de « Like » pour chaque information ou analyse effectuée. Cela permet de mettre en avant le nombre de fois que les utilisateurs ont utilisé tel ou tel Workflow. Pour mieux comprendre l’utilité d’un Workflow particulier, il est aussi envisageable d’ajouter une description à celui-ci (Figure 5).
Alteryx ou un autre outil ?
De mon point de vue, les choses sont claires : Alteryx n’est pas un outil créé simplement. Certes son utilisation est intuitive mais sa conception, complexe, permet de réaliser une multitude de choses. Permettre à tout un chacun de commencer à analyser la Data et qui plus est efficacement, ce n’est pas donné à beaucoup de solution de traitement de la donnée. Les processus analytiques gérés par Alteryx permettent de donner la main au métier ; il convient parfaitement à cette utilisation de type « Ad Hoc », i.e à la demande. Son interface et son design épurés offrent une bonne compréhension de l’utilisation des outils, de la clarté dans la description et une prise en main facile. Il n’est pas nécessaire d’être un expert pour commencer avec Alteryx. La force d’Alteryx réside dans ces éléments-là !
Nous avons vu qu’Alteryx Design, Alteryx Server et Alteryx Connect sont étroitement liés : on génère notre Workflow sur Alteryx Designer, puis on peut le placer sur le serveur pour donner accès à notre travail à d’autres membres. Enfin, il est possible de créer un catalogue de Workflows et d’informations sur les données dans Alteryx Connect, dans le but d’optimiser les processus analytiques destinés à d’autres projets. Alteryx offre un travail fluide et performant pour les entreprises et se met constamment à jour avec l’évolution de la technologie pour offrir un traitement des données de plus en plus efficace.
Le mot de la fin
Dans un monde où la donnée est omniprésente et dans lequel elle a de plus en plus d’importance, il devient primordial d’avoir un outil à la hauteur pour la traiter et l’analyser rapidement et précisément. Pour cette finalité, Alteryx est le candidat parfait ! Alteryx fourni à tous un langage simple permettant l’accès aux statistiques ainsi qu’à la science des données. Ses outils sont constamment mis à jour. Depuis peu, dans sa dernière version (2020.2.2), Alteryx propose « Analytics Hub », un nouvel outil qui va encore plus loin dans l’automatisation, le partage et la sécurité des processus analytiques. Séduisant, n’est-ce pas ?
Et si je vous disais qu’Alteryx Designer regorge d’autres surprises, comme par exemple un outil nommé « Intelligence Suite » permettant de littéralement booster vos analyses, ou encore « Alteryx Promote » avec lequel il est possible de réaliser des modèles prédictifs et de les déployer !
A propos de l’auteur
Eric Moss / Analytics Consultant Actinvision
Milos Dulovic / Analytics Consultant Actinvision