Episode 3
Azure COSMO DB
Dans la série AZURE DATA PLATFORM, nous allons vous présenter dans cet article le service COSMO DB que propose AZURE.
AZURE COSMO DB est un service Azure permettant la réplication des données en temps réel dans les différents data center Azure de la planète. C’est un service de base de données multi-modèle qui peut être dimensionné facilement et rapidement grâce au portail Azure et/ou aux API disponibles.
Ce service bénéficie également de la force des infrastructures Azure pour proposer un service en haute disponibilité à 99,999% pour les lectures et écritures.
Cosmo DB est une base de données NoSQL (Not Only SQL) distribuée à l’échelle mondiale. Dans un monde où les données évoluent sans cesse, où toutes les informations doivent être accessibles quasi instantanément, le stockage des données NoSQL est devenu incontournable. En effet, les bases de données « classiques » relationnelles connaissent leurs limites quand il s’agit de traiter de grosses volumétries de données.
Azure Cosmo DB offre des capacités d’évolution, de réplication et de partitionnement horizontal pour un débit élevé, une faible latence (les données se trouvent au plus proches des utilisateurs), et une haute disponibilité.
Migration des données dans Cosmo DB
Azure propose un outil de migration des données dans Azure COSMO DB. Voici les différentes sources de données :
- Fichiers JSON
- Fichiers CSV
- MS SQL Server
- MongoDB
- Fichier d’exportation MongoDB
- Stockage Table Azure
- Amazon DynamoDB
- Objets BLOB
- Conteneurs Cosmos Azure
- HBase
Utilisez l’outil de migration de données pour migrer vos données vers Azure COSMO DB
API et Développement
Azure COSMO DB est accessible via plusieurs interfaces. Les développeurs pourront interagir avec les données grâce à :
- SQL API
- API Mongo DB
- API Cassandra
- API Gemlin
- Azure Table Storage
POWER BI, connecter des outils décisionnels
Pour pouvoir utiliser ses données dans un outil décisionnel comme Power BI, Microsoft propose un connecteur Azure Cosmo DB natif.
Mais il est également possible d’utiliser un driver ODBC pour se connecter avec un autre outil
Les données dans Azure Cosmos DB étant dé-normalisées, le driver ODBC vous permettra de normaliser vos données dans des tables ou des vues en fonction de vos besoins d’analyses.
Tarification
Le service Azure Cosmo DB est facturé en fonction du stockage et du débit provisionné. Le stockage est facturé à l’heure pour chaque Go consommé et chaque région. Le débit est mesuré en unité de requête (RU) par seconde.
Pour estimer le nombre de Request Units à provisionner, il faut prendre en compte la taille d’un élément, la complexité des requêtes, les index, le nombre de propriétés d’un élément …
À titre d’exemple pour une volumétrie estimée à 100 Go, les données répliquées dans 3 régions Azure et 200 RU/s et pour 3 régions, le coût mensuel associé du service Cosmo DB est estimé à 350$.
Un outil Azure pour estimer le coût du service
Cas d’usages
Cosmo DB est fait pour tous les usages qui nécessitent un temps d’accès à faible latence et haute disponibilité, voici quelques cas d’usages pour exemple :
- Applications distribuées à l’échelle mondiale
- IT, télémétrie, ingestion d’énormes volumes de données provenant de sources/d’appareils différents
- Plateforme e-commerce, avoir les données au plus près de ses clients pour des performances optimales
- Journalisation, analyse opérationnelle. Applications qui stockent et analysent d’énormes volumes de données de log.
- Jeux/Réseaux Sociaux. Applications qui doivent gérer des pics d’utilisations et proposer aux utilisateurs un temps de latence très faible pour une expérience optimale
Azure Synapse Analytics (évolution de SQL Datawarehouse)
Un nouveau service azure est né fin 2019 pour venir compléter les services azure autour de la donnée. Ce service nommé Azure Synapse Analytics vient remplacer Azure SQL Datawarehouse, et propose l’entreposage de données, mais également de l’analyse Big Data.
Ce nouveau service permet la gestion de données relationnelles et non relationnelles, dans un environnement unifié pour l’ingestion, la préparation et la distribution des données.
Vous souhaitez en savoir plus sur Azure Cosmo DB ?
Contactez-nous !
A propos de l’auteur
Julien Larcher / Senior Analytics Consultant Actinvision