Entreposage de données
Qu’est-ce que l’entreposage de données?
L’entreposage de données est le stockage électronique d’une grande quantité d’informations par une entreprise ou une organisation. L’entreposage de données est une composante vitale de l’intelligence d’affaires qui utilise des techniques analytiques sur les données d’entreprise.
Le concept d’entreposage de données a été introduit en 1988 par les chercheurs d’ IBM Barry Devlin et Paul Murphy. Le besoin d’entreposer les données a évolué à mesure que les systèmes informatiques devenaient plus complexes et traitaient des quantités croissantes de données. Un livre clé sur l’entreposage de données est «Building the Data Warehouse» de WH Inmon, qui a été publié pour la première fois en 1990 et a été réimprimé plusieurs fois depuis.
Fonctionnement de l’entreposage de données
L’entreposage de données permet de mieux comprendre les performances d’une entreprise en comparant des données consolidées à partir de plusieurs sources hétérogènes. Un entrepôt de données est conçu pour exécuter des requêtes et des analyses sur des données historiques dérivées de sources transactionnelles.
Une fois que les données ont été incorporées dans l’entrepôt, elles ne changent pas et ne peuvent pas être modifiées car un entrepôt de données exécute des analyses sur les événements qui se sont déjà produits en se concentrant sur les modifications des données au fil du temps. Les données entreposées doivent être stockées de manière sécurisée, fiable, facile à récupérer et à gérer.
Certaines étapes sont prises pour créer un entrepôt de données. La première étape est l’extraction de données, qui implique la collecte de grandes quantités de données à partir de plusieurs points source. Une fois les données compilées, elles passent par le nettoyage des données, le processus de recherche d’erreurs dans les données et de correction ou d’exclusion des erreurs trouvées.
Les données nettoyées sont ensuite converties d’un format de base de données à un format d’entrepôt. Une fois stockées dans l’entrepôt, les données sont triées, consolidées, résumées, etc. afin qu’elles soient plus coordonnées et plus faciles à utiliser. Au fil du temps, davantage de données sont ajoutées à l’entrepôt à mesure que les multiples sources de données sont mises à jour.
Points clés à retenir
- L’entreposage de données est le stockage électronique d’une grande quantité d’informations par une entreprise ou une organisation.
- Un entrepôt de données est conçu pour exécuter des requêtes et des analyses sur des données historiques dérivées de sources transactionnelles à des fins de veille économique et d’exploration de données.
- L’entreposage de données permet de mieux comprendre les performances d’une entreprise en comparant des données consolidées à partir de plusieurs sources hétérogènes.
Considérations spéciales: exploration de données
Les entreprises peuvent entreposer des données à utiliser dans l’exploration et l’exploration de données, à la recherche de modèles d’informations qui les aideront à améliorer leurs processus commerciaux. Un bon système d’entreposage de données peut également permettre aux différents services d’une entreprise d’accéder plus facilement aux données des uns et des autres.
Par exemple, un entrepôt de données peut permettre à une entreprise d’évaluer facilement les données de l’équipe de vente et aider à prendre des décisions sur la façon d’améliorer les ventes ou de rationaliser le service. L’entreprise peut choisir de se concentrer sur les habitudes de dépenses de ses clients pour mieux positionner ses produits et augmenter ses ventes.
Grâce à l’entreposage de données, l’entreprise peut collecter des données historiques sur les dépenses de ses clients au cours des 20 dernières années, disons, et exécuter des analyses sur ces données. Les informations qui en résultent pourraient donner un aperçu des préférences de ses consommateurs; le moment de la journée, du mois ou de l’année où les ventes ont augmenté; ou client le plus dépensier de l’année.
Le stockage et la gestion efficaces des données sont également ce qui rend les processus possibles, tels que le lancement de réservations de voyage et l’utilisation de guichets automatiques.
Le processus d’exploration de données se décompose en cinq étapes:
- Les organisations collectent des données et les chargent dans leurs entrepôts de données.
- Ils stockent et gèrent ensuite les données, soit sur des serveurs internes, soit dans le cloud.
- Les analystes commerciaux, les équipes de direction et les professionnels des technologies de l’information accèdent aux données et déterminent comment ils souhaitent les organiser.
- Le logiciel d’application trie ensuite les données en fonction des résultats de l’utilisateur
- L’utilisateur final présente enfin les données dans un format facile à partager, tel qu’un graphique ou un tableau.
Entreposage de données et bases de données
Un entrepôt de données n’est pas nécessairement le même concept qu’une base de données standard. Une base de données est un système transactionnel configuré pour surveiller et mettre à jour les données en temps réel afin de ne disposer que des données les plus récentes. Un entrepôt de données est programmé pour agréger des données structurées sur une période de temps. Par exemple, une base de données peut avoir uniquement l’adresse la plus récente d’un client, tandis qu’un entrepôt de données peut contenir toutes les adresses dans lesquelles le client a vécu au cours des 10 dernières années.