Big Data
Dans cet article, je vais vous résumer ce qu'est le Big Data et vous présenter brièvement ces concepts.
Qu'est ce que le Big Data?
Le Big Data est souvent défini comme un large volume de données qui ne cessent d'augmenter ce qui a pour conséquence de rendre inutile les outils de gestions de données habituels (base de données, MQ...).
Après quelques recherches sur internet, la définition suivante me semble approprié: Le Big Data traduit un contexte ou nous avons un ensemble de données qui ne cesse de s’accroître dans des proportions énorme, telle que les technologies classiques ne sont plus en mesure de gérer efficacement la taille, l'échelle et l'évolution de celui-ci.
Ce qui rends très complexe l'extraction de la valeur ajouté de ces données (Visualisation, stockage, acquisition, recherche, analyse, partage).
Le Big Data est un sujet tellement vaste qui ne cesse d'évoluer, celui-ci englobe également tous les processus permettant de tirer parti de la donnée.
Le Big Data est aujourd'hui lié à des concepts tel que Business Intelligence, Data Analytics, Data Mining.
Il est bien de savoir que le Big Data n'est pas un concept nouveau, celui-ci a ses origines dans les milieux scientifiques et médicaux (Laboratoire de recherches, NASA ...) ou celui-ci a fait ses preuves depuis plus de 20 ans.
Le Big Data est plein d'opportunités pour différentes industries, exemple, dans le domaine de la finance, nous avons d'important volume de données (instruments, tiers, transactions, réglementaires, salariés, e-mails, télécommunication, chat, climatiques ...).
C'est quoi le Data Analytics?
C'est la recherche de valeur ajoutée sur un volume de données important en se basant sur des attributs déjà connu.
A quoi sert la Business Intelligence?
C'est une analyse de données permettant de faciliter la prise de décisions.
A quoi sert le Data Mining?
C'est une analyse de données sous différentes perspectives permettant d'en tirer des informations utiles et émettre des prédictions et ou hypothèses.
En conclusion je vais vous présenter les 5 règles à prendre en compte dans une démarche Big Data.
- Volume: gestion de volume de données important, être capable de stocker des énormes volumes de données.(nous produisons environ 3 exaoctets[10^30] de données par jour)
- Variété: gestion de diverses variétés de données (structuré, non-structuré)
- Véracité: la fiabilité, la qualité de la données sont importantes afin de ne pas biaiser les analyses.
- Vélocité: analyse, mise à disposition des données très rapidement.
- Valeur: la valeur ajouté est essentiel dans une démarche Big Data, il faut identifier les avantages, inconvénients d'une telle démarche, le coût et le retour sur investissement.
Mon prochain article portera sur la fiabilité de la donnée.