Les 4 sources du Big Data

Avec l’explosion des volumes des informations, l’entreprise doit recourir à Big Data pour traiter les volumes massifs de données à temps réel. Celle-ci facilite l’analyse perspective pour remplacer l’analyse reporting d’une entreprise. Découvrez les quatre sources d’informations appuyant le traitement Big Data.

L’information en interne de l’entreprise telle que les journaux de ventes, la variation des stocks… contribue à l’élaboration des entrepôts de données. Une visualisation de ces données massives est ensuite réalisée. Les informations sont traitées sous forme de cubes décisionnels pour explorer les indicateurs de performances suivant le temps, l’emplacement géographique, et autres dimensions.

« More Data » pour de nouvelles sources : 

Le traitement Big Data recherche des informations en externe à l’entreprise pour enrichir ses bases de données. Mais les données recueillies ont été longuement sélectionnées afin d’acquérir des nouveaux points de vue sur l’activité de l’entreprise, la conjoncture de son secteur…

Quatre sources d’informations garnissent le Big Data : les « logs » des sites web, les « insights » des médias sociaux, les « third party data » et enfin l’Open data.

Les « logs », sur le site officiel de l’entreprise

Pour de nouvelles pratiques Marketing, l’entreprise dispose forcément d’un site officiel. Ce site servant de vitrine à l’entreprise permet de collecter les informations pour son évaluation. L’existence des trackers sur les différentes pages analyse les chemins de navigation pour parvenir sur le site, l’heure passée sur chaque page… Google Analystics, Adobe Omniture, Coremetics sont les outils d’analyse les plus connues.

        Les « insights » pour mesurer la réputation sur les médias sociaux

Véhiculer une image, communiquer par le biais des médias sociaux sont de plus en plus pratiques. C’est une des nouvelles techniques pour remplacer les traditionnelles enquêtes.

Il faut faire attention au travers des likes, des partages, des retweets qu’on obtient facilement. Les signaux négatifs sont moins nombreux, mais devront tout de même être pris en compte. Recensez donc les publications masquées ou désabonnement.

Une autre technique associant méthodes quantitatives et qualitatives consiste à collecter tous les commentaires aux publications et de les analyser avec des calculs précis. Des outils comme Hootsuite, Radian6 avec le complément Power Query, IRaMuTeQ servent à suivre vos comptes.

        La « third party data », pour mieux cibler les données comportementales

Les entreprises peuvent récolter les informations via des formulaires ou des cookies. Au-delà des informations sur l’âge, le sexe, le CSP, on peut aussi mesurer les comportements des consommateurs avec la mesure de la navigation, des configurations matérielles… Blueakai, Exelate, Weborama sont quelques acteurs du domaine de la third party data.

        L’Open data : les données ouvertes et réutilisables

Le manque de nouvelles informations est l’un des inconvénients de nombreux jeux de données. L’Open data est ainsi à considérer ! Avec un coût moindre pour une entreprise et son développement, il est inévitable.

Partager
  • gplus
  • pinterest

A propos de l'auteur

Author Image

Laissez un commentaire