Ce site est visible uniquement en mode paysage, veuillez tenir votre iPad à l'horizontal.
background

Partenaire à forte valeur humaine ajoutée


Fermer

La culture de la Data, depuis la BI traditionnelle jusqu’au Big Data

La Data, aussi bien pour la BI que pour le Big Data, est le cœur de métier de JEMS datafactory, filiale de JEMS group. JEMS datafactory a la culture du projet et a développé ses propres méthodes au fil du temps. Ses interventions sur des projets autour de la data couvrent toute la chaîne de valeur. JEMS datafactory intervient à toutes les étapes d’un projet de BI : de la conception à l’accompagnement au changement, en passant par la réalisation et la mise en production.

Selon les besoins, JEMS datafactory est capable de contribuer ponctuellement en support de la direction informatique ou de prendre en charge la totalité du projet. JEMS datafactory adresse également les besoins des métiers en leur proposant  des solutions de « self-services Big Data». 

Les données internes ou externes de l’entreprises sont stockées dans des Datalake afin de permettre aux différents utilisateurs d’y accéder facilement. La mise en place de Datalake permet de couvrir des nouveaux besoins pour les utilisateurs et les directions métier :

Récupération de nouveaux types de données

Données produites en temps réel par des capteurs, sources externes, données non structurées (réseaux sociaux par exemple)

Stockage d’un historique plus important, plus détaillé et plus rapidement accessible

Les données sont placées sur une architecture “scalable” (Hadoop ou noSQL) : le volume des données n’est plus une contrainte, et celles-ci peuvent donc toujours être accessibles. 

Temps réel et streaming sur la donnée

Les temps de traitement peuvent être divisés par 10, voire par 100. On peut également recourir à des techniques de streaming de la donnée. Par exemple, sur Twitter, une collecte des tweets sous forme de “river” va permettre la création d’un flux d’informations en temps réel. 

La modélisation à la demande

Avec le Big Data, les modèles relationnels de rangement des données ne sont plus adaptés. On s’oriente vers des modèles beaucoup plus souples, évoluant en fonction des besoins de l’utilisateur que l’on regroupe dans des « Datalake ».  

La méthodologie EC2A : Enhancement Capability for Advanced Analytics

L’objectif du Datalake est de pouvoir manipuler de très gros volumes d’informations, de croiser les données provenant de différentes sources internes ou externes à l’entreprise et donc de favoriser l’agilité.  

Afin de répondre à ces objectifs, JEMS group a développé une méthodologie de construction de Datalake reposant sur les principes suivants :

Modélisation dans le datalake

Dans le cas des bases de données traditionnelles, on définissait une structure (des tables composées de colonnes), et on essayait de faire rentrer les

données dans cette structure. Aujourd’hui, la démarche est inversée : on part des valeurs et on se pose la question de savoir quelle clef on leur associe. 

Meta Data Enhancement (enrichissement des données) et sémantique.

Ce deuxième élément de la méthode EC2A consiste à réduire la distance entre les données référentielles et les données de base, en enrichissant le plus possible dès le premier niveau par un système de métadonnées. 

La combinaison de ces deux éléments méthodologiques contribue à créer une méthode de gouvernance de données originale intitulée EC2A, adaptée spécialement au Big Data :

  • Enhance Data : enrichir les données de détail en stockant les données référentielles au plus près des données de détail
  • Cross Data : croiser les données pour faciliter les corrélations et les analyses
  • Access Data : accéder facilement aux données en proposant des outils de recherche basés sur la sémantique
  • Analyse Data : analyser les données pour tirer de la valeur des informations récupérées (data visualisation, datamining, prédiction) 


Les partis pris de JEMS datafactory en matière de Big Data

Pour bien aborder le Big Data il est important de ne pas oublier les acquis de la Business Intelligence. S’il ne faut donc pas repartir de zéro, il est toutefois nécessaire de remettre en cause les choix faits dans les approches BI antérieures. Tous les choix en BI ont été faits à partir de bases de données relationnelles. Dans le cas du Big Data, ces bases de données relationnelles font place à un système de gestion de fichiers entièrement nouveau.

En ce qui concerne le Big Data, les données structurées sont mélangées à d’autres non structurées. Le travail initial effectué par JEMS datafactory va justement consister à restructurer ces données non structurées, pour pouvoir les exploiter. Il s’agit d’un travail de « dénormalisation » radicale des données.   

Tous ces partis pris et ces explications sont décrits dans un livre blanc /livre noir. 

Self Service Big Data

JEMS datafactory a aussi travaillé sur la Self Service Big Data ces trois dernières années, avec pour objectif de simplifier la chaîne de valeur du Big Data. En effet, le cycle de projet en V est trop lourd, et cela ne convient pas pour les métiers. De nouvelles technologies sont apparues et ont apporté de nouvelles perspectives. Ces technologies permettent de travailler les données in memory, ce qui apporte de la souplesse et donne de la latitude aux métiers, permettant de travailler par prototypage. Cela permet de concevoir un tableau de bord avec un client très rapidement et de l’alimenter facilement. On renverse ainsi le rapport avec l’utilisateur, qui devient ainsi un utilisateur-acteur.  

Cette méthode est applicable aussi bien à la BI qu’au Big Data.

JEMS datafactory : 1er importateur français de bonnes pratiques en Big Data 

JEMS datafactory forme et accompagne ses collaborateurs aux technologies et à ses propres méthodes. Celles-ci ont été éprouvées sur le terrain depuis plus de dix ans. En effet, JEMS datafactory investit le sujet du Big Data depuis 2012, en collaboration avec ses partenaires éditeurs établis aux Etats-Unis (tels que MapR et Talend). Cette collaboration sur différents projets avec des entreprises qui ont deux à trois années d’avance sur ce marché permet à JEMS datafactory d’avoir une maturité certaine dans un secteur en plein développement. 

Découvrez les projets associés