Qu’est-ce que le Fair Data et comment l’intégrer dans mon organisation ?
03 décembre 2021
03 décembre 2021
Le concept de Fair Data est né dans les années 2014 afin d’harmoniser la publication des données scientifiques et faciliter leur accessibilité. En effet, avec le BigData, la digitalisation des connaissances, le volume des données numériques disponibles croit de façon exponentielle et désordonnée. De fait rechercher dans cette masse d’informations ce qui peut être utile, devient de plus en plus difficile. C’est pour remédier à ces difficultés, que le monde de la recherche scientifique a mis en place, avec succès, le concept de Fair Data.
Découvrez dans cet article ce qu’est le Fair Data, ses origines et ses enjeux. Et aussi pourquoi et comment l’intégrer ce mode de gestion des données dans l’entreprise et en obtenir des bénéfices.
Publier, partager des données de recherche ont toujours été des principes de base du travail collaboratif dans le monde scientifique. Le besoin de stocker de façon pérenne des informations dans des formats numériques pour qu’elles soient facilement accessibles et réutilisables, est primordial. De plus de nombreuses études ont démontré que 80% des données scientifiques sont perdues ou devenues inaccessibles, 20 ans après avoir été publiées.
Il est donc nécessaire d’agir de façon proactive pour que les données soient conservées selon des principes qui garantissent dans le temps leur accessibilité et leur lisibilité.
A l’initiative de Force 11, communauté scientifique internationale, les principes du Fair Data ont été posés dès 2014. L’objectif du Fair Data est de publier et partager des données scientifiques qui puissent être directement réutilisables par les machines et les hommes sans nécessité de traitements préparatoires. Les données publiées doivent suivre quatre principes :
Chaque donnée doit être identifiable de façon unique, décrite avec des métadonnées, des mots-clés et accessible par des moteurs de recherche.
Les données sont accessibles mais pas nécessairement libre d’accès, un identifiant peut être nécessaire et obligatoire pour les consulter et les télécharger.
Les données et leurs métadonnées respectent les standards et les formats internationaux en vigueur afin que tous Système d’Information puisse les lire et les comprendre.
Les données sont réutilisables en état soit de façon libre soit sous licence pour toute autre utilisation et que leur origine soit connue et vérifiable. des données Fair Data seront toujours techniquement lisibles et utilisables. On parle dès lors de FAIRisation des données scientifiques.
Source : DoRANum. Données de la recherche : apprentissage numérique. France : DoRANum; 2019. Les principes FAIR : https://doranum.fr/enjeux-benefices/principes-fair/
Il est important de préciser que le Fair Data n’est pas l’Open Data. L’Open Data sont des données libres d’accès et utilisables par tous pour n’importe quel objet. Le Fair Data sont des règles de mise en forme et d’accessibilité technique. Des données respectant les principes Fair Data ne sont pas nécessairement des données Open Data. Des données Fair Data peuvent être confidentielles.
Les avantages que procurent le Fair Data pour rendre toutes les données plus facilement accessibles et réutilisables par les machines et par l’homme sont clairement établis. Est-il possible de faire de même dans une entreprise ? Et d’en obtenir des bénéfices.
Une gouvernance de données ou Data Governance devra mettre en œuvre les principes du Fair Data :
Pour atteindre cet objectif de « FAIRisation » de ses données, l’entreprise dispose de méthodes et d’outils :
Le Data Management pour organiser et gérer en place une politique de gestion des données dans l’entreprise. Le MDM permet de préciser des règles de contrôle et de nommage des données dans l’entreprise.
L’entrepôt de données ou Data Warehouse pour stocker les données de l’entreprise et partager avec toutes les applications métiers. L’entrepôt de données est le lieu unique dans lequel toutes les données de l’entreprise sont stockées après avoir été validé et mise en forme.
L’ETL, Extract Transform Load, pour extraire les données des applications de l’entreprise, les nettoyer, les enrichir, les mettre dans un format standard puis les stocker dans l’entrepôt de données pour être analysées.
Dans une économie digitale les données sont la richesse de l’entreprise mais cette richesse n’est tangible que si les données sont exploitables comme le filon d’une mine.
Disposer de données « FAIR », Faciles à trouver, Accessibles, Interopérables, Réutilisables, garantit à l’entreprise que les données stockées seront toujours exploitables. Les principes FAIR s’appliquent à tous les types de données, des données structurées en provenance des logiciels de gestion, de comptabilité, de paie et aussi à tous les formats non structurés : photo, vidéo, publications, contrats que produit une entreprise.
L’entreprise sera en mesure d’en obtenir des bénéfices de trois ordres :
Jusqu’alors les objectifs de la gestion de la donnée en entreprise étaient essentiellement axés sur la qualité de la donnée, sa disponibilité et sa sauvegarde à des fins de sécurité. Avec le Fair Data, de nouveaux objectifs :
Si la gestion de la donnée permet d’optimiser et de sécuriser l’utilisation les données, l’application des principes du Fair Data permet de capitaliser sur les données.
La FAIRisation des données un atout pour que l’entreprise réussisse sa transformation digitale et capitalise sur son patrimoine numérique.
Expert de la gestion de données depuis plus de 30 ans, Tenor propose à ses clients des solutions EAI, des solutions EDI et des solutions de facture électronique. Prenez le temps de faire un tour sur le Blog de Tenor et de parcourir nos articles sur le Data Management.