Open data et données publiques

Dans la cadre de la transformation digitale de votre organisation, il pourrait être intéressant pour votre entreprise de récupérer des données publiques publiées sur des sites web ou proposées sous forme Open data en téléchargement ou en accès API. En effet, de nombreuses entreprises s’intéressent à ces informations car les données publiques constituent à leurs yeux une véritable mine d’or pour enrichir une base de connaissance ou optimiser leur business model. Ces entreprises s’efforcent d’exploiter ces données pour améliorer leurs relations client et leurs profits, mais ce n’est pas un axe encore acquis et gagné pour tous. La difficulté majeure rencontrée avec les données publiques est justement la capacité d’y apporter une valeur ajoutée ou de les exploiter à bon escient. Les données publiques sont potentiellement très intéressantes, mais pour chacun, la question se pose: quoi en faire et dans quel but ?

Si les données publiques ne vous dresseront pas le business model de demain, il vous faudra néanmoins être capable d’avoir une vision et d’anticiper les nouveaux axes d’exploitation dans votre secteur. actimeo pourra vous accompagner dans cette démarche.

Open Data

L’Open Data est un phénomène récent et encore en cours d’évolution. Il a commencé dans le monde Anglo-Saxon, avec des initiatives comme data.gov aux Etats-Unis et data.gov.uk en Grande Bretagne, avec l’enjeu de rendre les grandes quantités de données gouvernementales aux citoyens. Depuis le phénomène s’est étendu à la France où depuis 2017 des jeux de données essentiels sont distribués librement (SIREN, LEGI, INPI etc.).

Les acteurs clés des diverses branches (grands groupes, fédérations, organismes d’orientations etc.) aussi bien que les PME en forte croissance recherchent un accès global et structuré aux informations qui concernent leurs activités (annuaire, législation, démarches etc.). Elles fondent donc de grands espoirs dans la politique européenne d’ouverture des données publiques. Un accès à un registre global ciblé sur leur activité leur permettrait de proposer un service d’appel sur le web (portails d’information ou d’orientation) et/ou de consolider leur compétences et gestion de données en interne. Les services marketing ont un besoin croissant de données (notamment en emarketing, CRM/ERP) et les éditeurs de solutions informatiques recherchent un accès à des données de qualité et structurées.

Les données Open Data brutes proposées par l‘administration publique ont néanmoins, en l’état, une valeur très limitée. Les jeux de données correspondent aux besoins administratifs des administrations d’origine :

- Les données sont mises à jour à des rythmes différents et la mise à jour ne détaille pas les procédure de validation précises des données de chaque champ (voire les intégrations préalables d‘autres bases).
- Le formatage des données n‘est pas homogènes entre les jeux de données (besoin de normalisation).
- La structure des jeux de données évoluent régulièrement.
- La qualité des données est inégale et difficile à mesurer.
- Le volume de certains fichiers livrés rend leur manipulation très difficile.
- Les jeux de données sont parfois fragmentées dans les diverses administrations locales.
- Les jeux de données se référent à des identifications différentes (par ex. pour les organismes: SIREN, RNA, FINESS…) voire ne proposent aucune identification administrative.

Le traitement des données dite „Open Data“ nécessite donc de lourds investissements afin de les rendre exploitables dans le secteur industriel, de les présenter au public et de les maintenir ensuite. Les résultats ne sont par ailleurs pas toujours au rendez-vous en raison d’une qualité insuffisante des données d’origine.

Données publiques

Sans prendre la forme de jeux de données au sein des programmes gouvernementaux Open Data, de multiples sources de données restent accessibles sur le web, sans limite d'utilisation. Les Data Crawlers de actimeo minent les sites web que nous avons référencés de manière autonome à la recherche de données. Ils examinent les entités, établissent des relations, et permettent de créer des profils d’entités ou des fiches d’informations.

Face à l’augmentation du nombre de données sur Internet, nos programmes parcourent continuellement le web pour dénicher les informations les plus pertinentes. Les programmes sont utilisés, dans le respect des droits de propriété intellectuelle et dans le respects des données personnelles, afin d’extraire des informations publiques disponibles sur le web hors des plateformes de téléchargement Open Data spécialement prévu à cet effet.