Partager ses données

Nous avons mis en place un processus pour que les organismes qui gèrent des données de services puissent contribuer à data·inclusion.

Notre contexte

  • Dans le contexte du service public de l’insertion et de l’emploi, un sujet revient de manière prégnante : l’accès à des données fiables sur les dispositifs et l’offre d’insertion au niveau national et sur chaque territoire.

  • Si un grand nombre d’outils existent, les données elles-mêmes circulent mal d’un outil à l’autre et un grand nombre d’acteurs sont contraints de “réinventer la roue” à leur échelle ou de voir leurs bases de données devenir peu à peu obsolètes.

  • data·inclusion est un service numérique créé en avril 2022. Son objectif est de rassembler sous un référentiel commun toutes les données de l'offre d'insertion des territoires afin de permettre à tous les acteurs recensant et mettant en visibilité ces offres d'être interopérables et de mutualiser les efforts de recensement et de mise à jour.

Les avantages du partage et de la consommation de nos données

  • Nous partageons publiquement des jeux de données et leur source. Votre effort de recensement des structures et de l’offre d’insertion est mis en visibilité pour l’ensemble des acteurs publics, services numériques, et structures d’insertion (réseaux nationaux, structures locales, Dora...) (voir la liste des consommateurs réguliers de nos données)

  • Obtenir des données supplémentaires (nationales, régionales, parfois locale) concernant les structures et leur offre de service → aides financières, informations de contacts, modalités d’orientation, horaires… référencées par d’autres producteurs de données

  • Vous éviter de sur-solliciter les structures ou vos collaborateurs pour recenser des informations. Les données d’une structure sont probablement déjà référencées quelque part. Vous pouvez déjà les intégrer dans votre base, et travailler uniquement au recensement des informations manquantes

  • Vous profitez de l’effort de mise à jour d’autres producteurs de données. En consommant les données de data·inclusion, vous obtenez les dernières mises à jour produites par les partenaires pour l’ensemble des structures référencées

Les conditions d’échange des données

  • Vous avez mis vos données au format CSV et elles respectent les schémas de données data·inclusion (documentation, schémas JSON)

  • Vos données seront partagées

  • Les mises à jour de votre base ou de votre fichier doivent être partagées régulièrement (la fréquence de partage est à définir ensemble)

  • Nous collaborons à chaque étape pour intégrer vos données dans le patrimoine commun selon le format data·inclusion

Les étapes d’intégration de vos données

Phase 0 - Nos questions : évaluer votre jeu de données

  • Les données ont-elles un identifiant propre qui ne changera pas ?

  • (si les données correspondent à des services) avez-vous un identifiant pour la structure ? cela permet de regrouper les lignes services par structure.

  • Les données ont-elles une date de mise à jour ?

    • afin d’évaluer les bénéfices à mapper le jeu de données

    • utile pour détecter les changements pertinents à l’avenir

  • Recueillez-vous le numéro SIRET des structures ? Ils sont nécessaires si vous souhaitez que vos données soient éditables dans Dora

Phase 1 - Vos données au format data·inclusion

Selon la quantité de données que vous souhaitez partager et les modalités de partage (envois de fichiers espacés ou bien flux de données automatisé), les modalités de réception de vos données varient. Dans les deux cas, l'objectif est d'aboutir à transformation de vos données pour

  • qu'elles respectent nos schémas de données.

  • que les thématiques, profils et autres valeurs normées soient mises en correspondance avec celles que l'on propose

Si vous disposez d'un fichier tableur (Excel, CSV, OpenDocument) qui n'est pas au format data·inclusion, nous pouvons vous mettre à disposition un outil de saisie en ligne pour y entrer vos données manuellement, en autonomie, et dans un format intégrable facilement à notre base de données. Envoyez-nous un mail à data.inclusion@beta.gouv.fr pour que nous vous transmettions la démarche.

Si vous disposez d'une API, ou de la possibilité de publier automatiquement des exports de base de données, nous aurons besoin d'une documentation exhaustive pour en extraire les données. Dans ce cas, nous acceptons les formats suivants :

  • CSV

  • JSON

  • XML

Phase 2 - Dernières analyses et intégration des données

  1. [data·inclusion] Nous vous partageons les dernières versions des schémas data·inclusion afin de vous permettre de réaliser le mapping des colonnes de votre base de données avec celle de data·inclusion (travail en commun) → cette étape est réalisée si votre fichier ou le schéma data·inclusion a évolué

  2. [data·inclusion] Une fois le mapping réalisé, nous intégrons vos données en production → elles seront disponibles sur notre API et sur data.gouv.fr. Nous conservons votre identifiant pour mentionner la source de vos données dans la base commune

  3. [data·inclusion] Nous vous partageons une analyse croisée de votre base avec celles des autres producteurs de données (lignes communes…).

Phase 3 - Consommation de données

Nous étudions ensemble comment vous permettre de récupérer les données collectées par data·inclusion. En évitant les doublons, en identifiant les données que vous souhaitez consommer, et pour bénéficier de l’effort de mise à jour des producteurs de données partenaires.

Pour consommer les données data·inclusion, il est nécessaire de compléter le formulaire de validation des Conditions Générales d’Utilisation de data·inclusion : https://tally.so/r/mYjJ85

À noter : vos données se retrouveront automatiquement sur les services numériques partenaires de la démarche.

Les liens utiles :

Dernière mise à jour