Publier mes données pas à pas

La Science Ouverte promeut, pas le biais des principes FAIR, une ouverture des données de la Recherche pour faciliter l’accès à ces dernières et permettre leur réutilisation.

Cette page vous permettra de connaître les grandes étapes pour la publication ou l’extraction de données de Recherche.

Comment extraire et/ou publier 
un jeu de données ?

Publier

La constitution du jeu de données

Cette étape clé doit vous amener à réfléchir aux  données que vous souhaitez publier.

Plusieurs questions doivent se poser à ce moment du processus de publication :

  • Mes données sont-elles assez matures pour être publiées sur un entrepôt ?
  • Quel est le potentiel, la valeur ajoutée, de ces données ?
  • Le jeu de données forme-t-il une entité unique et cohérente ?

Quelques points à suivre pour cette étape

  • Ranger ses données dans des champs spécifiques clairement identifiés dont les types sont définis. Les formater ses données pour éviter une hétérogénéité.
  • Utiliser des référentiels/thésaurus au sein des communautés en question
  • Associer un dictionnaire de données...

Document d'aide au choix des formats

Vous trouverez dans ce document, également téléchargeable en bas de page, des conseils et des informations sur les formats à privilégier selon les types de données à publier  

Dans le cadre de la Science Ouverte, les formats OpenSource seront privilégiés. Toutefois, dans un souci d’interopérabilité et de pérennité, il pourra être choisi un format fermé si ce format est d’usage pour le type de données à publier.

Vous devrez vous poser la question de l’adéquation entre le type de données et le format choisi. Le document mis à votre disposition vous y aidera.

 


Comment choisir un entrepôt ? Pourquoi celui-ci plutôt qu’un autre ?
La multiplication des solutions peut semer le trouble lors de la publication de vos données.
Plusieurs points sont à soulever :

  • Quel est l’entrepôt privilégié par ma communauté ?
  • L’entrepôt est-il sécurisé et délivre-t-il des identifiants pérennes ?
  • Où sont stockées les données ? (législation différente si stockage à l’étranger)
  • Quel accès aux données et quelles licences sont délivrées ?

Vous pourrez choisir un entrepôt thématique s’il existe ou généraliste. Il sera important, si le jeu de données apparaît sur plusieurs entrepôts, qu’il ne possède qu’un seul DOI.

Vous trouverez des informations sur le choix des entrepôts sur les pages ci-dessous :
Sélectionner un entrepôt thématique de confiance pour la diffusion des données de recherche
CoopIST "Comment choisir un entrepôt"
IRD Data "Choisir son entrepôt"

Des annuaires recensant les entrepôts ou services liés à la donnée existent :
CatOpidor
Re3data


Une fois l’entrepôt choisi, il faudra veiller à ce qu’un identifiant pérenne soit délivré.
Dans le cas d’InDoRES, il s’agira d’un DOI.

Cet identifiant permettra de garder la traçabilité de la donnée mais aussi sa bonne citation.


Le choix d’une licence est indispensable pour la diffusion et la publication de données de Recherche sur un entrepôt. Il faut donc clarifier le cadre juridique et s’assurer de choisir une licence en adéquation.

Si vous vous posez des questions sur le droit d’auteur applicable à vos données, ces documents pourront vous aider :

https://doranum.fr/aspects-juridiques-ethiques/droits-auteur/

https://doranum.fr/2019/02/11/donnees-de-la-recherche-et-questions-juridiques/

Par défaut, si les données ne sont pas sous embargo et ne comportent pas d’éléments dits sensibles, on choisira une licence ouverte type Etalab ou Creative Commons, qui sont les recommandations faites dans le Plan National pour la Science Ouverte.

Vous pouvez utiliser l’outil interactif de Doranum qui vous aiguillera dans vos choix.


Vous indiquerez lors de la complétion de la fiche de métadonnées quelles sont les contraintes éventuelles d’accès. En vous référant au cadre juridique précédemment cité, vous pourrez ainsi définir si le jeu de données est ouvert et téléchargeable par tous les visiteurs, s’il faut avoir un compte…

L’entrepôt dans lequel vous déposerez pourra définir ses propres contraintes.


Il est indispensable que les métadonnées soient bien renseignées lors du dépôt et de la publication des données dans l’entrepôt. En effet, elles permettront de contextualiser la donnée en vue de sa réutilisation. N’hésitez pas à documenter au maximum, notamment via des liens vers des ressources associées (protocole utilisé, documentation utile, Plan de Gestion de Données associé).

L’utilisation de mots-clés précis, voire de thésaurus, est indispensable.

Vous trouverez dans ce document un récapitulatif des étapes et des questions à se poser pour publier une donnée selon les principes de la Science Ouverte.


Extraire

Rechercher dans un entrepôt

La recherche dans data.InDoRES se fait sur l’ensemble des Dataverse, sous-Dataverse, métadonnées et fichiers associés.
Il est important de bien cibler sa recherche par l’utilisation de mots-clés précis.
Vous pouvez également faire une recherche avancée sur un champ en particulier.
La recherche par facettes (colonne de gauche sur data.InDoRES) est également possible


Les métadonnées contenues dans les fiches vous permettront d’obtenir des informations sur les jeux de données et ainsi vous guider vers les jeux qui vous seront les plus utiles.
Vous pouvez utiliser l’icône de contact en haut de chaque fiche pour échanger avec le propriétaire de la donnée si vous souhaitez des informations complémentaires.


En haut de la page du jeu de données que vous souhaitez télécharger, vous trouverez la citation correspondant au DOI telle que vous devrez la faire apparaître pour toute réutilisation.
Vous pourrez exporter cette citation sous plusieurs formats.


Vous pourrez, selon les contraintes apposées au jeu de données, télécharger ou explorer les fichiers associés, demander un accès au propriétaire.
Nous vous recommandons de télécharger les métadonnées associées au jeu de données.


Vous devrez vérifier les contraintes d’utilisation, la licence et dans le guestbook les éventuelles recommandations liées au jeu de données que vous souhaitez télécharger.

Vous trouverez dans la documentation ci-après les réponses à toutes les questions que vous pouvez vous poser sur la réutilisation des données : Doranum