Questions essentielles
Cette page apporte des compléments d’information aux questions essentielles (marquées par un astérisque *
) du portail DMP.
Ces questions sont importantes, car elles vont permettre de définir le cycle de vie des données des projets de la collaboration et d’établir un document de base indispensable pour permettre une gestion optimale du stockage de la collaboration (à court et à long terme) avec les ressources du CC-IN2P3. Pendant la période d’activité du projet, ce document sera révisé chaque année lors de la demande de ressources pour être modifié ou confirmé en l’état selon les évolutions du projet.
General
Le but de cette section est de recueillir les informations générales concernant le projet pour lequel le DMP sera établi : sujet, domaine, planning. Les acteurs du projet sont à définir, en outre les exigences spécifiques à la discipline scientifique pourront être exposées.
Sujet
- Quel est le sujet principal du projet ?
Le but de cette question est d’exposer en quelques lignes le contexte, le rôle et les missions du projet.
Domaine de recherche
- À quel(s) domaine(s) de recherche ce projet appartient-il ?
Veuillez sélectionner le domaine de recherche de votre projet dans la liste déroulante.
Le bouton vert [+ Domaine] vous permet d’ajouter un domaine supplémentaire par sélection dans cette même liste.
Calendrier du projet
- Quand commence le projet ? / Quand se termine le projet ?
Indiquez la date de début et la date (ou une prévision) de fin du projet.
Important
Avant le debut du projet, une première réunion entre les responsables du projet et les agents du CC-IN2P3 concernés devrait être fixée pour discuter le cycle de vie des données du projet.
Coordination du projet
- Quelles personnes ou institutions sont responsables de la coordination du projet ?
Veuillez renseigner les noms des entités coordinatrices du projet.
Le bouton vert [+ Entrée] vous permet de dédier une ligne à chaque nouvelle personne ou institution impliquée.
Partenaire du projet
Cette page permet de définir, si nécessaire, les différents partenaires du projet. Une fois qu’un partenaire est ajouté avec le bouton [+ Partenaire du projet], il est essentiel de répondre à la question suivante:
- Qui est/sont la(les) personne(s) de contact pour les questions de gestion des données ?
Veuillez renseigner les contacts des personnes responsables de la gestion des données du projet. Cette personne sera le référent, dans le périmètre de son partenariat, pour les données que son projet stockera au CCIN2P3 pour :
droits d’accès ;
transfert de propriété ;
départ de collaborateurs ;
demande d’espace de stockage ;
changement d’établissement ;
demande de révision de la politique de gestion des données.
Le bouton vert [+ Entrée] vous permet de dédier une ligne à chaque contact.
Note
Si les partenaires ne sont pas définis, le rôle de référent reste aux coordinateurs du projet.
Classification du contenu
Le but de cette section est de décrire de façon concise les jeux de données collectées ou générées par la collaboration. Une entrée devra être prévue pour chaque jeu de données. Le bouton [+ jeu de données] vous permettra d’ouvrir un nouvel onglet pour chaque nouveau jeu de données.
Il sera possible de décrire les caractéristiques de chaque jeu de données : nature, discipline, volumétrie, méthode de collecte et/ou de création et la gestion du flux de données.
Vous pourrez mentionner aussi toutes les données (même les données déjà existantes) qui seront (ré)utilisées par d’autres projets et définir leur niveau de reproductibilité.
Attention
Pour que le DMP soit validé, veuillez répondre à chacune des questions de cette section pour chaque jeu de données.
Jeux de données
- De quel type de jeu de données s’agit-il ?
Veuillez décrire brièvement le type de données et/ou la méthode utilisée pour créer ou collecter les données.
Pour chaque type de données, précisez la nature (données brutes, réduites…), méthode de collecte/création, la discipline…
Le but est de définir le cycle de vie de toutes les données du projet selon l’utilisation qui en sera faite (immédiate et future) afin de mettre en oeuvre les services adaptés et de les préparer pour une préservation sur le long terme si nécessaire.
Classification technique
Le but de la section est de décrire brièvement le mode de collecte des jeux de données (définis dans la Classification du contenu et disponibles sur les onglets) et son planning, une estimation des volumes associés à celles-ci et celle que vous allez produire.
Les descriptions devraient inclure le type et le contenu de chaque jeu de données ainsi que la gestion du flux de données. Les outils utilisés pour exploiter les données ainsi que ceux envisagés en cas de versionnage devraient être renseignés aussi.
Attention
Pour que le DMP soit validé, veuillez répondre à chacune des questions de cette section pour chaque jeu de données.
Collecte de données
- Quand commence / prend fin la collecte ou la création de données ?
Date à laquelle le projet commence à récupérer les données et date à laquelle il n’y aura plus de nouvelles données produites. Ceci en vue de préparer les services qui vont permettre le stockage et l’accès à ces données.
La date de fin peut devenir le point de départ de nouvelles opérations du côté des données (migration, archivage des données) ou des traitements.
Le profil des données précédemment décrit sera pris en compte pour définir les services appropriés.
- Quand l’analyse des données commence-t-elle / prend-elle fin ?
Dates auxquelles le traitement des données est prévu démarrer et terminer.
Cette période implique une nouvelle étape dans le cycle de vie des données à partir de laquelle de nouveaux services de stockage peuvent être impliqués.
Volume des données
- Quelle est la taille actuelle ou attendue du jeu de données ?
Pour chaque jeu de données, à partir des choix proposées, donnez une évaluation du volume total associé pendant toute la durée de vie du projet.
Cette information permettra aux gestionnaires des ressources du CC-IN2P3 de planifier les achats pour mettre à la disposition du projet le stockage nécessaire.
- Combien de données sont produites par an ?
La réponse à cette question est nécessaire dans le cas où l’évaluation du volume du jeu de données est à l’échelle des TB ou la dépasse. Cela permettra de prévoir un plan pluriannuel de gestion des ressources de stockage du CC-IN2P3.
Outils
- Quels outils, logiciels, technologies ou processus sont utilisés pour générer ou collecter les données ?
Donnez la liste des outils dont vous avez connaissance et qui seront utilisés pour générer/collecter les données au sein du projet.
Cette information permettra aux équipes concernées du CC-IN2P3 de planifier leur déploiement ou bien de vous proposer un service équivalent.
- Quels logiciels, processus ou technologies sont nécessaires pour utiliser les données ?
Donnez la liste des outils dont vous avez connaissance et qui seront nécessaires pour exploiter les données du projet.
Cette information permettra aux équipes concernées du CC-IN2P3 de planifier leur déploiement ou bien de vous proposer un service équivalent.
- Une documentation sur les logiciels pertinents est-elle nécessaire pour utiliser les données ?
Répondez par Oui ou Non si les logiciels nécessaires à l’exploitation des données auront besoin d’une documentation dédiée (c’est le cas des outils « maison » ou adaptés sur mesure).
Utilisation de données
Le but de cette section est de décrire comment les jeux de données (définis dans la Classification du contenu et disponibles sur différents onglets) seront utilisés et accédés afin de mettre en évidence leur cycle de vie et de prévoir leur organisation au sein des infrastructures de stockage.
Indiquez comment les données seront organisées durant le projet : conventions de nommage des répertoires et des fichiers, contrôle des versions, etc…
Il faudra aussi expliquer la manière dont elles sont contrôlées et documenter la cohérence et la qualité des données recueillies.
Attention
Pour que le DMP soit validé, veuillez répondre à chacune des questions de cette section pour chaque jeu de données.
Scénarios d’utilisation
- À quelle fréquence ce jeu de données sera-t-il utilisé ?
Cette question permet d’identifier les données chaudes (accédées fréquemment) et les données froides (accédées rarement) afin de définir leur destination en terme de système de stockage au CC-IN2P3.
- Dans quelle mesure les ressources d’infrastructure seront-elles nécessaires ?
Définissez à partir des choix proposés si l’exploitation de ce jeu de données nécessitera des ressources d’infrastructure particulières.
Cette information permettra aux équipes concernées du CC-IN2P3 d’évaluer la demande, et de vérifier s’il est possible y répondre favorablement.
Organisation des données
- Où le jeu de données est-il stocké pendant le projet ?
Définissez sur quel(s) site(s) le jeu de données sera stocké. Cette information permettra la planification de la sauvegarde des données.
En effet, si des données précieuses (données brutes) ou importantes (données réduites, données d’analyse) pour le projet seront stockées uniquement au CC-IN2P3, plusieurs copies seront à planifier afin de protéger au mieux leur intégrité.
Stockage et sécurité des données
- Qui est autorisé à accéder au jeu de données ?
Précisez les modalités de partage des données au sein du projet.
En principe, certaines opérations sont réservées au responsable de la collaboration et tous les autres membres ont les mêmes permissions. Certains espaces permettent la modification des contenus aux ayants droit, d’autres ne sont accessibles qu’en lecture seule.
- Comment et à quelle fréquence les sauvegardes des données seront-elles créées ?
Spécifiez les données pour lesquelles des sauvegardes sont nécessaires, les espaces concernés et à quelle fréquence (quotidienne/hebdomadaire/mensuelle).
- Qui est responsable des sauvegardes ?
Veuillez renseigner les noms des personnes en charge des sauvegardes. Elles seront les interlocuteurs privilégiés du CC-IN2P3 en cas de problème, ainsi que pour discuter des modifications aux modalités de sauvegarde définies par la question précédente.
Le bouton vert [+ Entree] vous permet de dédier une ligne à chaque personne impliquée.
Partage et réutilisation des données
- Ce jeu de données sera-t-il publié ou partagé ?
Définissez, à partir des choix proposés, les modalités de partage et publication du jeu de donnés.
Cadre légal et éthique
Afin de partager les données au sein ou hors du projet, les centres de dépôt ont besoin d’une déclaration claire de la part du producteur de données afin de savoir qui en est le propriétaire et quel est le caractère (personnelles, sensibles…) des jeux de données, définis dans la Classification du contenu et disponibles sur différents onglets.
Il est fortement recommandé de déterminer dès le début du projet la manière dont le partage et la dissémination des données seront effectués. Cela peut avoir des conséquences sur les choix technologiques et l’organisation même du traitement des données, particulièrement s’il est distribué sur plusieurs sites.
Attention
Pour que le DMP soit validé, veuillez répondre à chacune des questions de cette section pour chaque jeu de données.
Données personnelles
- Ce jeu de données contient-il des données personnelles ?
Répondez par Oui ou Non si on peut trouver des données à caractère personnel dans le jeu de données.
Cette information est indispensable dans le cadre du RGPD : le traitement des données est encadré par des textes de loi.
Autres données sensibles
- Ce jeu de données contient-il des données sensibles autres que des données personnelles ?
Répondez par Oui ou Non si on peut trouver des données confidentielles à caractère sensible dont il faut particulièrement protéger les accès.
Attention
Si des données sensibles existent (réponse affirmative à la question ci-dessus), il sera nécessaire les décrire en répondant à la question correspondante.
Stockage et conservation à long terme
Le but de cette section est de clarifier le processus de gestion des données à long terme. Toutes les données ne sont pas destinées à être conservées à perpétuité.
C’est pour cela qu’il est important de déterminer la durée de rétention des données. Pour les données à durée de vie limitée, une politique claire de gestion des données concernant leur effacement permet d’utiliser plus efficacement l’espace de stockage disponible et permet de réduire le volume de métadonnées associées.
Cette réduction permet aussi de réduire le temps nécessaire à localiser les données d’intérêt.
Les données numériques ont besoin d’être gérées activement pour qu’elles soient toujours disponibles, utilisables et accessibles sur la durée de préservation souhaitée par le projet.
Sélection
- Quels sont les critères/règles de sélection des données à archiver ?
Définissez les modalités de sélection des données à archiver après la fin du projet. Cette information est importante afin que toutes les données à archiver soient correctement répertoriées par les systèmes de stockage.
- Qui sélectionne les données à archiver ?
Veuillez renseigner les noms des personnes en charge de cette sélection. Elles seront les interlocuteurs privilégiés du CC-IN2P3 en cas de problème ou bien de mise à jour dans la procédure de sélection de ces données.
Le bouton vert [+ Entree] vous permet de dédier une ligne à chaque personne impliquée.
Conservation à long terme
Veuillez fournir une réponse pour chaque jeu de données à chacune des questions de cette page. Les jeux de données doivent avoir été définis dans la Classification du contenu et sont disponibles sur différents onglets.
- Ce jeu de données doit-il être conservé à long terme ?
Répondez par Oui ou Non si le jeu de donnée doit être gardé sur le long terme pour être accédé après la fin du projet.
Certaines données pourraient être réutilisées au sein de la communauté ou en dehors en vue d’être valorisées.
- Quelles sont les raisons pour lesquelles ce jeu de données doit être préservé à long terme ?
Définissez, à partir des choix proposés, les raisons qui vous amènent à conserver ce jeu de données.
- Combien de temps les données seront-elles stockées ?
Évaluez la durée durant laquelle les données doivent être préservées.
- Combien de temps faut-il que les données restent réutilisables ?
Évaluez le temps d’utilisation des données après la fin du projet afin de maintenir les outils pour les lire et les exploiter.
Attention
La durée de stockage et celle de réutilisation n’engagent pas le CC-IN2P3 au-delà des engagements de l’IN2P3.
- Où les données seront-elles stockées ou archivées après la fin du projet ?
Indiquez, à partir des choix proposés, le site et le système dans lequel seront stockées les données après la fin du projet.
- Y aura-t-il une période d’embargo avant la mise à disposition des données ?
Répondez négativement ou renseignez les modalités de rétention des données prévues, afin de réserver leur exclusivité aux membres du projet avant leur partage ou publication.
- D’ici quand les données seront-elles archivées ?
Précisez la date prévisionnelle à partir de laquelle les données devront être archivées. C’est à dire, la date à partir de laquelle elles ne seront plus utilisées directement par le projet.