Présentation générale
La construction du graphe de connaissance institutionnel nécessite l'acquisition et la mise à jour du référentiel de structures de l'établissement.
Structures et institutions
On appellera ici institutions de recherche (ou institutions) les établissements de l'ESR, qui constituent des entités juridiques et administratives regroupant les structures de recherche et employant les chercheurs.
On appellera structures de recherche les entités opérationnelles où se déroule la recherche. Les structures sont regroupées en 3 niveaux afin de clarifier leur typologie :
- On classe au niveau 1 les entités d'un niveau de granularité plus fin que celui du laboratoire (équipes, thématiques)
- Le niveau 2 est celui des entités apparentées à des laboratoires (UMR, UP, UAR...)
- Enfin, les entités qui englobent plusieurs structures de niveau 2 (structures collaboratives : GIP, GIS etc.) sont regroupées dans le niveau 3
Nous respectons ici la démarche du Répertoire national des structures de recherche (cf. "codes niveau de structure" sur data.gouv.fr) reprise par la suite par le "Cadre de cohérence recherche".
Selon la norme Cerif 2, structures et institutions sont des "organisation units" au sens formel du terme (organisation unit with members).
L'application CRISalid directory bridge a pour rôle de charger les référentiels établissements dans le graphe de connaissance institutionnel. Les établissements qui déploient le graphe de connaissance institutionnel peuvent alimenter CRISalid directory bridge en données de structures de différentes façons :
- Idéalement, l'établissement donne accès à un annuaire LDAP ou à un autre référentiel applicatif dynamique.
Dans le cas où le référentiel est un annuaire LDAP, CRISalid directory bridge pourra être configuré de façon à s'adapter à la version de la norme Supann implémentée dans l'établissement ainsi qu'aux variantes locales qui auront pu lui être apportées.
- Au cas où la première option n'est pas réalisable, l'établissement pourra fournir un fichier CSV respectant les spécifications ci-dessous.
En pratique, le fichier CSV peut être soit généré automatiquement depuis le référentiel établissement, soit construit manuellement avec un logiciel de tableur tel que Microsoft Office Excel ou Libre Office Calc. Dans l'un et l'autre cas, on veillera à utiliser les virgules comme séparateurs et à utiliser l'encodage UTF-8.
Spécification du fichier CSV
Le fichier "structures.csv" à fournir par l'établissement devra comporter les colonnes décrites dans le tableau ci-dessous.
Nom du champ | Description | Valeurs licites | Exemple | Champ obligatoire | Commentaire |
---|---|---|---|---|---|
level | Niveau au sens du RNSR | 1, 2, 3 | 2 | oui | Cf. cartouche ci-dessus |
structure_type | Code de type de structure | Cf. ci-dessous table des codes de structures | UMR | oui | |
tracking_id | Identifiant de la structure dans le référentiel source | Valeur alphanumérique unique au sein de l'établissement Les caractères "-", "_", ":" sont autorisés. Longueur maximale 10. | U42_2 | oui | Cf. SupannCodeEntite |
name | Nom de la structure | Une chaîne de caractères de longueur maximale 255 | Laboratoire de Médiévistique occidentale de Paris | oui | |
institutions | Listes des codes UAI des tutelles séparés par des "|" (structures de niveau 2 seulement) | Tous les codes UAI existants (cf. référentiels nationaux) | 0751717J|0753639Y | oui pour les structures de niveau 2 non accepté pour les autres | |
acronym | Acronyme de la structure, ou, à défaut, nom court | Une chaîne de caractères de longueur maximale 45 | LAMOP | oui | |
description | Description de la structure | Une chaîne de caractères de longueur maximale 1500 | Le LaMOP est un laboratoire etc. | non | |
parent | identifiant (tracking_id) de la structure parente | Pour les structures de niveau 1, laboratoire de rattachement | U42_2 | oui pour les structures de niveau 1 non accepté pour les autres | Une seule structure parente peut-être renseignée, les établissements devant pouvoir être présentés dans des organigrammes arborescents |
nns | Identifiant RNSR (numéro national de structure ou NNS) de la structure | Tous les NNS valides du RNSR | 200412241T | oui pour les structures de niveau 2 optionnel pour les autres | |
ror | Identifiant ROR de la structure | Tous les identifiants valides sur ROR sans le préfixe https://ror.org | 00z0af360 | oui pour les structures de niveau 2 optionnel pour les autres | |
scopus_id | Identifiant SCOPUS de la structure | Identifiant de la structure telle qu'employé dans le champs Afid de l'API Scopus : <afid>60028048</afid> | 60028048 | non | Cet identifiant peut-être utilisé pour construire une URL : https://api.elsevier.com/content/affiliation/affiliation_id/60028048 |
collection_hal | Url de la collection hal de la structure | Une URL correctement formée | non | ||
web | Url du site web de la structure | Une URL correctement formée | non | ||
campus | Champ à venir | non |
Typologie des structures
Pour le champs structure type, utiliser la codification suivante :
Nom | Code | Commentaire |
---|---|---|
Niveau 1 | ||
Équipe | TEAM | Une équipe a généralement des membres |
Thématique | THEME | Une thématique n'a généralement pas de membres |
Niveau 2 | ||
Unité mixte de recherche | UMR | |
Unité d'appui et de recherche | UAR | |
Unité propre de recherche | UPR | |
International research laboratory | IRL | |
Niveau 3 | ||
Structure fédérative de recherche | SFR | |
Groupement de recherche | GDR | |
Groupement d'intérêt scientifique | GIS |