Présentation générale
La construction du graphe de connaissance institutionnel nécessite l'acquisition et la mise à jour du référentiel de personnes de l'établissement, au moins pour la partie comprenant la population des chercheurs et personnels d'appui à la recherche
Pour la démarche générale d'import des référentiels établissements, qu'il s'agisse des structures ou des personnes, veuillez vous référer à la page Import des données structures
Périmètre de la population à importer
Il n'y a malheureusement pas de critère simple pour délimiter la population pertinente pour le graphe de connaissance institutionnel.
- Les chercheurs et enseignants-chercheurs en font nécessairement partie
- Les enseignants peuvent y être inclus si le graphe a vocation à devenir un graphe enseignement/recherche
- Les personnels d'appui à la recherche en font également partie mais leur identification peut-être délicate (certains personnels de laboratoires ayant une mission purement administrative alors qu'à l'inverse, dans certains établissements, on trouve des personnels d'appui à la recherche au sein des services centraux)
- Outre leurs membres "statutaires" ou "titulaires", certains laboratoires reconnaissent une variété de membres non titulaires tels que les "membres associés", les "anciens membres" ou "membres émérites", des "membres invités", "honoraires", des "correspondants", etc. Il revient à chaque établissement de définir le périmètre des membres qu'il reconnaît et souhaite inclure dans son périmètre scientifique, sachant que le graphe de connaissance institutionnel sera capable de discriminer ces différents modes d'appartenance.
Relations personnes organisations
Il faut distinguer la relation que les personnes entretiennent avec les institutions de celles qu'ils entretiennent avec les structures (voir Import des données structures pour ces notions).
Relation personne-institution
Une personne est généralement rattachée à une et une seule institution par une relation d'emploi (en anglais, employment). Cette relation d'emploi est caractérisée par une "position" : par exemple, "Maître de conférence". En France, où les personnels de la recherche des établissements ESR sont généralement des agents publics, les positions renvoient en général à un système de corps administratifs, mais certains postes, notamment de contractuels, sont caractérisés de façon plus souple.
La position ne doit pas être confondue avec la nature juridique de la relation d'emploi : ainsi, un "ingénieur d'étude" (position) peut être, du point de vue de son statut juridique, un agent contractuel (CDD ou CDI) ou un agent titulaire (fonctionnaire).
Cet aspect juridique est une notion purement RH qui n'est pas à renseigner dans les données en entrée et n'est pas prise en compte par le graphe de connaissance institutionnel.
Pour les positions, le fichier CSV utilise la codification HCERES
La notion d'emploi renvoie précisément à Employment dans Cerif 2 et celle de position à Position.
Relation personne-structure(s)
Une personne peut-être rattaché à une ou plusieurs structures de recherche : c'est l'appartenance (en anglais membership). Dans certains établissements et laboratoires, la notion d'appartenance est générique. D'autres distinguent des modes d'appartenance. À côté des membres "titulaires" ou "statutaires" existent alors des formes d’appartenances pouvant être qualifiées de secondaires ou provisoires : "membres associés", les "anciens membres" ou "membres émérites", des "membres invités"... Pour cette raison, les appartenances peuvent, à l'instar des emplois, être caractérisées (de manière optionnelle) par des modes d'appartenance.
Noms de personnes
Noms de personnes
Même si le format Cerif 2 permet de gérer la variabilité de l'état civil des personnes ou l'existence de multiples graphies pour les noms (ex. latin/cyrillique), aucune source de données de l'ESR français ne prend actuellement en charge cette complexité.
C'est pourquoi elle n'est pas proposée dans le format du fichier d'import.
Spécifications du fichier d'import des personnes
Comme pour les structures, les institutions qui ne peuvent pas charger le graphe de connaissance depuis un annuaire ou une plateforme référentiel peuvent fournir un fichier 'people.csv' conforme aux spécifications ci-dessous (encodage UTF-8, séparateur virgule).
On notera que pour la partie finale des identifiants d'auteurs, le format de fichier est identique à celui demandé par l'ABES pour les opérations d'alignement de masse.
mmb_
Nom du champ | Description | Valeurs licites | Exemple | Champ obligatoire | Commentaires |
---|---|---|---|---|---|
first_names | Prénom(s) du chercheur/de la chercheuse séparés par des espaces | Tous caractères présents dans les prénoms, y compris accents, guillemets et caractères non latins. Séparateur : espace standard. Longueur maximale 255 | Henri Paul | oui | Les prénoms accolés par des espaces sont considérés comme des prénoms successifs |
last_name | Nom du chercheur | Tous caractères présents dans les noms, y compris accents, guillemets et caractères non latins . Longueur maximale 255 | Dupond | oui | Que la chaîne comporte ou nom des espaces, elle est considérée comme un nom unique. |
tracking_id | Identifiant unique du chercheur au sein de la plateforme source | Valeur alphanumérique unique au sein de l'établissement Les caractères "-", "_", ":" sont autorisés. Longueur maximale 10. | hpdupont | oui | Il peut s'agir du login ldap. |
contact_email | Email de contact du chercheur. Les applications CRISalid enverront leurs notification à cette adresse. | Adresse email valide, personnelle ou professionnelle | Si l'établissement tolère les adresses email non professionnelles, ce champs peut accueillir une adresse autre que celle fournie par l'établissement. Mon on a aussi le cas où le chercheur dispose de deux mails professionnels et n'utilise pas le même pour communiquer et pour s'authentifier. | ||
auth_email | Email d'authentification du chercheur. Utilisée lors de l'authentification Edugain. | Adresse email professionnelle valide | Si l’identifiant eppn (ci-dessous) n'est pas renseigné, il sera en priorité utilisé pour l'authentification Edugain. | ||
Emploi | |||||
institution_identifier | Code UAI de l'institution du chercheur | 1234567X | oui | ||
position | Position, généralement le corps d'appartenance | Tous les codes de la nomenclature HCERES . Si besoin d'autres valeurs, signaler. | MCF | non | |
employment_start_date | Date d'arrivée en poste (avec la position indiquée) | Dates Iso8601 passées | YYYY-MM-DD | non | Date d'arrivée dans la position actuelle et non dans l'établissement. Par exemple, si un chargé de recherche CNRS est devenu directeur de recherche, renseigner la date |
employment_departure_date | Date de départ du poste | Dates Iso8601 passées | YYYY-MM-DD | non | Si renseignée, le chercheur est considéré comme ancien chercheur de l'institution |
hdr | Habilitation à diriger des recherches | oui / non | oui | non | Si manquante, "non" par défaut |
Appartenances | |||||
main_research_structure | Identifiant du laboratoire de référence du chercheur au sein de l'institution | Un identifiant présent comme tracking_id du fichier structures.csv | U01 | non | Il s'agit généralement du laboratoire dont le chercheur est membre "statutaire". |
membership_start_date | Date d'arrivée du chercheur dans le laboratoire | DD-MM-YYYY | non | ||
membership_end_date | Date de départ du chercheur du laboratoire | DD-MM-YYYY | non | ||
membership_type | Statut du chercheur au sein du laboratoire |
| stat_mmb | non | Si non renseigné, le chercheur est considéré comme membre "titulaire" ou statutaire" (stat_mmb). |
Identifiants | |||||
eppn | eduPersonPrincipalName de Supann | Cf spécification Supann | jdupont@univ-exemple.fr | non | Le login suivi du nom de domaine de l'établissement. À ne pas confondre avec l'adresse email professionnelle. Nécessaire pour l'authentification Il est fortement recommandé de renseigner ce champ qui conditionne la possibilité de s'authentifier sur le CAS-SSO de l'établissement ou via la fédération Edugain. À défaut, l'authentification utilisera l'email professionnel (auth_email) Il est en théorie possible de renseigner l'eppn de personnes d'autres établissements, mais cette donnée n'est généralement pas connue des cotutelles. |
idhal_s | Identifiant Hal alphanumérique | Identifiants Hal alphanumérique valides | henry-dupond | non | |
idhal_i | Identifiant Hal numérique | Identifiants Hal numérique valides | 252 | non | Ne pas confondre avec les formes auteurs. Préférer, dans le cas général, l'idHal_s |
orcid | Identifiant ORCID | Identifiant ORCID valides | 0000-0000-0000-0000 | non | Un identifiant ORCID fourni de cette façon sera utilisé pour moissonner les publications mais ne pourra être utilisé pour s'authentifier sur les applications CRISalid tant que le chercheur ne l'aura pas revendiqué avec succès par une authentification ORCID. |
idref | Identifiant idref | Identifiant Idref valides (cf www.idref.fr). Ce sont des chaînes de caractères et non des valeurs numériques (présence d'un zéro à gauche) | 028167392 | non | Conserver le zéro à gauche Attention ! Si la cellule de tableur est formatée comme une valeur numérique, le premier zéro à gauche sera perdu. |
scopus_eid | Identifiant Scopus | Identifiant Scopus valides | 46854213 | non | Cf documentation commerciale https://www.elsevier.com/products/scopus/author-profiles |
researcher_id | Identifiant WOS (non utilisé dans la version actuelle) | B-9809-2012 | non |