Comparaison des versions

Légende

  • Ces lignes ont été ajoutées. Ce mot a été ajouté.
  • Ces lignes ont été supprimées. Ce mot a été supprimé.
  • La mise en forme a été modifiée.

L'utilisation par Hal de vocabulaires contrôlés disciplinaires pour l'indexation des publications a tout d'une bonne nouvelle. En effet, l'utilisation des années durant, de mots-clés libres a généré une "dette technique de données" qui rend difficile délicate pour les établissements, par exemple, la caractérisations des profils d'expertise des chercheurs ou des laboratoires.

À titre d'exemplePour rendre le problème plus parlant, voici la liste des variantes de graphies pour quelques mots clés obtenues depuis l'API Hal :

Moyen ÂgeMoyen-ÂgeMoyen âgeMOYEN AGEMoyen ageMoyen ägeMoyen ÄgeMOyen ÂgeMoyen AGeMoyen âgeMoyen ÂgeMOYEN-AGE
Île-de-FranceIle-de-FranceIle-de-franceÎle de FranceIle-de FranceÎle-de-franceIle de franceILE DE FRANCEÏle-de-FranceÎle de franceIle-De-FranceILE-DE-FRANCEÎle-De-FranceÎle-de-France


Partenariat public-privéPartenariat public privéPartenariat Public-PrivéPartenariat public/privéParténariat public-privéPartenariat public-PrivéPartenariat Public PrivéParténariat public-PrivéPartenariat public-privé


Idéalement, pour gérer les informations sur la recherche selon les canons des "FAIR Data", il faudrait disposer pour chaque concept d'un identifiant unique (une URI) se prêtant, si possible, à un "déreférencement" : une opération qui consiste à . Par exemple, pour "Partenariat public-privé", si on dispose d'une URI telle que https://catalogue.bnf.fr/ark:/12148/cb13755654m ou https://www.idref.fr/061611514, on peut obtenir des traductions, des alignements avec des vocabulaires tiers (https://id.loc.gov/authorities/subjects/sh96011049.html), etc.

Exemple : les données indexées avec JEL