Comparaison des versions

Légende

  • Ces lignes ont été ajoutées. Ce mot a été ajouté.
  • Ces lignes ont été supprimées. Ce mot a été supprimé.
  • La mise en forme a été modifiée.

...

L'utilisation par Hal de vocabulaires contrôlés disciplinaires pour l'indexation des publications a tout d'une bonne nouvelle tels que JEL, ACM ou MeSH est précieuse pour les établissements utilisateurs de données ✨.

En effet, la saisie, l'utilisation des années durant, de mots-clés libres a généré une "dette technique de données" qui rend délicate pour les établissements, par exemple, la caractérisations caractérisation des profils d'expertise des chercheurs ou des laboratoires.

Footnote

On n'oubliera pas toutefois de mentionner ici toutefois les louables efforts de l'équipe Scanr pour scanR pour fournir des versions des métadonnées Hal réalignées sur Idref/Rameau et WikiData grinning face  !

Pour rendre le problème plus parlant parlant confused face , voici la liste des variantes de graphies pour quelques-mots clés, obtenues depuis l'API Hal :

...

Partenariat public-privéPartenariat public privéPartenariat Public-PrivéPartenariat public/privéParténariat public-privéPartenariat public-PrivéPartenariat Public PrivéParténariat public-PrivéPartenariat public-privé

Bon, c'est vrai, ces exemples n'ont pas été choisis tout à fait au hasard face with rolling eyes . Ils donnent pourtant une petite idée - a posteriori et a contrario - de l'importance qu'il y a à fournir des mécanismes de suggestion ("autocomplétion" ⌨️ ) basés sur des vocabulaires reconnus. Et pas seulement pour éviter les "variantes" orthographiques 🙈 .

Car idéalementIdéalement, pour gérer les informations sur la recherche selon les canons des "FAIR Data" sports medal , il faudrait non seulement disposer pour chaque concept d'un identifiant unique (une URI) se prêtant, si possible, à un "déréférencement" : une opération qui consiste à naviguer sur le web 🧭 jusqu'à la source de données indiquée par l'URI (qui est aussi une URL, c'est pratique). 

Par exemple, pour "Partenariat public-privé", si on disposait d'une URI telle que https://catalogue.bnf.fr/ark:/12148/cb13755654m ou https://www.idref.fr/061611514, on pourrait obtenir des une foule de bénéfices 🤓 : des traductions, des alignements avec des vocabulaires tiers (https://id.loc.gov/authorities/subjects/sh96011049.html), etc. Public-private sector cooperation), des variantes... Ou tout simplement vérifier qu'on a des données correctes face with monocle .

...


Raison de plus pour vouloir tirer parti au maximum des quelques vocabulaires contrôlés (JEL, MeSH, ACM) utilisés au sein de Hal.

 C utilisés sur Hal ! C'est ce que nous avons voulu faire dans le cadre du projet SoVisu+, du consortium CRISalid.

...

Le vocabulaire JEL est un système de classification des publications en économie maintenant par 📊 qui émane l'American Economic Association (AEA). Le problème est que sur son site web, l'AEA fournit certes le vocabulaire avec ses codes et ses définitions , mais sans les "URI" qui permettraient d'utiliser les concepts parmi d'autres données "sémantiques". Par exemple, le code "A140" représente "Sociology of Economics", mais son unicité est loin d'être garantie, et rien ne permet à un système de découvrir l'information associée à ce "A140". Un vocabulaire "à l'ancienne" 🕰️ en quelque sorte.

...