Les établissements utilisateurs des données de Hal peuvent se féliciter de la présence de vocabulaires contrôlés disciplinaires tels que JEL, ACM ou MeSH ✨.
Car malheureusement, on revient de loin loin : la saisie, des années durant, de mots-clés libres a généré une "dette technique de données" qui rend délicate, par exemple, la caractérisation des profils d'expertise des chercheurs ou des laboratoires à partir des données Hal [
Footnote |
---|
On n'oubliera pas toutefois de mentionner ici les louables efforts de l'équipe scanR pour pour fournir des versions des métadonnées Hal réalignées sur Idref/Rameau et WikiData WikiData ! |
].
Pour rendre le problème plus parlant, voici la liste des variantes de graphies pour quelques-mots clés, obtenues depuis l'API Hal :
...