Comparaison des versions

Légende

  • Ces lignes ont été ajoutées. Ce mot a été ajouté.
  • Ces lignes ont été supprimées. Ce mot a été supprimé.
  • La mise en forme a été modifiée.

...

Partenariat public-privéPartenariat public privéPartenariat Public-PrivéPartenariat public/privéParténariat public-privéPartenariat public-PrivéPartenariat Public PrivéParténariat public-PrivéPartenariat public-privé

Bon, c'est vrai, Même si ces exemples n'ont pas été choisis tout à fait au hasard hasard face with rolling eyes . Ils , ils donnent pourtant une petite idée, a posteriori et a contrario, de l'importance qu'il y a à fournir des mécanismes de suggestion ("autocomplétion" ) basés sur des vocabulaires reconnus. Et pas seulement pour limiter les "variantes" orthographiques 🙈 .

Car idéalement, pour gérer les informations sur la recherche selon les canons des "FAIR Data" sports medal , il faudrait également disposer pour chaque concept d'un identifiant unique (une URI) se prêtant, si possible, à un « déréférencement » : une opération qui consiste à naviguer  woman rowing boat sur le web jusqu'à la source de données indiquée par l'URI (qui est aussi, souvent, une URL , : c'est pratique  😊 ). 

Par exemple, pour "Partenariat public-privé", si on disposait d'une URI telle que https://catalogue.bnf.fr/ark:/12148/cb13755654m ou https://www.idref.fr/061611514, on pourrait obtenir une foule de bénéfices  : des traductions, des alignements avec des vocabulaires tiers (Public-private sector cooperation de la Library of congress flag: United States ), des variantes... Ou tout simplement vérifier qu'on a des données correctes face with monocle .

...

Prenons le cas du vocabulaire JEL (pour «Journal of Economic Literature»). C'est un système de classification des publications 📊 qui émane l'American Economic Association (AEA) et s'applique aux publications ... dans le domaine de l'économie (on s'en serait un peu doutés 🤷‍♂️).

Le problème est que sur Sur son site web, l'AEA fournit certes le vocabulaire avec ses codes et ses définitions , mais sans les ne pousse pas la gentillesse jusqu'à proposer les fameuses "URI" qui permettraient d'utiliser les intégrer ces concepts parmi d'autres données "sémantiques" 😞. Par exemple, le code "A140" représente "Sociology of Economics", mais son unicité est loin d'être garantie , et rien ne permet : bien de choses, sur terre, sont susceptibles de s'appeller A140, et par exemple des avions  ✈️. En outre, aucun indice magnifying glass tilted left ne permettra à un système de découvrir l'information associée à ce "A140". Un vocabulaire "On peut parler de vocabulaire « à l'ancienne " » 🕰️ en quelque sorte, avec des codes qui sont suffisants dans un contexte fermé, mais mais ne font pas sens dans le vaste océan du web water wave .

Et ce sont ces codes que l'on retrouve dans les données issues de HAL...

...

Nos classifications sont bien dans le résultat mais comment les exploiter thinking face  ?

Nous pourrions bien nous donner la peine de "rabouter" hammer and wrench  les labels et les identifiants en interrogeant l'API plus JSON de HAL (https://api.archives-ouvertes.fr/search?q=halId_s:hal-02169144&fl=*), à condition de faire confiance à l'ordre des résultats. Mais on est loin de la richesse money-mouth face  promise par les vocabulaires contrôlés !

...

Il ne faudrait toutefois pas vendre trop vite la peau de l'ours ours bear : à l'usage, il s'avère que le site https://zbw.eu/beta/skosmos 🤒 n'est pas en pleine forme et qu'il cesse rapidement de répondre lorsque les requêtes arrivent en rafales ... Et pour couronner le tout crown , les liens de téléchargement proposés par l’institution sur la page d'accueil du vocabulaire répondent   invariablement "404" 😞 .

Sauvés par la machine à remonter le temps

C'est là qu'il fallait penser light bulb à la fameuse "Wayback Machine" d'Internet Archive (https://web.archive.org/)

Footnote

Si vous ne connaissez pas ou mal Internet archive, on vous recommande d'écouter la radio radio .



Footnotes Display