...
Partenariat public-privé | Partenariat public privé | Partenariat Public-Privé | Partenariat public/privé | Parténariat public-privé | Partenariat public-Privé | Partenariat Public Privé | Parténariat public-Privé | Partenariat public-privé |
Bon, c'est vrai, Même si ces exemples n'ont pas été choisis tout à fait au hasard hasard . Ils , ils donnent pourtant une petite idée, a posteriori et a contrario, de l'importance qu'il y a à fournir des mécanismes de suggestion ("autocomplétion" ) basés sur des vocabulaires reconnus. Et pas seulement pour limiter les "variantes" orthographiques 🙈 .
Car idéalement, pour gérer les informations sur la recherche selon les canons des "FAIR Data" , il faudrait également disposer pour chaque concept d'un identifiant unique (une URI) se prêtant, si possible, à un « déréférencement » : une opération qui consiste à naviguer sur le web jusqu'à la source de données indiquée par l'URI (qui est aussi, souvent, une URL , : c'est pratique 😊 ).
Par exemple, pour "Partenariat public-privé", si on disposait d'une URI telle que https://catalogue.bnf.fr/ark:/12148/cb13755654m ou https://www.idref.fr/061611514, on pourrait obtenir une foule de bénéfices : des traductions, des alignements avec des vocabulaires tiers (Public-private sector cooperation de la Library of congress ), des variantes... Ou tout simplement vérifier qu'on a des données correctes .
...
Prenons le cas du vocabulaire JEL (pour «Journal of Economic Literature»). C'est un système de classification des publications 📊 qui émane l'American Economic Association (AEA) et s'applique aux publications ... dans le domaine de l'économie (on s'en serait un peu doutés 🤷♂️).
Le problème est que sur Sur son site web, l'AEA fournit certes le vocabulaire avec ses codes et ses définitions , mais sans les ne pousse pas la gentillesse jusqu'à proposer les fameuses "URI" qui permettraient d'utiliser les intégrer ces concepts parmi d'autres données "sémantiques" 😞. Par exemple, le code "A140" représente "Sociology of Economics", mais son unicité est loin d'être garantie , et rien ne permet : bien de choses, sur terre, sont susceptibles de s'appeller A140, et par exemple des avions ✈️. En outre, aucun indice ne permettra à un système de découvrir l'information associée à ce "A140". Un vocabulaire "On peut parler de vocabulaire « à l'ancienne " » 🕰️ en quelque sorte, avec des codes qui sont suffisants dans un contexte fermé, mais mais ne font pas sens dans le vaste océan du web .
Et ce sont ces codes que l'on retrouve dans les données issues de HAL...
...
Nos classifications sont bien dans le résultat mais comment les exploiter ?
Nous pourrions bien nous donner la peine de "rabouter" les labels et les identifiants en interrogeant l'API plus JSON de HAL (https://api.archives-ouvertes.fr/search?q=halId_s:hal-02169144&fl=*), à condition de faire confiance à l'ordre des résultats. Mais on est loin de la richesse promise par les vocabulaires contrôlés !
...
- si on est un être humain 👤, à consulter consulter https://zbw.eu/beta/skosmos/jel/en/page/?uri=http://zbw.eu/beta/external_identifiers/jel#G13http%3A%2F%2Fzbw.eu%2Fbeta%2Fexternal_identifiers%2Fjel%23G13
- si on est un robot 🤖 (certains d'entre eux nous lisent), on préférera sans doute https://zbw.eu/beta/skosmos/rest/v1/jel/data?uri=http://zbw.eu/beta/external_identifiers/jel#G13http%3A%2F%2Fzbw.eu%2Fbeta%2Fexternal_identifiers%2Fjel%23G13&format=application/rdf+xmlrdf%2Bxml
Il ne faudrait toutefois pas vendre trop vite la peau de l'ours ours : à l'usage, il s'avère que le site https://zbw.eu/beta/skosmos 🤒 n'est pas en pleine forme et qu'il cesse rapidement de répondre lorsque les requêtes arrivent en rafales ... Et pour couronner le tout , les liens de téléchargement proposés par l’institution sur la page d'accueil du vocabulaire répondent invariablement "404" 😞 .
Sauvés par la machine à remonter le temps
C'est là qu'il fallait penser à la fameuse "Wayback Machine" d'Internet Archive (https://web.archive.org/)
Footnote |
---|
Si vous ne connaissez pas ou mal Internet archive, on vous recommande d'écouter la radio . |
Footnotes Display |
---|