...
À l'usage, il s'avère que le site https://zbw.eu/beta/skosmos n'est pas en pleine forme et qu'il cesse rapidement de répondre lorsque les requêtes arrivent en rafales... Pour couronner le tout , les liens de téléchargement proposés par l’institution sur la page d'accueil du vocabulaire répondent invariablement "404".
...
C'est dans ces cas là qu'il faut penser à penser à la fameuse "Wayback Machine" d'Internet Archive (https://web.archive.org/) [
Footnote |
---|
Si vous ne connaissez pas ou mal Internet archive, on vous recommande d'écouter la radio . |
]. Coup de chance , le fichier SKOS contenant l'ensemble du vocabulaire JEL de la ZBW a été régulièrement archivé, et la dernière fois, pas plus tard qu'en janvier 2024 !
...
« La confiance n'exclut pas le contrôle » 🤨 » : un petit coup de qSkos, le magnifique utilitaire de Christian Mader, permettra de lever les doutes (on peut aussi jouer avec le fichier sur SkosPlay).
...
Zéro erreur sur les critères de qualité essentiels ! Une performance quperformance qu'on se doit de saluer.
Pour nous, voilà qui offrait une vraie issue : une fois le vocabulaire récupéré, il suffisait de le charger dans un serveur adapté aux données sémantiques (Apache Jena Fuseki) et d'empaqueter le tout dans un container Docker Docker !
Le tout est publié sur Github et le Dockerhub sous le doux nom de "svp-jel-proxy' (les informaticiens sont des poètes... 📜 )
Fancy Bullets | ||
---|---|---|
| ||
|
C'est juste une toute petite surcouche sur les "Docker Tools" d'Apache Jena Fuseki - au passage, dommage qu'on ne puisse pas s'appuyer plutôt sur une image Docker officielle 🤔.
Le vocabulaire JEL du Leibniz-Informationszentrum Wirtschaft sera désormais disponible au sein de notre système "SoVisu+" sous forme d'un microservice, afin d'assister l'intégration des données de Hal au graphe de connaissance institutionnel !
Do it yourself
À ce stade, vous brûlez 🤩 d'impatience de manipuler vous-même ce composant, et on le comprend bien.
...
On prend la mesure au travers de cet exemple du caractère fragile du déploiement des technologies du web sémantique. La pratique est souvent bien loin de la théorie , selon laquelle les données vont s'agréger miraculeusement miraculeusement par la seule vertu des URI et des inférences. Même en utilisant des plateformes nationales , ayant pignon sur rue rue, telles que Hal, les établissements doivent faire eux-même une grande partie du chemin🚶♂️ jusqu'aux "linked data"...
Raison de plus pour travailler en mode mutualisé, sachant qu'il sera toujours plus facile de réaliser la maintenance 🔧 corrective/adaptative sur des composants partagés. Imaginez que demain
- le Leibniz-Informationszentrum Wirtschaft corrige 🔧 les problèmes de son serveur
- ... ou publie une nouvelle version du vocabulaire JEL...
- ... ou que HAL ou une autre institution publie le vocabulaire dans son propre domaine...
- ... ou que HAL remplace les codes par des URI dans les données...
Notre solution n'apparaîtra plus que comme un bricolage 🪛 provisoire qui aura vocation à être modifié ou remplacé !
Le cas des économistes étant traité, c'est le tour des médecins 🩺 : dans un prochain billet, nous essaierons d'exploiter la classification Mesh au sein des données HAL.
...