Le 27 juin 2018 à l’auditorium du Muséum national d’histoire naturelle à Paris, s’est déroulée une journée d’étude sur le web sémantique.
Un chercheur (du Centre for Mathematics and Computer Science à Amsterdam), des professionnels de l’information, de la BnF, de l’ABES, etc. ont présenté un panorama passionnant de ce que pourra être le web de demain : un web « pénétrant » qui comprend le sens des mots, les met en relation par des liens intelligents et permet de capitaliser les connaissances ainsi reliées. On aboutit ainsi à un gigantesque graphe complexe représentant toutes les données mises en relation, où chacune des branches est constituée sur la base d’une matrice (sujet, predicat, objet).
Cette matrice permet de relier les données de corpus de plus en plus vastes à condition qu’ils aient été correctement décrits. Cela suppose, en amont, que des référentiels, si possible communs, ou au moins « alignés » (mis en correspondance) aient été utilisés.
On nous a montré comment, à Lille, on prépare les données numérisées de façon à ce que, dans un futur proche, elles soient visibles et accessibles par tout internaute. Insistance en proclamant qu’« il faut libérer les données, c’est-à-dire les exposer ! ».
Puis présentation d’exemples sur les recherches des internautes du « web des données ». Ils découvrent une photo d’un certain Zidane, à peine légendée. Toutes les ressources contenues dans le web sémantique étant univoques, grâce à des URI (Uniform Resource Identifier) uniques qui les désignent sans ambiguïté, une série de relations entre URI identiques permet, par contamination, un enrichissement progressif de la connaissance : en lien avec l’encyclopédie DBpedia (wikipedia écrit en RDF) ou avec le site geonames, on arrive au bout du compte à des résultats de recherche nous disant tout ou presque tout du joueur de football et, par contamination sémantique, on localise sa ville natale, on apprend la recette de la vraie bouillabaisse… C’est l’histoire de la chanson « trois p’tits chats / Chapeau d’paille ».
Bien entendu, nous en sommes aux balbutiements de cette technologie qui constitue également un changement complet de paradigme. Pour cela, des travaux sur « l’alignement des référentiels » doivent se poursuivre. La BnF est bien engagée dans des projets européens, dont VIAF (Fichier d’autorité international virtuel conçu comme guichet unique sur le web pour les notices de référence sur les personnes, les collectivités, les lieux). Des outils d’interrogation doivent être conçus qui, nécessairement, seront à la hauteur de la complexité des questions permises.