Article de Tim Berners-Lee, James hendler et Ora Lassile et traduit par Elysabeth Lacombe et jo-PezetQui pouvait mieux parler du destin du Web si ce n'est son propre inventeur Tim Berners-Lee?
Le fondateur du World Wide Web : la « toile d'araignée mondiale », est bien placé pour entrevoir les implications de la naturelle évolution de son système vers une représentation plus humaine et sélective et à la fois plus globale et universelle de l'information humaine. De nouveaux langages sémantiques pour donner du sens aux outils et aux services qu'ils rendent, c'est ce qu'il faut au nouveau Web pour évoluer, et par extension à tous les dispositifs électroménagers et autres appareils de notre quotidien pour qu'ils puissent nous rendre la vie plus facile... Mais ces nouveaux outils intelligents peuvent-ils réellement substituer l'homme? Leur généralisation sera-t-elle synonyme de démocratisation de l'information?
Futur proche?Un téléphone, chef de bande qui commande la chaîne stéréo et autres appareils électroniques présents dans son rayon d'action ; un
agent web, espéce nouvelle de navigateur intelligent, fureteur, trieur, fournisseur d'informations à la fois donc ouvrier spécialiste et décideur, qui organise le planning des rendez-vous à distance en collaboration avec l'
agent de son docteur, de son assureur ou de sa soeur, voilà une situation qui ressemble à celle d'aujourd'hui mais ne l'est pas encore tout à fait... Avant, quelques principes techniques devront être reconsidérés, mis au point dans une optique sémantique et appliqués par les concepteurs et utilisateurs de la
toile.
Dans cet exemple cité dans l'introduction de son article, Tim Berners-Lee présentent des personnes cohabitant au quotidien avec ces outils « intelligents », l'agent internet en particulier, presque comme si ils étaient des collaborateurs vivants. C'est parce que ceux-ci sont capables de gérer des informations dotées de sens et de répondre avec pertinence à des requêtes humaines et personnelles, qu'ils se distinguent de ce qu'ils sont encore aujourd'hui. Effectivement aujourd'hui on peut très bien avoir un aspirateur robot qui nettoie à notre place, un
timer qui fasse démarrer la TV ou la machine à café à l'heure souhaitée mais aucun de ses appareils ne communiqueront ensemble. Par exemple cette dernière ne communiquera pas avec la TV pour lui signaler qu'elle peut s'allumer parce que c'est ce que je fais lorsque j'ai pris mon café, ou bien encore ma chaîne stéréo ne s'allumera pas au son de ma voix... Qui ne rêve pas un peu d'être encore plus paresseux! Bref, que ce soit pour un apport de confort, de sécurité ou de connaissances on peut imaginer d'ores et déjà ces scénarios se réaliser.
Du sens pour de la pertinenceMais, comment ces outils deviendront-ils encore plus intelligents? Grâce à la sémantique. Ce mot qui appartenait encore presque exclusivement à la linguistique se répand, s'infiltre jusque dans le processus de la technologie informatique. Beaucoup de progrès d'ailleurs ont été faits dans le domaine du traitement automatique du langage naturel, mais nous sommes encore loin de dompter le langage humain en en faisant un calcul, qui, quand bien même pourrait se moduler et se perpétrer au gré d'impulsions binaires, ne saurait réagir comme tel. Il y a Effectivement une marge entre aider des utilisateurs dans leur travail linguistique et les substituer. Pour ce qui est de la progéniture de Tim Berners-Lee, le web, cela était prévisible que la
sémantique veuille s'occuper du langage de l'homme, grand représentant de ses pensées, et le porter au coeur des ordinateurs, afin que ces derniers ne se contentent plus de visualiser les pages web mais qu'ils communiquent ensembles.
Nous n'avons pas dit que l'actuel internet et son système Web ne soit pas utile aux personnes et qu'il n'est qu'un simple exécutant, d'ailleurs il produit une quantité incommensurable de données, qui répondent à des requêtes intéressées et précises. Cependant c'est justement la quantité qui empêche la pertinence des résultats. Beaucoup de gens n'utilisent encore que très peu le réseau parce qu'ils sont submergés par l'information et ne savent pas comment utiliser cette masse. L'information qui devait être utile devient stérile, elle suffoque. Et l'homme a besoin de réponses claires et appropriées. Il serait donc logique que le World Wide Web trouve un autre moyen de répondre aux usagers en tissant son propre raisonnement à partir de structures et de règles qui régiraient les informations en les représentant de façon judicieuce et non quantitative.
Technologie et CommunicationL'élaboration d'une méthode sémantique du traitement des informations a déjà commencé mais visiblement elle est confrontée à des dilemmes technologiques encore irrésolus telle que la nécessaire décentralisation du système et la possibilité d'une inter-relation entre les différents systèmes afin de permettre le transfert de données et l'interprétation de règles propres à chacun d'eux. La construction par ce nouveau Web d'une sorte de langage universel créateur et utilisateur des données et des règles relatives à la production et au fonctionnement de celles-ci n'est pas utopique mais comme le cite l'auteur, relève bien du défi. L'aspect « relationnel » du système prérequis à la réussite d'un web signifiant, nous fait penser à la difficulté exposée plus haut de faire fonctionner une machine comme un homme, et si on considère que chaque pensée est exponentielle et plurilatérale parce qu'elle fait naître autant de possibilités de choix et de non-choix (doutes, rétractation, changement de direction...) chacune d'elle pouvant être à l'origine d'une communication, alors on se rend compte des difficultés que rencontreront les technologies qui veulent représenter l'information humaine. Il faut déjà baliser les cheminements ...
Techniquement parlant, l'auteur explicite les deux principales technologies du web sémantique le XML (eXtensible Markup Language) et le RDF (Ressource Description framework) qui portent en elles le principe de l'inter-relation interprétable, leurs balises créant des annotations et codant les données respectivement identifiables par d'autres programmes. Avec le principe d'identifiant (URI Identifiant de Ressource Universelle), que chacun pourrait créer en les insérant grâce aux balises XML sur ses pages propres web, on rendrait le
sens des informations spécifique, modifiable et transférable. C'est pourquoi les ordinateurs, ayant à faire à des identifiants distincts pour chaque concept pourraient comprendre les données.
Si on considère que chaque terme du langage humain pour désigner les choses porte un sens propre, et qui plus est, peut changer suivant sa position dans la phrase (syntaxe) ou du contexte, alors on comprend la complexité de la catégorisation et de l'encodage des termes, classes (sous-classes...), destinés à déterminer la relation et les propriétés qui existent entre elles, ce, afin de les rendre interprétables et pertinentes. Catégoriser un terme par rapport à un autre (comme par exemple un verbe dans une phrase parce qu'il est placé à côté d'un substantif sujet et avant un COD) pour lui donner une identité signifiante et utilisable, c'est prendre une décision. Cette décision, que l'on appelle règle d'inférence reste issue d'un calcul et non d'une réflexion humaine spontanée, et peut influer sur tout le reste de la chaîne d'interprétation informatique. C'est pourquoi le web sémantique ne pourra pas remplacer la
raison humaine, il ne pourra que représenter la
connaissance. Par contre, grâce à ces marquages (les règles d'inférences, les pages d'ontologies ...) et à des programmes qui auront évolués dans ce sens, les utilisateurs pourront obtenir des informations signifiantes, ce, extrêmement rapidement.
C'est ici que l'on voit l'intérêt des programmes tels que les
agents dont il est question au début de l'article de Tim Berners-Lee, qui pourront ainsi échanger leurs résultats et même les potentialiser, la synergie enfin obtenue grâce à la participation de toutes les informations signifiantes de tous les types de programmes contribuant au traitement et à la représentation des données.
Un bénéfice humainLe système sémantique inter-relationnel pourraient faire progresser les dispositifs du monde physique tels que les télévisions, les chaînes hifi, les machines à café ou même les voitures qui réagiraient les uns en fonction des autres parce-qu'ils auraient une « raison » programmée de le faire. Cependant je ne vois ici qu'un accroissement du confort, qui pourrait certes faire économiser du temps en aidant les particuliers dans leurs tâches quotidiennes, mais ne serait qu'un bénéfice matériel. Car même si le temps est un critère aujourd'hui important, il en est un autre tout aussi prioritaire : l'accès à la connaissance. L'aide à la décision par l'accès pertinent aux informations fait gagner du temps en même temps qu'elle fait évoluer. Ce qui signifie qu'il est plus important de développer les systèmes du traitement de l'information pour l'obtention de l'information que pour l'obtention d'actions faites par des automates.
Le web sémantique comme l'appelle l'auteur (terminologie déjà usée tant elle est employée), tel qu'il est aujourd'hui porte en lui les germes d'un futur plus humain si il est destiné à servir l'humain. Les choses
signifiantes en ce monde, touchent effectivement les hommes, et pas seulement les citoyens moyens. Il faut aussi avoir conscience qu'un tel système peut servir mais aussi desservir. Car qui dit expansion du savoir par un système indépendant, dit expansion du pouvoir par des instances centrales. Qui dit accès aux informations par tout le monde, dit accès au contrôle de diffusion et de développement d'entités extrémistes.
Mais le propre de la démocratie, n'est-il pas dans la possibilité de s'exprimer sans censure indépendamment de toute majorité ? Ayons donc confiance en elle, c'est sa pluralité qui donnera ses meilleures unités de valeurs.
La connaissance humaine représentée de manière significative et non élitiste de part sa conception inter-relationnelle la rendant universelle s'en trouvera de toute façon accrue, démocratisée, bénéfique pour tout le monde.