Le WP3 s’intéresse à la prise en compte des utilisateurs d’une plateforme d’accès à un corpus numérique et de leurs modes d’utilisation de manière à enrichir le corpus de documents et les mécanismes de navigation. Un partenariat avec l’IDIT (l’Institut du Droit International des Transports) a permis l’accès et la prise en mains du site internet de l’association, ainsi qu’à la base des documents juridiques qu’il intègre, permettant en plus l’analyse du comportement de ses utilisateurs lors de leurs démarches de recherche documentaire.
Les objectifs et réalisations du WP3 incluent :
- L’intégration d’un outil de visualisation ainsi que d’un éditeur d’annotations dans le website de l’IDIT afin de permettre aux utilisateur d’enrichir les documents avec des notes personnelles.
- L’intégration d’un mécanisme de collecte des traces des actions réalisées par les utilisateurs (mots recherches dans le moteur de recherche, documents visualisés, actions sur les documents, etc.) pour permettre l’analyse des différents types de comportement et usages du corpus.
- La possibilité de recherche de mots-clés dans l’intégralité des documents (fulltext), en plus de les chercher dans le meta-données, et l’intégration d’une fonction d’ordonnancement des résultats par pertinence dans le moteur de recherche de documents, dans un premier temps basé sur des caractéristiques lexiques (TF-IDF), et ensuite prenant en compte le feedback implicite laissé par les utilisateurs à travers ses traces, basé sur un algorithme de type multiarmed bandits.
- La proposition d’un modèle de confiance pour l’édition dans le but d’évaluer la qualité et la fiabilité des contributions (annotations) des utilisateurs, pour éventuellement pouvoir proposer des annotations publiques pertinentes d’un utilisateur à un autre.
- La segmentation automatique des documents juridiques pour faciliter l’interprétation du texte, basée sur des modèles de scénario modal en fonction des trois types de juridiction représentées dans la base de données de l’IDIT : cour d’appel, cour de cassation, tribunaux de commerce.