Par “augmenter WordNet”, on ne veut pas seulement dire ajouter de nouveaux concepts ou de nouvelles relations sémantiques à WordNet.
Mais cela peut aussi vouloir modéliser WordNet d'une façon d'avantage en adéquation avec ce que l'on veut vraiment, par exemple pondérer fortement les synsets qui correspondent à des objets du monde réel, i.e. représentable sur une photographie de scène naturelle (une sorte de ratio dans la probabilité de l'utiliser par utilisateur pour décrire un objet du monde réel), ce qui pourrait se faire par un étiquetage des synsets WordNet.
Il faut pour commencer par utiliser une représentation de WordNet qui convient pour ce genre de mise à jours, un WordNet en RDF dans un entrepôt RDF pourrait être une solution (Sesame).
On peut se dire que la première étape pour faire mieux correspondre les requêtes des utilisateurs avec les documents indexés est d'apprendre la nature des questions des utilisateurs, c'est une approche déjà investiguée par “Hollink, Shreiber, Wielinga, Worring, Classification of user image Description”.
Par exemple, utiliser des logs d'utilisation de moteurs de recherche pour identifier les keywords (voir concepts) utilisés dans l'écriture des requêtes. Mais ce travail d'exploration de logs peut être compliqué car pour extraire au mieux l'information que l'on cherche il nous faut désambiguïser les requêtes.
De plus, on peut voir aussi la problématique dans le sens de trouver le bon niveau de généralité, comme proposé dans “Diggelen, De Jong, Wiering, Strategies for Ontologies negociation: finding the right level of generality”.
Il pourrait être très intéressant de proposer un mécanisme d'augmentation de WordNet supervisé par l'utilisateur (ou du moins, commandé par l'utilisateur). Par exemple:
“Pour tous les hyponymes de 'animal', utiliser wikipédia pour déterminer l'habitat naturel de l'animal en question, sachant que habitat est définit par l'ontologie H”.