wordnet:ideas_for_augmenting_wordnet printable version

Propositions pour étendre WordNet: vers un WordNet augmenté

Par “augmenter WordNet”, on ne veut pas seulement dire ajouter de nouveaux concepts ou de nouvelles relations sémantiques à WordNet.
Mais cela peut aussi vouloir modéliser WordNet d'une façon d'avantage en adéquation avec ce que l'on veut vraiment, par exemple pondérer fortement les synsets qui correspondent à des objets du monde réel, i.e. représentable sur une photographie de scène naturelle (une sorte de ratio dans la probabilité de l'utiliser par utilisateur pour décrire un objet du monde réel), ce qui pourrait se faire par un étiquetage des synsets WordNet.

Il faut pour commencer par utiliser une représentation de WordNet qui convient pour ce genre de mise à jours, un WordNet en RDF dans un entrepôt RDF pourrait être une solution (Sesame).

Faire correspondre les requêtes utilisateurs avec les documents indexés

On peut se dire que la première étape pour faire mieux correspondre les requêtes des utilisateurs avec les documents indexés est d'apprendre la nature des questions des utilisateurs, c'est une approche déjà investiguée par “Hollink, Shreiber, Wielinga, Worring, Classification of user image Description”.
Par exemple, utiliser des logs d'utilisation de moteurs de recherche pour identifier les keywords (voir concepts) utilisés dans l'écriture des requêtes. Mais ce travail d'exploration de logs peut être compliqué car pour extraire au mieux l'information que l'on cherche il nous faut désambiguïser les requêtes.

Selection de concept pour le bon niveau de généralité

De plus, on peut voir aussi la problématique dans le sens de trouver le bon niveau de généralité, comme proposé dans “Diggelen, De Jong, Wiering, Strategies for Ontologies negociation: finding the right level of generality”.

Un WordNet augmenté constitué de façon supervisé avec l'utilisateur

Il pourrait être très intéressant de proposer un mécanisme d'augmentation de WordNet supervisé par l'utilisateur (ou du moins, commandé par l'utilisateur). Par exemple:
“Pour tous les hyponymes de 'animal', utiliser wikipédia pour déterminer l'habitat naturel de l'animal en question, sachant que habitat est définit par l'ontologie H”.

Pointer les Synsets qui correspondent à des //visual concret object//

  • On pourrait utiliser les tag de Flickr pour déterminer si un synset peut représenter un object visuel concret sur un niveau de connaissance dit “général”, i.e. sans connaissances expertes.
  • Si je reprends l'idée du GoogleWebHistoryRetriever, il faudrait dans un premier temps ne sélectionner que les requêtes pour Google Image Search, puis seulement les recherches qui ont été suivies par un clic sur un résultat.
 
wordnet/ideas_for_augmenting_wordnet.txt · Last modified: 2011/03/18 16:30 by njames

 © Nicolas James 2009-2011

 Valid XHTML 1.0 Transitional Valid CSS! DokuWiki