wordnet:wordnet printable version

Projets / méthodes / recherches qui utilisent WordNet

Champ lexical des recherches autour de WordNet

  • Etiquetage morphosyntaxiques == POS tagging.
  • Expression multi-mots.
  • Analyse syntaxique (link grammar parser, J. Lafferty, CMU), (Stanford parser).
  • Détection d'anaphore.
  • Détection de paraphrase (différentes façon d'exprimer la même chose).
  • SemEval, workshop on semantic evaluation.
  • SENSEVAL word-sense evaluation exercises.
  • ACL Association for Computational Linguistics.

Conférences, Workshop

Associations

Bibliographie

  • une importante bibliographie sur WordNet
  • [Wang & al., Does ontology help in information retrieval? - A comparison between keyword, text ontology and multi-modality ontology approaches, 2006]: dans cet article WordNet a été augmenté avec des classes et des relations extraites du site Web de la BBC, utilisant la catégorie Science and Nature Animal.

Statistique de WordNet

Statistique de WordNet 3.0

Dans WordNet c'est le couple (Synset,gloss) qui définit le sens d'un mot. Il est possible d'avoir 2 synsets qui contiennent le même ensemble de synonymes, par exemple le mot device est utilisé dans plusieurs synsets dont l'ensemble de synonymes ne contiennent que ce mot.

POS Words Synsets Senses
NOUN 117798 82115 146312
VERB 11529 13767 25047
ADJ 21479 18156 30002
ADV 4481 3621 5580
TOTAL 155287 117659 206941

Il y a au total 147,278 String uniques dans WordNet, le total de la première colonne (155,287) du tableau ne prend pas en compte les doublons (une String qui se retrouve dans plusieurs catégories syntaxique).

POS Monosemous words Polysemous words Synsets implied in polysemous words
NOUN 101863 15935 44449
VERB 6277 5252 18770
ADJ 16503 4976 14399
ADV 3748 733 1832
TOTAL 128391 26896 79450

Quelques notes générales sur la structure de WordNet

Une première bonne lecture est le glossaire des termes utilisés dans WordNet.

Relations sémantiques disponibles dans WordNet:

  • Pour toutes les PoS:
    • Synonymy
    • Antonymy
  • Nouns only:
    • Hypernymy / Hyponymy
    • Meronymy / Holonymy
  • Verbs only:
    • Troponymy
    • Entailment
  • Autres:
    • Pertainymy: related to or pertaining to. c'est un adjectif relationnel.

Mesures de similarité

Path Finder

  • Depth Finder
    • Wu & Palmer
    • Leacock & Chodorow
  • Path
  • Information Content finder
    • Resnik
    • Jiang & Conrath
    • Lin

Gloss Finder

  • Lesk (Barnerjee & Pederson)
  • Vector (Padwarhan) (matrice de cooccurrence avec les gloss en vecteurs)

Hirst & St-Onge

Classifie les relations dans WordNet comme si elles avaient des directions. Par exemple, is-a est une relation upwards, has-part est une relation horizontal.

Navigation graphique dans WordNet

Associated datasets

 
wordnet/wordnet.txt · Last modified: 2011/05/06 15:40 by njames

 © Nicolas James 2009-2011

 Valid XHTML 1.0 Transitional Valid CSS! DokuWiki