November 18th, 2009 @ 5:03pm | njames | Categories Serendipity | No Comments »
  • De l'annotation automatique sur Flickr avec le Blind Astrometry Server, (un robot web pour annoter automatiquement des images), http://astrometry.net/: cela date du début de l'année 2009, sur des photographies du ciel nocturne du groupe Flickr astrometry, détection et ajout d'annotations pour les astres répertoriés (planètes, galaxies, nébuleuses etc.) via astrometry.net.

    flickr_found_in_space_example

    C'est un projet très intéressant, les bots pour l'annotation automatique des images reste encore quelque chose de nouveau !

  • De la CBIR sur Bing.
    Le plugin Silverlight est nécessaire pour utiliser cette fonctionnalité du moteur Bing, ce qui est absolument ridicule car il semble que Silverlight n'est utilisé que pour faire du rendu eye-candy avec des effets de gloss, blend et des miniatures d'image (thumbnails) flottantes...
  • Un nouveau Google Labs, Google Image Swirl, sur la recherche d'image itérative avec une navigation dans une hiérarchie de clusters.
    Flash et Javascript sont nécessaires pour utiliser l'interface, et contrairement à la fonctionnalité Visual Search de Bing cité plus haut qui nécessite Silverlight, utiliser du Flash dans Google Image Swirl se justifie complètement, il y a une interface pour l'exploration des résultats qui n'est pas un simple listing des image-résultats.

    D'après Google, Image Swirl réalise deux opérations: (1) l'organisation des résultats de la recherche d'image sur la base de mesures de similarité visuelle et sémantique entre document, et (2) présentation des résultats organisés dans une interface d'exploration.

    googleImageSwirl
    screenshot d'une navigation dans Google Image Swirl pour la requête "Pablo Picasso".

    Google propose des requête-exemples attaquant le problème de la polysémie telle que "apple", "beetle", "jaguar", et d'autres requêtes attaquant le problème de la perspective visuelle.

    D'après le Official Google Blog, Google Image Swirl utilise et étend les technologies développées pour Picasa Face Recognition et Google Similar Images, pour réaliser le grouping des images et la construction de la hiérarchie de clusters.

    Remarque 1:
    L'utilisateur naviguant de cluster en cluster, une succession d'interactions utilisateur dans une recherche d'image est ainsi une hiérarchie de clusters.
    Lorsque l'utilisateur affiche un cluster qui n'a pas de cluster fils (i.e. on ne peut pas construire de nouveaux cluster à partir d'un des documents contenus dans le cluster courant), les résultats sont souvent des plus proches duplicata (near duplicates).

    Remarque 2:
    Quelque chose qui serait réellement intéressant, bluffant en réalité car c'est un problème très difficile, c'est de justifier une relation entre deux documents dans une navigation dans Google Image Swirl.
    Google dit que pour calculer les clusters, ils utilisent des mesures de similarités visuelle et sémantique, nous pourrions vouloir savoir pourquoi google dit que deux documents sont liés: est-ce une prédominance de la similarité visuelle ? une prédominance de la similarité sémantique ? une expansion sémantique ? est-ce deux documents appartenant à une même thématique selon une taxonomie reconnue autour de laquelle il y a consensus ? est-ce deux documents liés via une relation related-to (co-occurrence statistique) ?

May 26th, 2009 @ 1:13pm | njames | Categories Serendipity | No Comments »
  • wolframalpha: le moteur de recherche intelligent annoncé par Stephen Wolfram, un computational knowledge engine.
  • le code de imgSeek, implémentation de l'article Charles E. Jacobs and Adam Finkelstein and David Salesin, Fast multiresolution image querying, SIGGRAPH, 1995 est intégré dans Digikam et dans Xapian.
  • Google Flu Trends for Mexico: Google remet ça avec Google Flu Trends pour la grippe qui fait grouiik.
  • comment changer le langage de traduction par défaut pour Ubiquity (notamment pour menu contextuel de la page > Ubiquity).
  • goldenpod est un chouette outil en ligne de commande pour tenir à jour une liste de podcasts, conjugué à une crontab sur son serveur perso, c'est très pratique pour avoir ses podcasts up-to-date tous les jours.
March 4th, 2009 @ 12:12am | njames | Categories Research | No Comments »
La Photographie Annotation Task de ImageCLEF'09 utilise le dataset MIRFlickr, 25.000 images en provenance de Flickr, avec leurs Flickr tags associés et une annotation par topics. Pour cette dernière annotation, par topics, faite manuellement par les créateurs de MIRFlickr, les 25k images ne sont pas toutes annotées, mais 24581 images sont annotées. Dans le jeu de donnée, quelques images ne sont pas lisibles par certaines bibliothèques de traitement d'image, un défaut dans le header des fichiers peut être, ce ne peut pas être un champ EXIF (ou la valeur d'un champ) non supporté par la bibliothèque car d'après le website du dataset, les images ne contiennent plus leurs données EXIF... Pour les bibliothèques Java qui utilisent ImageIO par exemple:
java.lang.IllegalArgumentException: bandOffsets.length is wrong!
	at javax.imageio.ImageTypeSpecifier$Interleaved.<init>(ImageTypeSpecifier.java:269)
	at javax.imageio.ImageTypeSpecifier.createInterleaved(ImageTypeSpecifier.java:382)
	at com.sun.imageio.plugins.jpeg.JPEGImageReader.getImageTypes(JPEGImageReader.java:745)
	at com.sun.imageio.plugins.jpeg.JPEGImageReader.readInternal(JPEGImageReader.java:938)
	at com.sun.imageio.plugins.jpeg.JPEGImageReader.read(JPEGImageReader.java:915)
	at javax.imageio.ImageIO.read(ImageIO.java:1422)
	at javax.imageio.ImageIO.read(ImageIO.java:1282)
	at net.trevize.ImageUtils.loadImage(ImageUtils.java:40)
	at net.trevize.ImageUtils.getImageSize(ImageUtils.java:199)
	at net.trevize.cbiaproto.dataformer.IIDFHandler.addImageData(IIDFHandler.java:556)
	at net.trevize.cbiaproto.dataformer.IIDFHandler.processFilesList(IIDFHandler.java:509)
	at net.trevize.cbiaproto.dataformer.Dataformer.createDataset(Dataformer.java:95)
	at net.trevize.cbiaproto.dataformer.Dataformer.main(Dataformer.java:270)
La liste des fichiers qui posent problèmes. Une solution (façon barbarian), que j'ai utilisé, lister tous les fichiers incriminés, les convertir au format BMP avec ImageMagick puis les reconvertir en JPG, cela règle les problèmes de headers défectueux. Je n'ai aucune idée sur l'origine du problème... De plus, certaines images ne sont pas codées avec l'espace de couleur RGB, et LIRE par exemple ne supporte que du RGB. (si vous faites des tests avec LIREDemo, il suffit d'aller dans liredemo.ParalleIndexer, et attraper les Exception dans la méthode run()).
September 3rd, 2008 @ 11:54am | njames | Categories CBIR | No Comments »
Un lien intéressant listant différentes bases de donnée d'images classées par tâche de traitement d'image, dont le CBIR.
June 13th, 2007 @ 4:47pm | njames | Categories CBIR | No Comments »
LIRe, Lucene Image Retrival, c'est une library de Mathias Lux, j'ai découvert son blog par del.ico.us, http://www.semanticmetadata.net/. LIRe create a Lucene index of image feature for CBIR. Three of the available image retrieval features are taken from the MPEG-7 standard: ScalableColor, ColorLayout, EdgeHistogram, and an Auto Color Correlogram. LIRe is part of Caliph&EMIR project. Rien à voir avec le projet européen EMIR. EMIR, European Multilingual Information Retrieval, finalisé en 1994, c'est un projet ancien maintenant, spirit est de la même époque. Le système SPIRIT est monolingue, repose sur une analyse linguistique du document et une pondération statistique. PRISME a pour objectif la conception et la réalisation d'un outil de veille technologique multilingue sur Internet. PRISME utilise les technologies multilingues développées dans le cadre du projet européen EMIR, et du produit SPIRIT de T.GID. Un test rapide de LireDemo, une application en java pour tester LIRe, ne fonctionne pas, pourtant sur le site de l'auteur il est bien indiqué qu'un JDK1.6 est requis mais des exceptions sont catchées lors de la construction de l'index.


 Valid XHTML 1.0 Transitional Valid CSS! WordPress