Please use this identifier to cite or link to this item: https://dspace.univ-ouargla.dz/jspui/handle/123456789/15788
Title: Combler le fossé sémantique en recherche d’image via la transformation des concepts sémantique en une représentation visuelle
Authors: Mohammed Lamine Kherfi
Aiadi, Oussama
Keywords: Content-Based Image Retrieval (CBIR)
semantic gap
Gaussian Mixture Model (GMM)
Supervised learning
Outlier detection
date fruit recognition
Recherche d’image par le contenu
fossé sémantique
Mixture de la Gaussiens
Apprentissage supervisé
détection des outliers
reconnaissance des dattes
Issue Date: 2017
Abstract: Semantic gap between low-level image features and high-level user semantics is one of the common issues which degrade the performance of Content-Based Image Retrieval (CBIR). The main concern of this thesis is to bridge this gap, and thus to improve the performance of retrieval systems. The proposed approach consists in a process of supervised learning which aims to learn a visual model for each semantic concept. For a given concept (e.g., Horse), we associate the concept with a set of images (i.e., training images), where the web search engines are used for providing those images. Then, so as to faithfully learn the concept, we automatically prune the training images from outliers. Afterwards, we automatically identify the visual appearances within the training set, and then a Gaussian Mixture Model (GMM) was used to model the concept. During retrieval, user can naturally formulate his query using a textual query. The learnt visual model (i.e., GMM), corresponding to the query concept, is used to detect the pertinent images. The proposed approach presents a multitude of advantages. First, it allows to use a textual query in retrieving images from collections where the text is entirely absent. Second, it takes into account the intra-variation within training images and the presence of outliers as well. In addition, it is fully automatic, as no human intervention is required. Furthermore, it is unlimited to any pre-defined concept, as training images are automatically downloaded from the web. Because we formulate the retrieval as a probabilistic supervised classification problem, we apply the proposed approach to the task of date fruit recognition. Experimental results showed that the proposed approach has achieved a high retrieval precision as well as a high recognition accuracy. Furthermore, both retrieval and recognition were performed with a high speed. Moreover, our approach has proven its strength against several methods from the state-of-the-art.
Le fossé sémantique est l’un des problématiques qui dégrade la performance des systèmes de recherche d’image par le contenu (CBIR). L’objectif de cette thèse est de combler le fossé sémantique afin d’améliorer la performance de CBIR. L’approche proposée consiste à un processus d’apprentissage supervisé qui vise à apprendre un modèle visuelle pour chaque concept sémantique. Nous avons utilisé les images du web afin d’accomplir l’apprentissage, cela permet d’être ne pas limité par un concept prédéfini. Puis, on a éliminé les images aberrantes afin d’apprendre correctement les différents concepts sémantiques. Les apparences visuelles au sein des images qui présentent le même concept sont automatiquement identifiées. Par ailleurs, un model du mélange de Gaussienne (GMM) est utilisé pour modeler chaque concept. Durant la recherche, l’utilisateur peut fournir une requête textuelle. Les modèles visuelles extraites lors de l’apprentissage sont utilisées ultérieurement pour détecter les images pertinentes à la requête. L’approche proposée a plusieurs avantages. Premièrement, elle permet d’utiliser une requête textuelle pour chercher dans des collections où le texte est entièrement absent. Deuxièmement, elle prend en considération l’intra-variation des images ainsi que l’existence des images aberrante. En outre, elle est purement automatique. Nous avons appliqués notre approche, qui formule le problème de recherche comme un problème de classification supervisée, pour la classification des dattes. Les résultats expérimentaux montrent que notre approche a atteint une haute précision ainsi qu’un taux de reconnaissance élevé. En outre, le processus de recherche et de reconnaissance sont effectuées en grande vitesse. En comparant l’approche proposé avec d’autres méthodes, elle a montré une performance elevé.
URI: http://dspace.univ-ouargla.dz/jspui/handle/123456789/15788
Appears in Collections:Département d'informatique et technologie de l'information - Doctorat

Files in This Item:
File Description SizeFormat 
Oussama-Aiadi-Doctorat.pdf6,49 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.