Please use this identifier to cite or link to this item: http://dspace.univ-ouargla.dz/jspui/handle/123456789/489
Title: Utilisation des ontologies pour l’indexation automatique des sites Web en Arabe
Authors: GASMI, Mounira
Mahieddine DJOUDI
Keywords: Indexation sémantique
Web sémantique
traitement automatique de la langue arabe
Système de recherche d’information
Pages web arabes
OWL
Ontologie
Issue Date: 27-May-2009
Series/Report no.: 2009 / 2010;
Abstract: La croissance du Web est entrain de faire une énorme masse d'information universelle. Le Monde Arabe, ces derniers temps, a contribué à cette explosion. Pour cette raison, il serait raisonnable de penser à des techniques efficaces qui permettraient à l'utilisateur arabe de trouver les documents pertinents qu'il cherche dans le Web. Ce mémoire présente une approche d’indexation des sites web arabes, par l’utilisation des ontologies et les techniques de traitement automatique de la langue arabe pour la recherche d’information sur internet. Tout d’abord une ontologie arabe ( أ_ ) orientée terminologie de domaine est construite pour être utilisée dans le processus d’indexation. Nous avons utilisé un thésaurus linguistique (WordNet) couplé avec un dictionnaire bilingue (Tarjim de Ajeeb), dans un but de désambiguïsation des concepts d’une telle ontologie. Notre outil d’indexation s’appuie sur les techniques issues du traitement automatique de la langue arabe (TALA) pour générer des termes bien formés à partir des pages web arabes. Les marqueurs HTML sont considérés. Ensuite les concepts associés aux termes bien formés sont générés par le biais d’un thésaurus. En fin l’index structuré est déduit par la mise en correspondance des concepts des pages web déterminés et les concepts de notre ontologie orientée terminologie.
URI: http://hdl.handle.net/123456789/489
ISSN: R
Appears in Collections:Département d'informatique et technologie de l'information - Magister

Files in This Item:
File Description SizeFormat 
GASMI_Mounira.pdf1,26 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.