Please use this identifier to cite or link to this item:
https://dspace.univ-ouargla.dz/jspui/handle/123456789/489
Title: | Utilisation des ontologies pour l’indexation automatique des sites Web en Arabe |
Authors: | Mahieddine DJOUDI GASMI, Mounira |
Keywords: | Indexation sémantique Web sémantique traitement automatique de la langue arabe Système de recherche d’information Pages web arabes OWL Ontologie |
Issue Date: | 2009 |
Abstract: | La croissance du Web est entrain de faire une énorme masse d'information universelle. Le Monde Arabe, ces derniers temps, a contribué à cette explosion. Pour cette raison, il serait raisonnable de penser à des techniques efficaces qui permettraient à l'utilisateur arabe de trouver les documents pertinents qu'il cherche dans le Web. Ce mémoire présente une approche d’indexation des sites web arabes, par l’utilisation des ontologies et les techniques de traitement automatique de la langue arabe pour la recherche d’information sur internet. Tout d’abord une ontologie arabe ( أ_ ) orientée terminologie de domaine est construite pour être utilisée dans le processus d’indexation. Nous avons utilisé un thésaurus linguistique (WordNet) couplé avec un dictionnaire bilingue (Tarjim de Ajeeb), dans un but de désambiguïsation des concepts d’une telle ontologie. Notre outil d’indexation s’appuie sur les techniques issues du traitement automatique de la langue arabe (TALA) pour générer des termes bien formés à partir des pages web arabes. Les marqueurs HTML sont considérés. Ensuite les concepts associés aux termes bien formés sont générés par le biais d’un thésaurus. En fin l’index structuré est déduit par la mise en correspondance des concepts des pages web déterminés et les concepts de notre ontologie orientée terminologie. |
URI: | http://hdl.handle.net/123456789/489 |
Appears in Collections: | Département d'informatique et technologie de l'information - Magister |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
GASMI_Mounira.pdf | 1,26 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.