Please use this identifier to cite or link to this item: https://dspace.univ-ouargla.dz/jspui/handle/123456789/652
Title: Construction et utilisation d’un thésaurus pour la recherche d’information sur le web
Authors: Mahieddine Djoudi
Samir Zidat
BELLAOUAR, Slimane
Keywords: RDF/XML
Systèmes de recherche d’information
thésaurus
expansion de requêtes
hyperliens
web mining
Issue Date: 2009
Abstract: Depuis son apparition, le web ne cesse de progresser en contenu et en nombre d’utilisateurs. Malgré les améliorations dans la technologie des moteurs de recherche sur le web, des millions d’internautes échouent à satisfaire leurs besoins informationnels. Le recours à l’expansion de requêtes à base de thésaurus semble une solution raisonnable. Ce mémoire présente une méthode de construction automatique d’un thésaurus. Elle s’appuie sur l’analyse des hyperliens des pages web et non sur leurs contenus. Cette méthode permet d’extraire les nouveaux termes et les relations inter termes au fur et à mesure que le web progresse. Le thésaurus construit, est utilisé comme outil d’expansion automatique des requêtes lors du processus d’interrogation de la RI sur le web. Le développement d’un méta moteur de recherche assure l’interaction entre le thésaurus, l’utilisateur et le moteur de recherche Google. En plus, de la représentation sous forme d’une base de données relationnelle du thésaurus construit, le format RDF/XML est utilisé dans une perspective de partager et de réutiliser ses données.
Since its emergence, Web continues to grow in content and user number. Despite improvements in search engine technology on the Web, millions of Internet users fail to meet their information needs. Recourse to thesaurus based query expansion seems a reasonable solution. This thesis presents a thesaurus automatic construction method. It is based on web page hyperlink analysis not on their content. This method can extract the new terms and relations between terms as the web progresses. The built thesaurus is used as a tool for automatic query expansion during the interrogation process of web IR. The development of a meta-search engine ensures interaction between the thesaurus, the user and the Google search engine. In addition of relational database representation of the built thesaurus, we have used the RDF/XML format in order to share and reuse its data.
إن الشبكة العالمية العنكبوتية لاتزال في نمو مستمر من حيث المحتوى وكذا عدد المستخدمين و ذلك منذ ظھورھا. و بالرغم من التحسينات في تكنولوجيا محركات البحث على شبكة النترنت، فإن الملايين من مستخدمي ا,نترنت يفشلون في تلبية احتياجاتھم من المعلومات . إن اللجوء إلى توسيع الاستفسارات القائم على المكنز يبدو حلا معقولا . ھذه المذكرة تعرض طريقة للبناء التلقائي للمكنز. وھي ترتكز على تحليل الروابط الفائقة لصفحات الويب وليس على مضمونھا. باستعمال ھذه الطريقة يمكن استخلاص الكلمات الجديدة والع9قات بينھا و ذلك تزامنا مع نمو الويب . بعد إنشاء المكنز، فإنه يستخدم كأداة للتوسيع التلقائي للاستفسارات و ذلك أثناء إجراء الاستجواب المتعلق بالبحث عن المعلومات في الويب . إن إنشاء ميتا-محرك بحث يكفل التفاعل بين المكنز،المستخدم و محرك البحث Google . من جھة أخرى، و با,ضافة إلى تمثيل المكنز على شكل قاعدة بيانات ترابطية، فإنه تم استعمال الشكل XML/RDF وذلك بغية إتاحة تقاسم و إعادة استعمال معطياته.
URI: http://hdl.handle.net/123456789/652
Appears in Collections:Département d'informatique et technologie de l'information - Magister

Files in This Item:
File Description SizeFormat 
Slimane_BELLAOUAR.pdf1,32 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.