Please use this identifier to cite or link to this item: https://dspace.univ-ouargla.dz/jspui/handle/123456789/31090
Title: Classification textuelle des articles de presse à l’aide d’une approche d’apprentissage automatique
Authors: MERABTI, Hocine
BOUHNIK, Nour elhouda
RADI, Hanane
Keywords: Machine Learning algorithms
Text Mining
Natural Language Processing
Logistic regression
Issue Date: 2022
Abstract: La catégorisation ou la classification automatique des documents est une approche vitale pour la gestion et le traitement des documents non structurés générés à partir des médias sociaux sous forme numérique. Elle prend plus en plus d’importance en raison du grand nombre de documents texte constamment ajoutés sur Web. Les techniques d’apprentissage automatique ML et de traitement du langage naturel NLP ont été largement utilisées pour extraire des informations utiles à partir des documents non structurés disponibles au format numérique. Dans ce travail, nous allons utiliser cinq algorithmes d’apprentissage automatique pour identifier et classifier avec précision les articles de BBC_News en différentes catégories. Ces algorithmes seront testés, analysés et comparés entre eux pour arriver finalement à une conclusion. Les résultats expérimentaux montrent que le model de classification de BBC_News donne des résultats satisfaisants avec la plus part des algorithmes testé sur la base de données. L’algorithme avec le score le plus haut est qualifié de meilleur algorithme d’apprentissage automatique pour l’ensemble de données utilisé.
يعد التصنيف الأوتوماتيكي للوثائق نهجًا حيويًا لإدارة ومعالجة المستندات الرقمية الغير المهيكلة و التي تنبثق من خلال وسائل التواصل الاجتماعي. يكتسب هذا التصنيف أهمية متزايدة بسبب العدد الكبير من المستندات النصية التي على نطاق NLP ومعالجة اللغة الطبيعية ML يتم إضافتها باستمرار إلى الويب. تم استخدام تقنيات التعلم الآلي واسع لاستخراج معلومات مفيدة المستندات الرقمية الغير المهيكلة. في هذا العمل، سنقوم باستخدام خمس وتصنيفها بدقة إلى فئات مختلفة. إذا، سيتم اختبار هذه BBC_News خوارزميات للتعلم الآلي لتحديد مقالات الخوارزميات وتحليلها ومقارنتها مع بعضها البعض للوصول من أجل استخلاص نتيجة في النهاية. تظهر النتائج يعطي نتائج مرضية ، بتطبيق معظم هذه الخوارزميات على مجموعة BBC_News التجريبية أن نموذج تصنيف البيانات المستخدمة. يشار إلى الخوارزمية التي حصلت على أعلى الدرجات على أنها أفضل خوارزمية لتعلم الآلة بالنسبة لمجموعة البيانات هاته.
Description: Informatique Industrielle
URI: https://dspace.univ-ouargla.dz/jspui/handle/123456789/31090
Appears in Collections:Département d'informatique et technologie de l'information - Master

Files in This Item:
File Description SizeFormat 
BOUHNIK-RADI.pdfInformatique Industrielle5,56 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.