Please use this identifier to cite or link to this item:
https://dspace.univ-ouargla.dz/jspui/handle/123456789/31090
Title: | Classification textuelle des articles de presse à l’aide d’une approche d’apprentissage automatique |
Authors: | MERABTI, Hocine BOUHNIK, Nour elhouda RADI, Hanane |
Keywords: | Machine Learning algorithms Text Mining Natural Language Processing Logistic regression |
Issue Date: | 2022 |
Abstract: | La catégorisation ou la classification automatique des documents est une approche
vitale pour la gestion et le traitement des documents non structurés générés à partir des
médias sociaux sous forme numérique. Elle prend plus en plus d’importance en raison du
grand nombre de documents texte constamment ajoutés sur Web. Les techniques
d’apprentissage automatique ML et de traitement du langage naturel NLP ont été
largement utilisées pour extraire des informations utiles à partir des documents non
structurés disponibles au format numérique. Dans ce travail, nous allons utiliser cinq
algorithmes d’apprentissage automatique pour identifier et classifier avec précision les
articles de BBC_News en différentes catégories. Ces algorithmes seront testés, analysés
et comparés entre eux pour arriver finalement à une conclusion. Les résultats
expérimentaux montrent que le model de classification de BBC_News donne des
résultats satisfaisants avec la plus part des algorithmes testé sur la base de données.
L’algorithme avec le score le plus haut est qualifié de meilleur algorithme
d’apprentissage automatique pour l’ensemble de données utilisé. يعد التصنيف الأوتوماتيكي للوثائق نهجًا حيويًا لإدارة ومعالجة المستندات الرقمية الغير المهيكلة و التي تنبثق من خلال وسائل التواصل الاجتماعي. يكتسب هذا التصنيف أهمية متزايدة بسبب العدد الكبير من المستندات النصية التي على نطاق NLP ومعالجة اللغة الطبيعية ML يتم إضافتها باستمرار إلى الويب. تم استخدام تقنيات التعلم الآلي واسع لاستخراج معلومات مفيدة المستندات الرقمية الغير المهيكلة. في هذا العمل، سنقوم باستخدام خمس وتصنيفها بدقة إلى فئات مختلفة. إذا، سيتم اختبار هذه BBC_News خوارزميات للتعلم الآلي لتحديد مقالات الخوارزميات وتحليلها ومقارنتها مع بعضها البعض للوصول من أجل استخلاص نتيجة في النهاية. تظهر النتائج يعطي نتائج مرضية ، بتطبيق معظم هذه الخوارزميات على مجموعة BBC_News التجريبية أن نموذج تصنيف البيانات المستخدمة. يشار إلى الخوارزمية التي حصلت على أعلى الدرجات على أنها أفضل خوارزمية لتعلم الآلة بالنسبة لمجموعة البيانات هاته. |
Description: | Informatique Industrielle |
URI: | https://dspace.univ-ouargla.dz/jspui/handle/123456789/31090 |
Appears in Collections: | Département d'informatique et technologie de l'information - Master |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
BOUHNIK-RADI.pdf | Informatique Industrielle | 5,56 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.