Skip to content

Ce projet consiste en première lieu de collecter les données et le contenu des articles en arabe à partir des sites de presse notamment Aljazeera et Hespress (Data Scraping). Après la collection des données vient l’étape de regroupement de ces articles en se basant sur le thème de chacun d’eux. Le travail est de classifier les articles de presse…

License

Notifications You must be signed in to change notification settings

Taylor-X01/News-Categories-Clustering

Repository files navigation

Arabic-News-Categories-Clustering

Big data has an important scientific potential, specifically in the fields of data mining, machine learning and natural language processing (NLP).

This project consists first of all in collecting data and content of Arabic articles from press sites such as Al Jazeera and Hespress (Data Scraping).

After the data collection comes the stage of clustering these articles based on the category of each of them. The objective of such system is to make clusters of arabic press articles in input in text document following these categories: Politics, Culture, Sport, Tamazight and Science-Technology.

Collaborators:

  • Mohamed Reda Chenna @vulca1n
  • Ayoub Ezzidani @AyoubEzz99
  • Anass Grini @Taylor-X01

About

Ce projet consiste en première lieu de collecter les données et le contenu des articles en arabe à partir des sites de presse notamment Aljazeera et Hespress (Data Scraping). Après la collection des données vient l’étape de regroupement de ces articles en se basant sur le thème de chacun d’eux. Le travail est de classifier les articles de presse…

Topics

Resources

License

Stars

Watchers

Forks