Extraction et structuration d'informations venant de quelques site web de fact-checking
Les fausses nouvelles (fake news) sont devenues un problème de plus en plus important, tant du point de vue de la société que de celui de la recherche. Le LIRMM en collaboration avec 2 équipes allemandes a construit et mis à disposition la base de connaissance ClaimsKG qui recueillit les informations et méta-données provenant d’un grand nombre de sites journalistiques de fact checking. Le sujet de ce projet consiste en l’enrichissement de cette base de connaissances avec des nouvelles données provenant des sites web suivants (liste soumise à évolution) :
- NoRumors ~~> Arabie saoudite, en arabe.
- Fatabyyano ~~> Jordani, en Arabe, Fatabyyano ("فتبينوا" veut dire "Alors montrez-le" en arabe) est la première et la seule plateforme arabe certifiée par l'IFCN.
Vous devez avoir Python3 installer sur votre machine
# On ubuntu for example
sudo apt install python3
A step by step series of examples that tell you how to get a development env running
Say what the step will be
python3 __init__.py
End with an example of getting some data out of the system or using it for a little demo
- Python - The principal language
- Beautiful Soup - Python package for parsing HTML and XML documents
- Bouzidi Belkassim ~~> BOuzidiBElkassim
- Elhouiti Chakib ~~> chakibreds
- Kezzoul Massili ~~> massyKezzoul
- Nedjari Abdelkader ~~> abdelkader-nedjari
- Zeroual Ramzi ~~> RamziZer
- Encadrement : Konstantin Todorov todorov@lirmm.fr
- Hat tip to anyone whose code was used
- Inspiration
- etc