Velib

Notes pour le CSV

Pour lancer le projet et lire le CSV, commence par supprimer ce qu'il y a dans le csv que tu téléchargeras (ce qui est là est à titre d'exemple). Ensuite, lance zookeeper et kafka en créant d'abord un topic "velib"; Puis lance le producer (call_api.py), il permet de récupérer ce qu'il ya dans l'API toutes les minutes. Ensuite lance le fichier consumer.py qui récupérera les données intéressantes et les stockera dans le fichier velib.csv.

Notes pour SparkStreaming

Lancer spark-submit avec la commande -> spark-submit --packages org.apache.spark:spark-streaming-kafka-0-8_2.11:2.4.4 read_kafka.py

Elastic search

csv file import https://techexpert.tips/fr/elasticsearch-fr/elasticsearch-importation-dun-fichier-csv/

Name		Name	Last commit message	Last commit date
Latest commit History 22 Commits
Velib		Velib
.gitignore		.gitignore
README.md		README.md
ar_data.npy		ar_data.npy
call_api.py		call_api.py
consumer.py		consumer.py
csv.conf		csv.conf
dataProcessing.py		dataProcessing.py
dataframe_streaming.csv		dataframe_streaming.csv
dataframe_streaming_1.csv		dataframe_streaming_1.csv
filtered_velib_clean.csv		filtered_velib_clean.csv
kafka_to_df.py		kafka_to_df.py
kafka_to_es.py		kafka_to_es.py
learning.py		learning.py
prediction.py		prediction.py
producer_predict.py		producer_predict.py
read_kafka.py		read_kafka.py
stations_capacities.csv		stations_capacities.csv
structured_stream.py		structured_stream.py
test_es.py		test_es.py
velib.csv		velib.csv
velib_clean1.csv		velib_clean1.csv
velib_clean2.csv		velib_clean2.csv

tcotte/Velib

Folders and files

Latest commit

History

Repository files navigation

Velib

Notes pour le CSV

Notes pour SparkStreaming

Elastic search

About

Resources

Stars

Watchers

Forks

Languages