web-scraping-framework

A distributed Web-scraping Framework Engine

Master.js is run on a central server:
Usage: node master.js --crawler-count=[num-of-crawlers] --url-file=[filename] --s-ip=[ip-block-first-ip]
--e-ip=[ip-block-last-ip]

Slave.js is run on the machine intended to be used for crawling:
Usage: node slave.js --master-url=[e.g http://localhost] --crawler=[crawler-name]

Each slave.js operates a driver.py file which manages the directories and resources for the crawler.

Curl crawler has been provided as an example.

==================================================================================

Survey analysis scripts are used for writing S2.2

Name		Name	Last commit message	Last commit date
Latest commit History 12 Commits
Master		Master
Slaves/Example-Curl		Slaves/Example-Curl
survey-analysis-scripts		survey-analysis-scripts
.gitignore		.gitignore
README.md		README.md
input_data_500.txt		input_data_500.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Master

Master

Slaves/Example-Curl

Slaves/Example-Curl

survey-analysis-scripts

survey-analysis-scripts

.gitignore

.gitignore

README.md

README.md

input_data_500.txt

input_data_500.txt

Repository files navigation

web-scraping-framework

About

Releases

Packages

Contributors 2

Languages

SulemanAhmadd/web-scraping-framework

Folders and files

Latest commit

History

Repository files navigation

web-scraping-framework

About

Resources

Stars

Watchers

Forks

Languages