Demo

Terminal 1:

python3 -m http.server 8000 --bind 127.0.0.1 -d ./demo_server_files

For run test server.

Terminal 2:

python demo.py "http://localhost:8000/" | tee downloaded.list | xargs wget -q -P ./downloaded

# OR

echo "http://localhost:8000/" | python demo.py --urls - | tee downloaded.list | xargs wget -q -P ./downloaded

# OR

cat crawl.list
# Output:
# http://localhost:8000

python demo.py --urls crawl.list | tee downloaded.list | xargs wget -q -P ./downloaded

Explanation:

tee for save new urls for future download, use for breakpoints and can be used for skip downloeded files.
xargs run wget for each line from pipe
wget -q -P ./downloaded for download url. -q for no output, -P for download files into ./downloaded directory.

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
demo_server_files		demo_server_files
downloaded		downloaded
.gitignore		.gitignore
demo.py		demo.py
readme.md		readme.md
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

demo_server_files

demo_server_files

downloaded

downloaded

.gitignore

.gitignore

demo.py

demo.py

readme.md

readme.md

requirements.txt

requirements.txt

Repository files navigation

Demo

About

Releases

Packages

Languages

geekmoss/Selenium-crawl-and-download-demo

Folders and files

Latest commit

History

Repository files navigation

Demo

About

Resources

Stars

Watchers

Forks

Languages