insta_crawling

Python과 Selenium으로 인스타그램을 크롤링합니다.

imgvidDownloader.py
1. ScrollFeed.py를 실행시켜 팔로워 정보를 수집해 엑셀로 저장하고, 각 feed(게시글)의 url 리스트를 수집
2. GetContents.py를 실행시켜 게시물 id 명의 폴더에 사진과 비디오 저장
TextDownloader.py
1. ScrollFeed.py를 실행시켜 팔로워 정보를 수집해 엑셀로 저장하고, 각 feed(게시글)의 url 리스트를 수집
2. GetEachText.py를 실행시켜 좋아요수, text, 사진, 동영상을 크롤링해 리스트로 저장시켜 반환
3. MakeExcel.py로 크롤링한 정보를 엑셀로 저장
ScrollFeed.py
1. 특정 계정의 인스타그램 모바일 페이지로 접속
2. 로그인
3. 팔로워 정보 수집
4. 모든 게시물이 보일때까지 스크롤하면서 각 게시물의 url 수집 및 텍스트로 저장
5. 게시물 갯수와 다를 경우 다시 스크롤하면서 수집.(set으로 중복을 제거합니다.)
6. 로그아웃
GetContents.py
1. 수집한 url을 접속하면서 사진, 동영상 크롤링해서 게시물 id를 폴더로 만들어 각 폴더에 저장
GetEachText.py
1. 수집한 url을 접속하면서 좋아요수, text, 사진, 동영상 크롤링해서 리스트로 저장
MakeExcel.py
1. 게시물 id, 좋아요수, text, 사진, 동영상 리스트의 리스트를 엑셀로 저장

Name		Name	Last commit message	Last commit date
Latest commit History 19 Commits
__pycache__		__pycache__
.DS_Store		.DS_Store
.gitignore		.gitignore
FollowerList.xlsx		FollowerList.xlsx
GetContents.py		GetContents.py
GetEachText.py		GetEachText.py
InstaCrawling.xlsx		InstaCrawling.xlsx
LICENSE		LICENSE
MakeExcel.py		MakeExcel.py
Mobile_test2_2_whole.py		Mobile_test2_2_whole.py
README.md		README.md
ScrollFeed.py		ScrollFeed.py
TextDownloader.py		TextDownloader.py
imgvidDownloader.py		imgvidDownloader.py
requirements.txt		requirements.txt
urllist.txt		urllist.txt

akalswl14/insta_crawling