Skip to content

LiLanQi/python

Repository files navigation

Python学习

day01

  • python基础语法学习
  • pycharm的安装、环境变量配置以及使用
  • 了解如何安装第三方库 ```pip intsall``

day02

  • 了解并学习使用火车头软件爬取数据

  • requests库以及BeautifulSoup库的了解,爬取简单静态网页以及理解其过程

  • 了解xpath内部参数的意思```c_data.xpath('//*[@id="root"]/div/div')``

  • 复习html相关知识

  • 使用lxml库爬取简单静态页面

day03

day04

  • 了解并学习解析网页三大方式

    1. 使用正则表达式解析网页

    2. 使用BeautifulSoup解析网页

      ​ + 了解文档树

    3. 使用lxml解析网页

      ​ + 了解Xpath的选取

  • 爬取房屋价格数据

  • 学习python文件输入输出,将数据存储至.csv

  • 复习mysql数据库,结合MySQLdb第三方库将数据存储进mysql数据库

  • 学习yiled关键字的作用

day05

  • 了解反爬虫以及如何解决反爬虫
    1. 修改爬虫间隔时间 2. 修改请求头 3. 获取真实地址(数据存储在json文件中,或者使用ajax载入的时候有真实地址,地址有规律,亦或者使用ajax的时候找到的其所有真实地址都是同一个,每次刷新这个地址都会得到不同的值)

  • 解决中文乱码

  • 登录与简单数字验证码的处理
    1. 使用post提交数据 2. 处理cookies 3. 人工方法处理简单数字验证码

  • 使用百度API获取数据

  • 了解scrapy框架

day06

  • 简单学习scrapy框架使用,学习其API文档中
  • 学习selectorLib插件的使用,提取页面所需要的内容至.YML文件中
  • 结合scrapy以及selectorLib爬取页面商品数据http://scrapeme.live/shop/
  • 结合scrapy以及selectorLib爬取阿里巴巴商品数据,并且存储至.csv文件中
  • 爬取阿里耳机商品数据,解决图片无法获取以及链接问题

day07

  • 了解git并上传代码至github
  • 学习使用markdown语言
  • 阅读squareup API文档
  • 往网页中插入商品数据

day08

  • socket安装以及下载splash

  • splash+scrapy爬取阿里动态页面失败

  • beautifulSoup爬取阿里图片失败

  • 爬取dropshipping商品数据,图片爬取失败

java学习

  • 使用url调用接口功能
  • 实现图片上传、商品上传功能,并且提供接口
  • SpringBoot学习
  • Swagger学习
  • Redis学习
  • lombok插件学习
  • 改进商品上传功能
  • 解决项目部署过程中的各种bug问题
  • postman了解及其使用
  • 图解http学习

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published