自制pixiv爬虫

由于感觉现有爬虫用着不太方便 于是乎自己写了个爬虫

爬虫特点:
1'需要Java环境
2'需要cookie
3'支持关键字搜索爬取
4'可以以浏览数和收藏数为基础进行图片筛选
5'支持多线程下载
6'支持失败重试(直到下载成功为止)
7'图片下载完再保存(不存在下载一半中断的图片)
8'跳过已下载完的图片
9'根据画的数量选择是否跳过下载
10'自定义保存文件名称
11'支持uid爬取了!(2020.08.17)
12'支持任务列表
13'支持设置镜像站
14'支持设置代理

github地址: https://github.com/jht3QAQ/PixivSpider

使用方法:

1'下载release的PixivSpider.jar和config.properties.example 并放于同一文件夹下

2'配置config.properties.example并重命名为config.properties

其中cookie获取方法(以edge dev为例):

浏览器访问www.pixiv.net并登录,
打开F12开发者工具 点到网络标签 之后随便访问一个页面 找到含有www.pixiv.net的URL(如图)

点击URL找到请求标头的Cookie项并复制

粘贴到config.properties的cookie处

 

3.打开cmd并切换到jar所在目录下 输入java -jar PixivSpider.jar

 

最后附一张运行效果图:

点赞
  1. Rt说道:

    :huaji7: 终于更新辣,有空去试试w

回复 Rt 取消回复

电子邮件地址不会被公开。必填项已用 * 标注