Mescoda's Blog

pixivCrawler — Pixiv排行榜图片下载器

2011-11-26

一个用Python写的Pixiv排行榜图片下载器,基本上有了她以后,你就能明白为什么店长的新番扫雷总是一堆高质量的配图以及为什么有些死宅的桌面总是那么触及心灵。

原是好友NStal的点子,这家伙野心很大,除了实现功能以外还正在BeautifulSoup的基础上写一个类似jQuery的页面爬取器。我作为一个Python初心者,我还是安心发明轮子好了。

说明:

  1. 当然你需要先有Python和wget。
  2. 然后下载Beautiful Soup,并将BeautifulSoup.py与pixivCrawler.py置于相同目录下。
  3. 默认的保存位置是Windows的D:\pixiv,可以在代码第4行修改,修改时请注意格式(类似F:\Pictures\pixiv,不要在最后加 \)。
  4. 运行后会在上面的文件夹内生成monthly、weekly、daily三个子文件夹以及这三个子文件夹内的以今天日期为名的子子文件夹,日期文件夹内为图片。
  5. 图片的命名规则是:排行数-画师id-图片id-该图片的pixiv域名号
  6. 如果是图集命名规则是:排行数-画师id-图片id_p图集内次序-该图片的pixiv域名号
  7. 这样的命名规则有助于找到原地址,即http://www.pixiv.net/member_illust.php?mode=medium&illust_id=图片id 和 http://img域名号.pixiv.net/img/画师id/图片id.格式
  8. 默认下载前一个月、前一周、昨天的全部排行前100,如果只想下前50,可以把最后的for循环改为range(1,2),其他类推;如果只想下monthly,可以只保留for循环内的download('monthly',str(i)),其他类推。

地址:https://github.com/mescoda/pixivCrawler

< >