python 爬萌妹子图片

无聊爬一下萌妹子的图片玩玩


'''
爬萌妹子图片
'''

import re
import os
from urllib import request

page = 0  # 从第几页开始爬,如果要想从第一页开始爬那么应该是 1-1 = 0
max_page = 5  # 最多爬几页
while(page < max_page):
    page +=1

    baseurl = 'https://www.suibianlu.com/meitu_' + str(page)
    r = request.urlopen(baseurl)  # 打开连接
    htmls = r.read()  # 网站 html
    html_text = str(htmls, encoding='utf-8')  # 解码后的网站 html
    html = re.findall('<ul class="list-meizitu border pd5 mb10 clearfix">([\s\S]*?)</ul>', html_text)[0]
    imgurl = re.findall('.html" target="_blank"><img src=([\s\S]*?) alt="([\s\S]*?)"><p class="i32 f-hui">', html)

    path = 'img-meizi'
    img_path = os.path.abspath('.') + os.sep + path + os.sep  # 图片文件夹绝对路径
    # 没有图片文件夹则创建文件夹
    if (os.path.exists(img_path) is False):
        os.makedirs(img_path)

    for img in imgurl:  # 循环下载图片
        title = img[1]
        imgget = request.urlopen(img[0]).read()  # 循环请求每一个连接
        with open('%s/%s.jpg'%(path, title), 'wb') as openimg:
            openimg.write(imgget)  # 写入循环请求连接的内容(即图片)
        print('正在下载:%s'%title)

运行方式

  1. 新建一个文件以 .py 结尾比如: downloadimg.py
  2. 打开终端执行
python downloadimg.py