python使用批量下载图片

556次阅读

没有评论

没想到吧，我们居然可以用python去下载图片，关于单个下载内容，之前已经出了教程告诉大家，大家应该都知道，图片跟文字似的，经常多个发布，我们如果想得到很多个图片，还得一个代码或者一个图片源的去敲击吗？如果不需要，那又该怎么做呢？

使用环境：python3+pycharm+requests+re+BeatifulSoup+json

步骤：

1、然后找到你需要下载图片的网站。

2、找到需要下载的图片，在搜索界面查看源码。

3、我们尝试能不能获得一个简单通用的url地址。

代码与总结

import requests
from urllib import parse
from bs4 import BeautifulSoup
import re
import json
header = {
 'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36',
 'Cookie': 'wluuid=66; ',
 'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3',
 'Accept-encoding': 'gzip, deflate, br',
 'Accept-language': 'zh-CN,zh;q=0.9',
 'Cache-Control': 'max-age=0',
 'connection': 'keep-alive'
 , 'Host': 'stock.tuchong.com',
 'Upgrade-Insecure-Requests': '1'
 }
def mkdir(path):
 import os# 引入模块
 path = path.strip()# 去除首位空格
 path = path.rstrip("\") # 去除尾部  符号
 isExists = os.path.exists(path) # 判断路径是否存在 # 存在 True # 不存在 False
 if not isExists: # 判断结果
 os.makedirs(path)# 如果不存在则创建目录 # 创建目录操作函数
 return True#print (path + ' 创建成功')
 else:
 # 如果目录存在则不创建，并提示目录已存在
 #print(path + ' 目录已存在')
 return False
def downloadimage(imageid,imgname):##下载大图和带水印的高质量大图
 url = 'https://weiliicimg9.pstatp.com/weili/l/'+str(imageid)+'.webp'
 url2 = 'https://icweiliimg9.pstatp.com/weili/l/'+str(imageid)+'.webp'
 b=False
 r = requests.get(url)
 print(r.status_code)
 if(r.status_code!=200):
 r=requests.get(url2)
 with open(imgname+'.jpg', 'wb') as f:
 f.write(r.content)
 print(imgname+" 下载成功")
def getText(text,free):
 texturl = parse.quote(text)
 url="https://stock.tuchong.com/"+free+"search?term="+texturl+"&use=0"
 print(url)
 req=requests.get(url,headers=header)
 soup=BeautifulSoup(req.text,'lxml')
 js=soup.select('script')
 path=''
 if not free.__eq__(''):
 js=js[1]
 path='无水印/'
 else:
 js=js[4]
 path='图虫创意/'
 print(js)
 pattern = re.compile(r'window.hits = ([)(.*)(])')
 va = pattern.search(str(js)).group(2)#解析js内容
 print(va)
 va = va.replace('{', '{').replace('}', '},,')
 print(va)
 va = va.split(',,,')
 print(va)
 index = 1
 for data in va:
 try:
 dict = json.loads(data)
 print(dict)
 imgname='img2/'+path+text+'/'+dict['title']+str(index)
 index+=1
 mkdir('img2/'+path+text)
 imgid=dict['imageId']
 downloadimage(imgid,imgname)
 except Exception as e:
 print(e)
if __name__ == '__main__':
 num=input("高质量大图带水印输入1，普通不带水印输入2:")
 num=int(num)
 free=''
 if num==2:
 free='free/'
 text = input('输入关键词:')
 getText(text,free)

这样，整个流程就完成，好啦，大家一定要收藏起来，万一哪天需要批量下载图片了，可以直接导出使用哦。

神龙|纯净稳定代理IP免费测试>>>>>>>>天启|企业级代理IP免费测试>>>>>>>>IPIPGO|全球住宅代理IP免费测试

发表于：Python爬虫

2021-06-02

复制链接

赏

python使用批量下载图片

相关文章：

HTTP代理设置详解：一步步配置指南

什么是Socks5代理IP及其优势

Socks5代理配置教程及注意事项

什么是代理服务器IP：如何选择合适的

国外代理服务器的优势及选择建议

如何找到可靠的免费代理服务器

在线代理服务器的使用与推荐

HTTP代理服务器的设置及应用实例

静态代理IP怎么填写：步骤与示例

海外静态IP的代理选择与配置