明霞山资源网 Design By www.htccd.com
自己写了玩的一个小脚本,百度图片下载
import re
import os
import requests
import hashlib
def dowmloadPic(html, keyword):
pic_url = re.findall('"objURL":"(.*",', html, re.S)
if len(pic_url) < 1:
return 1
i = 0
for each in pic_url:
print(i + 1, end=',')
md5Str = hashlib.md5(each.encode("utf-8")).hexdigest()
# 抓去链接
oneStr = md5Str + ' ' + keyword + ' ' + each + '\n'
with open('downText.txt', 'a+') as f:
f.write(oneStr)
# 下载图片
# try:
# pic = requests.get(each, timeout=10)
# except requests.exceptions.ConnectionError:
# print('链接超时,跳过此操作')
# continue
#
# kz = os.path.splitext(each)[-1]
# photo = + keyword + '_' + str(i) + kz
#
# with open(photo, 'wb') as f:
# f.write(pic.content)
i += 1
print('\n')
return 0
if __name__ == '__main__':
word = input('enter a key word:')
page = input('enter the page:')
page = int(page)
page = 1 if page < 1 else page
url = 'http://image.baidu.com/search/flip?tn=baiduimage&ie=utf-8&word=' + word + '&ct=201965323&v=flip'
p = 1
while (p <= page):
print(word + ',第[' + str(p) + ']页:')
pn = (p - 1) * 20
url = url + '&pn=' + str(pn)
result = requests.get(url).content.decode('utf-8')
code = dowmloadPic(result, word)
if code:
print('无相关数据,提前退出程序')
break
p = p + 1
print('程序结束')
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持。
明霞山资源网 Design By www.htccd.com
广告合作:本站广告合作请联系QQ:858582 申请时备注:广告合作(否则不回)
免责声明:本站文章均来自网站采集或用户投稿,网站不提供任何软件下载或自行开发的软件! 如有用户或公司发现本站内容信息存在侵权行为,请邮件告知! 858582#qq.com
免责声明:本站文章均来自网站采集或用户投稿,网站不提供任何软件下载或自行开发的软件! 如有用户或公司发现本站内容信息存在侵权行为,请邮件告知! 858582#qq.com
明霞山资源网 Design By www.htccd.com
暂无评论...
RTX 5090要首发 性能要翻倍!三星展示GDDR7显存
三星在GTC上展示了专为下一代游戏GPU设计的GDDR7内存。
首次推出的GDDR7内存模块密度为16GB,每个模块容量为2GB。其速度预设为32 Gbps(PAM3),但也可以降至28 Gbps,以提高产量和初始阶段的整体性能和成本效益。
据三星表示,GDDR7内存的能效将提高20%,同时工作电压仅为1.1V,低于标准的1.2V。通过采用更新的封装材料和优化的电路设计,使得在高速运行时的发热量降低,GDDR7的热阻比GDDR6降低了70%。