秋天是秋高气爽、秋风瑟瑟的季节。农民伯伯在辛勤地收谷,秋天的大树落下了好多树叶像翩翩起舞的蝴蝶。夕阳的金辉把绿色的林海染成金黄一片。
继续鼓捣爬虫,今天贴出一个代码,爬取点点网「美女」标签下的图片,原图。
# -*- coding: utf-8 -*-
#---------------------------------------
# 程序:点点美女图片爬虫
# 版本:0.2
# 作者:zippera
# 日期:2013-07-26
# 语言:Python 2.7
# 说明:能设置下载的页数
#---------------------------------------
import urllib2
import urllib
import re
pat = re.compile('<div class="feed-big-img">\n.*?imgsrc="(ht.*?)\".*?')
nexturl1 = "http://www.diandian.com/tag/%E7%BE%8E%E5%A5%B3?page="
count = 1
while count < 2:
print "Page " + str(count) + "\n"
myurl = nexturl1 + str(count)
myres = urllib2.urlopen(myurl)
mypage = myres.read()
ucpage = mypage.decode("utf-8") #转码
mat = pat.findall(ucpage)
if len(mat):
cnt = 1
for item in mat:
print "Page" + str(count) + " No." + str(cnt) + " url: " + item + "\n"
cnt += 1
fnp = re.compile('(\w{10}\.\w+)$')
fnr = fnp.findall(item)
if fnr:
fname = fnr[0]
urllib.urlretrieve(item, fname)
else:
print "no data"
count += 1
使用方法:新建一个文件夹,把代码保存为name.py文件,运行python name.py就可以把图片下载到文件夹。
以上就是python爬虫入门好代码教程之点点美女图片爬虫代码分享。只有比别人更早更勤奋地努力,才能尝到成功的滋味。更多关于python爬虫入门好代码教程之点点美女图片爬虫代码分享请关注haodaima.com其它相关文章!