首页 » Python » python学习循序渐进一:python爬虫抓取网页标题

python学习循序渐进一:python爬虫抓取网页标题

 

抓取百度首页的标题并输出到1.txt里的python脚本

# -- coding: utf-8 --
import sys,urllib2,re #调用库
reload(sys)
sys.setdefaultencoding("utf-8") 
html3 = open('C:/Users/Administrator/Desktop/1.txt','w') #读写模式,1.txt,准备写入值,有不同的模式,a,w等自行查询
html = urllib2.urlopen('http://www.baidu.com/').read() #使用urllib2抓取百度首页并赋值给html
html2 = re.search(r'(.*?)',html).group(1).decode('utf-8') #使用正则匹配标题的内容并转码后赋值给html2
#print html2 #这个是测试结果用的
html3.write(html2) #输出html2到1.txt

原文链接:python学习循序渐进一:python爬虫抓取网页标题,转载请注明来源!

2