python爬虫作业-第一次测试
总结: 出现错误最多的是print老不喜欢加括号。 正则匹配,竟然可以通过.{2}匹配长度,不过最后会舍弃有点不太好。 字典类的真的是丈二和尚摸不着头脑。需要补充下这类的知识了。 > (5分) 分别打印 a 与 b 加/减/乘/除/幂/商/余数的各个结果 … 阅读全文
总结: 出现错误最多的是print老不喜欢加括号。 正则匹配,竟然可以通过.{2}匹配长度,不过最后会舍弃有点不太好。 字典类的真的是丈二和尚摸不着头脑。需要补充下这类的知识了。 > (5分) 分别打印 a 与 b 加/减/乘/除/幂/商/余数的各个结果 … 阅读全文
python学习循序渐进:判断是否出错,让程序继续运转 因为批量抓取的网址有时候就会出现访问不通或者网址错误,经常会导致程序出错,这个时候使用try except就可以让程序跳过错误并继续执行下去啦。非常有用的功能呢。 # -- coding: utf-8 - … 阅读全文
提取url.txt里面的网址并抓取它的标题然后输出到1.txt里的python脚本 # -- coding: utf-8 -- import sys,urllib2,re reload(sys) sys.setdefaultencoding("utf-8") … 阅读全文
抓取百度首页的标题并输出到1.txt里的python脚本 # -- coding: utf-8 -- import sys,urllib2,re #调用库 reload(sys) sys.setdefaultencoding("utf-8") html3 = … 阅读全文