首页 » Python » python爬虫

python爬虫作业-第一次测试

 

总结: 出现错误最多的是print老不喜欢加括号。 正则匹配,竟然可以通过.{2}匹配长度,不过最后会舍弃有点不太好。 字典类的真的是丈二和尚摸不着头脑。需要补充下这类的知识了。 > (5分) 分别打印 a 与 b 加/减/乘/除/幂/商/余数的各个结果 … 阅读全文

采集b站全网站视频播放量

 

采集b站全网站视频播放量原理: 因为b站的url都是比较有规律的,所以直接可以直接生成所有视频的url(大概700多万条),然后用火车头直接抓取播放数据就可以了。 采集b站全网站视频播放量所遇到的问题: 采集b站全网站视频播放量问题1:数据量太大,一个表格无法 … 阅读全文