原理说明
基于spalsh或者selenium的渲染后HTML,通过配置文件解析,入库。
提高了效率,一天可以写几十个配置dict,即完成几十个网站爬虫的编写。
配置文件说明:
1 | 复制代码{ |
完整代码参考
1 | 复制代码# -*- coding: utf-8 -*- |
本文转载自: 掘金
开发者博客 – 科技是第一生产力
基于spalsh或者selenium的渲染后HTML,通过配置文件解析,入库。
提高了效率,一天可以写几十个配置dict,即完成几十个网站爬虫的编写。
1 | 复制代码{ |
1 | 复制代码# -*- coding: utf-8 -*- |
本文转载自: 掘金