需求:自己开发的一个视频网站不想把自己上传视频和封面图片,因为一个一个上传视频文件和封面图片还是很费时间的,想着直接抓取点b站上的视频iframe分享的链接和图片链接到我的数据库中,这样网站就很快就填充起来了,看着就丰满多了(单纯是为了让我开发的系统看着有数据丰满点好看)。
思路分析:爬取大量的iframe代码和视频标题以及视频封面照片的链接保存到数据库就行。当然如果您是要爬取后把视频文件也下载到自己电脑的话,也可以用java代码实现的哦。
实际操作:
1、先用浏览器打开b站,开发者模式(浏览器开发者模式可以f12打开)进入network面板分析下数据,一般网站都是前后分离的,页面上的动态数据一般都是发送ajax请求后台接口获取到的(当然也有那种提前渲染的,那种不在咱爬取的行列
2、最好是找那种带分页的页面去分析爬取数据。
3、点击一个一个的请求分析请求头和响应数据(主要是看响应,找那种返回是json格式的)
我这里找到一个这样的接口
4、开始写java代码
1 | ini复制代码public static void main(String[] args) throws Exception { |
5、运行第4步的代码就可以把数据轻松保存到数据库(运行程序的时间可能有点长)
6、最后直接运行我的系统后的效果:
有什么不懂得再q我1913284695。
本文转载自: 掘金