声明:本文只作学习研究,禁止用于非法用途,否则后果自负,如有侵权,请告知删除,谢谢!
@[TOC](scrapy爬虫之猎聘招聘信息爬取
1.项目场景
目标网址:www.liepin.com/zhaopin/?ke…
2.准备工作
2.1 创建scrapy工程:scrapy startproject liepin_spider
2.2 创建scrapy爬虫:scrapy genspider liepin ‘www.liepin.com/zhaopin/‘
2.3 配置settings、代理、数据库连接等
3.页面分析
3.1 如下图
4.编写代码
4.1 爬虫代码
1 | python复制代码 |
4.2 数据库连接代码
1 | python复制代码# -*- coding: utf-8 -*- |
3.3 Items代码
1 | python复制代码 |
4.4 Pipelines代码
1 | python复制代码# -*- coding: utf-8 -*- |
4.5 Middleware中间件代理配置代码
1 | python复制代码# -*- coding: utf-8 -*- |
4.6 运行代码
1 | python复制代码import os |
5.运行代码
5.1 我们来看看最后运行的代码效果
5.2 数据基本都实现获取了,最后我把岗位关键词、地区数据、爬取结果表结构贴一下吧~
本文转载自: 掘金