如何优雅地找工作
嗯,标题党了。此文所讲的找工作,不是一般通过浏览招聘网站找工作。此文所讲的找工作,是通过爬虫以及数据分析,自动精确匹配工作机会。如果还是传统的浏览招聘网页,确实有点不够优雅。如果你观望工作,可以做成推送,这样就不会与你理想的工作失之交臂,而且悄无声息。本文以拉勾网为例,爬取一线城市软件测试工作机会的数据。
通过chrome浏览器工具,我们可以发现,拉勾网页的数据,可以通过json获取到。
http://upload-images.jianshu.io/upload_images/689830-fffd2637fb169ed1.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240
发个请求就可以获取,都不需要用爬虫框架。
import requests
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
url = 'http://www.lagou.com/jobs/positionAjax.json?city={}&yx={}&needAddtionalResult=false'
cities = ['北京', '上海', '广州', '深圳']
salaries = ['2k-5k', '5k-10k', '10k-15k', '15k-25k', '25k-50k']
def get_page(url, page_num, keyword):
if page_num == 1:
boo = 'true'
else:
boo = 'false'
page_data = {
'first': boo,
'pn': page_num,
'kd': keyword
}
page = requests.post(url,page_data)
return page.json()
执行起来就是这样的:
http://upload-images.jianshu.io/upload_images/689830-e268ebdc31b4af2d.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240
于是得到了一现城市软件测试岗分布的Dataframe.
统计行,用图例展现出来,就得到了总数分布图,如下:
http://upload-images.jianshu.io/upload_images/689830-666343e0e88d0d8e.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240
从图中可以看出:
帝都机会最多,遥遥领先。
广州最弱,差不多是深圳的一半。
上海深圳相差不大。
把这个Dataframe用图表展现出来,就得到了薪水分布图。
http://upload-images.jianshu.io/upload_images/689830-711a1fd8c898c8ac.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240
此图可以看出:
帝都对中高端测试人员需求较多,分布均匀。
其他城市对5-10K的人员需求较多,薪水越越往上,职位数量呈剧烈直线下降趋势。
由此可以看出,就软件测试行业来看:帝都工作岗位,无论是数量上,还是质量上,都完胜其它城市。
我们都希望自己的工作,钱多,事少,离家近。
事情多少不太好说。但是其他两项,可以统计分析。
我们对上海,15-25K这个区间段为例进行具体分析:
取一些自己感兴趣的tag来爬取数据。
number = count_frame.loc, salaries]
page_number = int(number / 15)
tags = ['companyFullName', 'companyLabelList', 'companySize', 'district', 'financeStage', 'industryField',
'positionAdvantage', 'positionLables', 'positionName', 'workYear']
for page_index in range(1, page_number):
page = get_page(url.format(cities, salaries), page_index, keyword)
page_result = page['content']['positionResult']['result']
jobs = (page_result for index in range(0, 15) for tag in tags)
job_list = list(jobs)
爬出来的数据,保存到excel中,得到一个如下的图表。
http://upload-images.jianshu.io/upload_images/689830-afd7bf0022df0058.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240
首先对公司福利进行统计,为了直观,做了个图。
http://upload-images.jianshu.io/upload_images/689830-33f88b3c50dd99b5.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240
多数公司强调提供发展平台,空间。
也用弹性,氛围来吸引人才。
读取这个excel, 通过dataframe 来filter关键字,就能精确匹配到你期望的工作。
当然,打铁还需自身硬。 期望的工作定位到了,你还得有匹配工作的实力。
加上定时功能,每天就可以定时给你推送了。
http://upload-images.jianshu.io/upload_images/689830-05a3f8debcae791a.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240
注意,现在的网站反爬能力也越来越强。可能一不小心就会是这样。
https://testerhome.com/uploads/photo/2017/4bab510b6d4a2ea73fd1ba891a6981da.png!large
具体如何应对,下回再说。
此方法可以适用其它工作岗位。
最后套用葛大爷的一句话:“我们吃着火锅,唱着歌。”就把工作给定位到了,美哉妙哉。
有水平 有技术、有想法的懒人,就会搞出一些高大上的偷懒方法,赞 到头来还是要弄ip池啊。。。。 可以尝试分析他们app的包。
不是大司,经常对app的请求根本不设防 :lol 6666
页:
[1]