1. 程式人生 > >金三銀四科學找工作,用python大資料分析一線城市1000多份崗位招聘需求

金三銀四科學找工作,用python大資料分析一線城市1000多份崗位招聘需求

文章每週持續更新,各位的「三連」是對我最大的肯定。可以微信搜尋公眾號「 後端技術學堂 」第一時間閱讀(一般比部落格早更新一到兩篇)

每年的三四月份是招聘高峰,也常被大家稱為金三銀四黃金招聘期,這時候上一年的總結做完了,獎金拿到了,職場人開始謀劃著年初的找工作大戲,作為高薪行業之一的IT行業,程式設計師們也開始瘋狂的往心儀公司投遞簡歷,今年疫情影響是不是會變成「金四銀五」呢?

作為IT人我們要發揮自己的專業特長,如何從各種招聘網上找到滿意的職位?我分析了北京、廣州、深圳三個一線城市的C++招聘崗位資訊,篇幅限制文中只拿出北京深圳的資料分析,讓我們看看C++崗位的招聘現狀,以及如何科學提高應聘成功率。

文末分享本次分析的高清圖表,需要的同學自取。同時我分享原始碼用於學習交流,若對其他崗位感興趣可以自行執行原始碼分析。

需求分析

通過分析招聘網站釋出的招聘資料,得出崗位分佈區域、薪資水平、學歷要求,崗位需求關鍵技能、匹配的人才具有哪些特點?從而幫助應聘者提高自身能力,補齊短板,有的放矢的應對校招社招,達成終極目標獲得心儀的offer。

軟體設計

資料分析是Python的強項,專案用Python實現。軟體分為兩大模組:資料獲取 和 資料分析

詳細實現

資料獲取

request庫構造請求獲取資料

cookie = s.cookies
req = requests.post(self.baseurl, headers=self.header, data={'first': True, 'pn': i, 'kd':self.keyword}, params={'px': 'default', 'city': self.city, 'needAddtionalResult': 'false'},   cookies=cookie, timeout=3)
text = req.json()

資料csv格式儲存

with open(os.path.join(self.path, '招聘_關鍵詞_{}_城市_{}.csv'.format(self.keyword, self.city)), 			   'w',newline='', encoding='utf-8-sig') as f:
    f_csv = csv.DictWriter(f, self.csv_header)
    f_csv.writeheader()
    f_csv.writerows(data_list)

資料分析

欄位預處理

df_all.rename({'職位名稱': 'position'}, axis=1, inplace=True) #axis=1代表index; axis=0代表column
df_all.rename({'詳細連結': 'url'}, axis=1, inplace=True)
df_all.rename({'工作地點': 'region'}, axis=1, inplace=True)
df_all.rename({'薪資': 'salary'}, axis=1, inplace=True)
df_all.rename({'公司名稱': 'company'}, axis=1, inplace=True)
df_all.rename({'經驗要求': 'experience'}, axis=1, inplace=True)
df_all.rename({'學歷': 'edu'}, axis=1, inplace=True)
df_all.rename({'福利': 'welfare'}, axis=1, inplace=True)
df_all.rename({'職位資訊': 'detail'}, axis=1, inplace=True)
df_all.drop_duplicates(inplace=True)
df_all.index = range(df_all.shape[0]) 

資料處理展示

from pyecharts.charts import Bar
regBar = Bar(init_opts=opts.InitOpts(width='1350px', height='750px'))
regBar.add_xaxis(region.index.tolist())
regBar.add_yaxis("區域", region.values.tolist())
regBar.set_global_opts(title_opts=opts.TitleOpts(title="工作區域分佈"),
                     toolbox_opts=opts.ToolboxOpts(),
                     visualmap_opts=opts.VisualMapOpts())
                     
from pyecharts.commons.utils import JsCode
shBar = Bar(init_opts=opts.InitOpts(width='1350px', height='750px'))
shBar.add_xaxis(sala_high.index.tolist())
shBar.add_yaxis("區域", sala_high.values.tolist())
shBar.set_series_opts(itemstyle_opts={
            "normal": {
                "color": JsCode("""new echarts.graphic.LinearGradient(0, 0, 0, 1, [{
                    offset: 0,
                    color: 'rgba(0, 244, 255, 1)'
                }, {
                    offset: 1,
                    color: 'rgba(0, 77, 167, 1)'
                }], false)"""),
                "barBorderRadius": [30, 30, 30, 30],
                "shadowColor": 'rgb(0, 160, 221)',
            }})
shBar.set_global_opts(title_opts=opts.TitleOpts(title="最高薪資範圍分佈"), toolbox_opts=opts.ToolboxOpts())

word.add("", [*zip(key_words.words, key_words.num)],
         word_size_range=[20, 200], shape='diamond')
word.set_global_opts(title_opts=opts.TitleOpts(title="崗位技能關鍵詞雲圖"),
                     toolbox_opts=opts.ToolboxOpts())

資料分析

區域分佈

C++崗位區域分佈,北京 VS 深圳

北京的C++崗位數量比深圳更多,首都buff加持,並且集中分佈在海淀區和朝陽區這兩個區域,中關村位於海淀區,還有位於海淀區西北旺鎮的後廠村,騰訊、滴滴、百度、新浪、網易這些網際網路巨頭扎堆,自然能提供更多的崗位。

深圳的崗位則集中在南山區,猜測鵝廠C++大廠在南山區貢獻了重大份額,第二竟然在寶安區。

學歷分佈

C++崗位學歷分佈,北京 VS 深圳

學歷上兩個城市的本科學歷佔比都是80%以上,北京崗位需求研究生佔比和大專相當。可見大部分崗位本科學歷即可勝任,或許能給即將畢業糾結考不考研的你一些參考。

如果你的學歷是專科,那麼需要加倍的努力,因為留給你的職位並不是很多。同時,從圖表資料來看,深圳的崗位對大專生需求10%而對碩士僅佔2%,或許去深圳比去北京更加友好,emmm...僅供參考。

薪資分佈

C++崗位薪資分佈,薪資單位K。
北京最高薪資 VS 最低薪資

深圳最高薪資 VS 最低薪資

薪資對比沒啥好說的,大家看圖說話,只想說帝都果然財大氣粗。

技能儲備

C++崗位關鍵技能詞雲,北京 VS 深圳

首先在脫離開發走上管理崗位之前,程式設計解決問題能力是最重要,可以看到「程式設計」能力在技能詞雲中佔比最大。

崗位技能詞雲可以看出,大部分崗位要求較高的「演算法、資料結構、Linux、資料庫(儲存)、多執行緒(作業系統)」計算機基礎素養,所以不管你是在校學生準備校招或者職場老人準備跳槽,都需要儲備好這些計算機基礎能力。

同時,除去硬核技術要求,崗位對候選人的軟實力也有要求,比如更加偏愛具備「團隊、協作、學習、溝通」這些能力的候選人,大家在提高技術能力的同時,也要注重這些軟實力的培養。

有個有趣的發現,Linux和window下都有C++開發崗位需求,相對而言Linux下C++開發佔比更多,詞雲更大,如果你對這兩個平臺沒有特殊偏愛,那麼學Linux下開發大概能加大應聘成功率。

本文程式完整原始碼以及高清分析圖表,在公眾號「後端技術學堂」回覆 「工作」獲取。

原創不易,看到這裡動動手指,各位的「三連」是對我持續創作的最大支援。

可以微信搜尋公眾號「 後端技術學堂 」回覆「資料」有我給你準備的各種程式設計學習資料。文章每週持續更新,我們下期見!