1. 程式人生 > >基於某知名招聘網站的上海財務崗位資料分析(含excel視覺化)

基於某知名招聘網站的上海財務崗位資料分析(含excel視覺化)

1.前言:

之前博主在學習PYTHON的爬蟲,正好有一個很要好的朋友向我詢問上海財務崗位的招聘資訊,便爬取了XX網當時上海財務崗的招聘資訊。 爬蟲採用了PYTHON2.7。其實博主是很看好PYTHON3.4,無奈相關的包並沒有全方面完美支援,網上的教程也面向的是2.7,於是乎依舊採用了2.7。題外話,PYHTON爬蟲比較成熟的框架是SCRAPY,不過本文並沒有採用。另需注意,下面附上的程式碼不包含代理,目標網站的反爬機制比較成熟,短時間大量訪問會被強制驗證碼認證,甚至會鎖IP(我的IP曾經被鎖了2周,很後悔沒用代理池)。 當時爬取下來的原始資訊一共4040條,直接儲存在MYSQL資料表中。採用的分析工具為EXCEL2010......雖然大家都看不起EXCEL,但EXCEL2010的確可以儲存一百萬行,考慮到執行速度,十萬條以內的資料採用EXCEL2010,完全可以滿足需求的。

2.爬取資料


PYTHON 程式碼截圖

此處省略逐條解讀

爬取程式中採用了偽造header。然後通過正則表示式搜尋7類有用資料(依次為崗位資訊,URL,職位關鍵概述,年薪,學歷,工作經驗,公司名字),返回的資料存入MYSQL。通過SQLyog預覽為
值得注意的是: 返回的公司名稱項若出現’符號,會與插入MYSQL的語句衝突。 解決辦法有兩種,第一種 新增語句b=item[6].replace("'",'') #以字串形式去除替換掉'符號 第二種採用TRY,EXECEPT語句繞過異常
我採用了第一種,以保持資料的完整性。

3.觀察並處理資料(資料清洗)

將該資料儲存為.csv字尾,再用EXCEL觀察和處理。


由於爬取過程中就注意了內容的選取,原始資料較為齊整,但依然要進行結構化處理,即資料清洗。 如去除崗位的前2個字元“招聘”,公司的前2個字元“公司”,而薪水項和工作經驗項要處理為純數字形式 暫時不需要的內容進行隱藏 (1)去除重複項 現在的公司喜歡搞個招聘的名義打廣告,實際的招聘並不開展,不停的釋出重複崗位,於是要刪除重複項


(2)初步處理,去除缺失項比較多的資料 (3)運用函式對字串處理 如:使用到了內建函式=RIGHT(A1,LEN(A1)-2)去除字元“公司”“招聘”......
針對年薪項進行資料清洗: 因為企業給出的工資往往為幾萬-十幾萬薪水,這不是明確資料,不能用作統計,所以將該項拆分為最低值和最高值,然後取其平均值。 至於那些說“面議”的公司,我是真的無語了,將其替換為0處理,又不妥,只能放著了 使用函式=FIND("-",D1),找到-符號位置
使用函式=LEFT(D1,FIND("-",D1)-1)找到最小值
使用函式=MID(D1,FIND("-",D1)+1,LEN(D1)-FIND("-",D1)-1)找到最大值
將最大最小值轉化為數字後,對其取平均值average(,) 這樣就得到了該職位的預期年薪
針對工作經驗進行資料清洗: 首先替換經驗不限為0
然後故技重施,

這樣工作經驗項變為了純數字
(4)展示結果 經過清洗規整後的資料為下圖所示:

只有規範後的標準數字才可以用於統計和分析

4.分析

將處理完的資料匯入EXCEL的資料透視表 1.列出用人單位最熱衷招聘的財務崗位
但我不得不吐槽,招聘網站上的職位千奇百怪,


什麼樣的職位都有,赫然看到一個JAVA工程師,固然我知道全世界都在招聘JAVA工程師,但你現在混進我的財務崗分析顯然不妥 於是篩選一下,列出公司計數項>2的職位名稱,共計129個:

常見的財務工作列表如下:

總賬會計主管 總賬會計(3-6個月) 總賬會計 總帳會計 資深總賬會計 資深會計 資金專員 資金經理 資金會計註冊會計師 主管會計 主辦會計 證券事務代表 債券承做崗(專案經理) 債券承做崗 應收應付會計 應收會計 應付會計 銀行會計 銷售總監 銷售助理 銷售經理 專案助理專案經理 專案會計經理 專案會計 專案財務經理 往來會計 投資總監 投資經理 投行專案經理 稅務總監/稅務經理稅務總監 稅務專員 稅務主管 稅務經理 稅務會計經理 稅務會計 審計總監 審計專員 審計主管 審計專案經理 審計師 審計經理/主管審計經理 涉外會計 融資經理 內審經理 內控經理 內部審計經理 金融產品經理 結算專員 集團財務總監 集團財務副總經理 基金會計主管 基金會計經理 基金會計 會計專員會計助理 會計主管 會計文員 會計師 會計經理 會計核算經理 會計核算崗 會計管理經理(盡調方向) 會計管理經理 會計高階經理 會計崗 會計出納 會計/財務 會計 核算會計主管 核算會計 管理會計 高階銷售經理 高階投資經理 高階審計經理 高階會計經理 高階會計 高階風控經理高階財務經理 風控總監 風控經理 費用會計 出納員 出納會計 出納 成本經理 成本會計主管 成本會計 財務總經理 財務總監(上海) 財務總監 財務專員 財務助理財務主管 財務預算經理 財務經理/主管 財務經理/會計經理 財務經理財務會計專員 財務會計主管 財務會計 財務管理 財務副總經理 財務副總監 財務副經理 財務分析主管 財務分析師 財務分析經理 財務分析 財務出納 財務部長 財務部經理財務/會計助理 財務/會計 財務Senior Accountant CFO AP Accountant Accountant/會計Accountant 

如圖所示:
會計以及細分會計(財務會計,成本會計,會計師)是最火的崗位,佔全部樣本的4成以上 財務經理15% 財務總監13% 財務總監和財務經理類高階崗位佔比為28%,財務類的高階人才是各大公司所需求的。 審計類崗位(審計,審計經理)佔比2%,並不吃香。也跟事務所審計工作大多數面向各大學應屆畢業生校招有關,在獵頭網站的社招中並不顯眼。 出納職位佔比不到5%,在微小型企業,會計往往身兼出納職責。
2.收入最高的工作 大家最關心的一定是收入最高的工作,下面就列出常見財務崗位的年薪酬: CFO177.88 
投資總監 74.44 
財務總監 53.80 
財務副總監 50.63 
高階財務經理 40.00 
投資經理 37.07 
基金會計 34.91 
會計經理 34.47 
財務分析經理 33.22 
財務會計主管 32.57 
註冊會計師 32.56 
財務經理 30.35 
審計經理 29.90 
高階會計 29.13 
會計師 25.91 
證券事務代表 24.71 
會計主管 23.38 
審計專員 19.08 
稅務會計 18.92 
財務主管 18.09 
主辦會計 16.81 
Accountant 16.00 
財務會計 15.67 
總賬會計 15.17 
會計 13.79 
應收會計 13.00 
成本會計 11.56 
應收應付會計 11.38 
財務 11.00 
費用會計 10.57 
總帳會計 10.43 
核算會計 10.33 
主管會計 10.33 
財務專員 9.92 
會計專員 9.86 
應付會計 9.58 
出納 8.84 
財務助理 8.40 
會計助理 8.36 
往來會計 7.50 
出納員 6.64 



如圖所示,CFO(首席財務官)平均預期收入177萬,排在第一,但其實時點的樣本量有限,只有八家公司在招聘這個職位。而且在內地,首席財務官並不是必設項,許多公司以財務總監行使CFO的職能。投資總監,財務總監高職位的工作薪水超過五十萬,是當之無愧的金領工作。財務類經理和基金會計在34萬左右,市場熱門的註冊會計師在33萬,如圖所示會計類工作的工資高低不均,705個會計職位的平均工資為16萬。 其中基金會計的收入甚至高過了經理和主管,可見基金行業對基金專業類會計的渴求。
從平均工資來看,審計23.7萬,會計16萬,出納8.8萬。然而其中樣本量不同,審計的樣本包含審計員(13個)和審計經理(10個),樣本偏少,可能造成虛高,會計樣本705個,出納樣本67個。


3.財務從業人員的總體收入



附上財務工作收入分層餅圖: 從事財務工作的貧民佔21%,小康佔41%,中高收入階層佔24%,富人佔14%(大多數是從事CFO,財務總監的職位)。

參考某資料網站對上海招聘網站得到的月平均工資9845元,全年11.76萬元,在上海從事財務工作待遇明顯好於平均職位。(作為一個上海的工作族,我想說招聘網站的收入和實際收入水平絕對有較大出入,不過考慮到資料都採集於招聘網站,都虛高的情境下,還是有對比性的)。


4.平均收入和學歷的關係
很明顯學歷越高,崗位的預期薪水越高。財務崗位本科薪水在31萬,碩士46萬,MBA36萬,博士52萬。至於為什麼和實際情況出入那麼大,第一可能歸因於企業這裡是稅前,第二可能是企業招聘時存在虛假煙霧彈,第三招聘網站的招聘資訊和實際工作存在出入。
5.求職單位所需求的工作經驗


由圖可見,無工作經驗的職位佔12%,1-3年的職位(佔40%),4-5年(佔25%),10年及以上佔10%。工作經驗基本以0,1,3,5,10為限

以上資料不可用於商業目的,用於博主的自我學習和文案寫作練習。