1. 程式人生 > >資料之路-民宿市場資料解讀(一)

資料之路-民宿市場資料解讀(一)

筆者有個朋友,北上廣打拼多年,每天加班加點,披星戴月…終於不堪折磨,萌生退意,想要歸隱山林,開個農家院收租為生…

在無情的嘲笑了他後,筆者也很好奇,到底民宿市場如何?做民宿到底賺不賺錢?什麼樣的民宿比較賺錢?使用者都是哪些人?

帶著這些問題筆者開始了民宿市場的探尋之路。

先使用python在某短租平臺數據爬取資料,筆者爬取該平臺記錄的全國城市的民宿資訊並生成統計 在這裡插入圖片描述

爬取北京的民宿資訊,併合並統計 在這裡插入圖片描述

讓我們先來看一看短租房源的全國數量分佈情況

因平臺有最大頁數限制,所以按頁抓取最多隻有300條

如圖所見, 民宿分佈比較集中在東部和東南部地區,東部沿海和京津冀一帶民宿資源比較豐富,幾乎每個城市都有300個以上的民宿資源可以提供;中部地區除幾個省會重點城市民宿資源在300條,其餘主要都在100-200 甚至100個資源以下。而西部地區分佈就比較稀疏了,除了幾個重點城市有資源提供,其他地區並沒有資源登記。

這基本反應了我國的旅遊資源的地域差異和遊客的旅遊傾向,目前來看,旅遊資源扎堆存在是比較合理的,但如果選在一個民宿資源不那麼集中地方會不會賺錢呢?這個我們需要更多的資料來做對比分析,希望後續有機會能深入分析。

看了全國的民宿分佈情況,讓我們聚焦到北京,來看看北京的民宿分佈圖:

這是根據經緯度生成的北京地區的民宿分佈,圖中可見市內六區分佈比較集中,隱約可見地鐵沿線分佈較多,而城郊地區多按景區分佈。

因某短租平臺網站安控的比較嚴,爬取一段時間資料就會被限制訪問,且單頁面資料非常精簡,所以這裡沒有抓取到充分的資訊來支援更多的交通分佈情況,後續補充。

再來看一下價格分佈情況:

來看各區的平均價格對比圖,一直認為城區應該房子價格更貴的小夥伴們是不是很吃驚?資料顯示,民宿平均價格最低的區是房山,均價只有248元,而均價最高的居然是懷柔區,價格在1342元,以高房價著稱的西城區,均價在477。

當然,因為均值有很大的被平均性,所以我們再來看看其他指標:

通過價格最大最小值,我們能看見,房山的總體價位都是偏低的,區間在79-426,市內六區總體的分佈區間都比較均衡,大體200-700左右,而城郊總體價位都要偏高一些,最高價出現在順義,一天6288元。

再看標準差,很容易就能發現,市內六區價格相對都比較平均,價格差別不是很大,而順義、懷柔、平谷等城郊地區,價格差異還是很大的。 為什麼順義、懷柔等價差這麼大,我們來看一下各區的房源資訊對比:

通過房型資訊,我們大致可以推斷出房屋面積的差別。可見民宿資源還是小戶型居多,市內六區的房子基本都是小戶型,以一室一廳、一室零廳為主,最大到兩室。三室以上的房子,基本就都在城郊地區了。 我們以三室一廳為例,看見懷柔就有三個房源,價格從900-1580,另外都是平谷、延慶、門頭溝等地了。上圖中順義那間價值6288元的民宿,顯示為6室四廳。有興趣的朋友可以測算一下,是市內的小房子和郊區的大房子,哪個先收回本金呢?

我們再來看下大體每個戶型的對應價格:

上圖描述了每個區的每種戶型的平均價格,我們先看看一室零廳,懷柔最貴**(523),房山最便宜(239);一室一廳,懷柔最貴(580),房山最便宜(256)**;而兩室的房子中,懷柔的價格基本都是最貴的。 當然,這裡僅從區域、戶型、價格幾個維度,無法完全體現出價格差異的原因,期待後續的資料補充。