用Python分析WordPress官網所有外掛的開發者資訊(續以及人物介紹)
前言
書接上回,上一篇裡我們講了一點資料分析的思路和方法,順帶分析了一下WordPress.org上所有外掛的作者資訊,得到了幾個資料,比如外掛數量Top10的作者、作者的區域分佈等等。本篇作為補充,關於開發者的分析還可以從時間維度分析,比如
- 最早期的給WordPress開發外掛的是哪些人呢?
- 每年的外掛數量增長情況如何?
- 活躍的WordPress開發者平均多久會發佈一個外掛?
思路
這次主要用到的欄位是 added
,也就是外掛釋出到Wordpress.org的日期。
和上次只用到一個key不同,這次我們可能需要多用到幾個key,所以可以使用Python字典物件的另一種方法 del
。
具體來說,就是在迴圈jsonline檔案的時候,每一行就是一個外掛資訊,把不需要的key全部刪除掉,只保留需要的key,再把更新過的整個字典物件加入列表中即可,這樣就不用每次都手動構造一個新的字典物件了。
最早期的給WordPress開發外掛的是哪些人呢?
早期是多早?根據Wikipedia上的記錄,2004年5月釋出的 WordPress 1.2 開始支援外掛系統(話說那時候Matt也就剛剛20歲啊。。。好年輕啊)
New plugin architecture: The new plugin architecture simplifies modifying or extending WordPress’ features. Plugins can now hook into nearly every action WordPress does.
那我們就把早期定義在04-05年,這已經算是很早期了,在那時候就開始開發WordPress外掛的到現在都是一些元老級人物了,打個不恰當的比方,也相當於是1921年上過嘉興南湖那條小船的了。
下面是程式碼:
我們都聽過錢鍾書的那個故事,一位美國的女讀者喜歡錢鍾書的作品,想要登門拜訪他。錢鍾書在電話中婉言拒絕了這位女士,拒絕的理由是:“假如你吃了個雞蛋,覺得不錯,何必要認識那下蛋的母雞呢?”
恰恰相反,我更喜歡去認識母雞,甚至有時候覺得母雞的故事比雞蛋本身更有吸引力。具體來說,就是我對開發者的一些經歷、經驗、八卦故事更感興趣,甚至之前對著man手冊上的名字去挨個搜尋開源屆的這些大拿人物。。。不知道是閒的還是為了什麼,總之,程式碼背後都是活生生的人(也有的已經故去)
以下就是用上面的方法得出的幾個最早的開發者,我看了一下他們的網站,都挺有意思的,說不定以後可以做一個WordPress名人堂who is who之類的專題吧,這裡面有意思的人肯定很多啊。下面就先來認識幾個WordPress的早期開發者吧
Matt Mullenweg

Matt大神不用介紹了吧,WordPress創始人,從上面的結果可以看到第一個外掛也是他釋出的
Dougal Campbell


有沒有感覺這位Dougal老哥長的有點像賈冰?
WordPress元老級人物,Mutt對他評價也挺高的。
看了Dougal的部落格文章 Important People 才知道,原來在2010年還一場WordPress業界還有一場挺火爆的 協議之爭。
WordPress創始人Matt Mullenweg認為Chris Pearson(WordPress Thesis主題框架的開發者)的做法違反了WordPress所遵守的通用公共許可(GPL)協議。雙方爭執不下,並有可能走上法庭,這會對免費軟體釋出帶來哪些影響呢?遵守GPL協議的程式碼必須做到免費、開源,並且相關的“第三方”程式碼也必須遵守GPL。Mullenweg認為GPL是WordPress世界的“權利法案”,因為它可以保護核心的自由
顯而易見Dougal肯定是支援Mutt的,而且還在文章中diss了Pearson一把,Pearson自稱是 “one of the top three most important figures in the history of WordPress. ”,Dougual老哥說在文章裡說,老子才是啊,你是老幾。Mutt在下面回覆說你就是我 心目中的前三。 Dougual老哥說“看到沒,官方認證啊!”。真是啪啪打臉啊。挺逗的:smile:
有意思的是他還把Brian Gardner of StudioPress 作為一個正面例子列出來,這個名字我一看太眼熟了:smile:, StudioPress 這不就是最近我一直在樂此不疲研究的主題框架Genesis的開發商嗎
Ryan Boren

Ryan也是一個WordPress的元老級人物,曾供職於 Cisco ,是WordPress的主導開發者, 對外掛系統有很大貢獻 ,現已榮譽退休。他個人部落格上的一些推薦閱讀列表也資訊量挺大的,值得好好看看
Chris J. Davis

這哥們挺有意思的啊,竟然跑去拍片了, 個人網站 上介紹自己是一個開發者和製片人, 粗粗看了一下好像還是恐怖片:scream:,不得不說國外的程式設計師們的生活還真是挺精彩的,Ruby On Rails的創始人DHH是業餘一名國際賽車手,Python 大神kennethreitz玩攝影玩出了一個勵志故事。。。這種例子真是很多了
就像 這個知乎問題:為什麼感覺國外的程式設計師更專業? 裡高票回答所說的:
在中國任何一個角落,碼程式碼的都會告訴你,35歲之後就會碼不動了,招聘廣告也會寫明,20~35歲,你35之前不從程式碼轉管理,你死定了等等等等。聽我混網際網路行業的兄弟說,幹過2年以上可以算得上高階程式設計師,5年以上就可以上到技術經理,再往上最好到30之前就爬到技術總監。說得彷彿人生必須在40歲之前完結一樣。
又扯遠了
每年的外掛增長量如何?
這部分也很簡單,就是把每年的外掛數量彙總統計一下,直接用柱狀圖或者折線圖顯示出來就可以了。
這種時間序列的資料還有一種比較花哨的圖表可以用一下,就是heatmap熱力圖,通過色彩變化來顯示資料。比如Google之前的個人搜尋頁面上有這種圖,可以看出你每天每個時間段使用Google搜尋的次數,github上的提交記錄也是一種熱力圖。效果如下
活躍的WordPress開發者平均多久會發佈一個外掛?
理論上這個分析也是可以統計出來,但是後來想想太麻煩了,而且沒什麼太大意義,純粹是為了統計而統計。。。這種資料沒什麼參考價值,各個外掛的開發速度沒啥可比性,都是由功能和開發者能力來決定的。算了
未完待續
關於開發者的維度差不多就這些了,下次繼續分析一下外掛的下載量、評分等情況。