來自「正義」程式設計師的反擊之 star 淨網行動

導語:這是來自我們「正義」程式員的反擊,正義可能會遲到,但是從來不會缺席。
我記得從 7 月 2 號,我在公眾號上寫了一篇文章 360%26idx%3D1%26sn%3D13957d7282ceb056cc5bfa1659a64592%26chksm%3Dbd565e348a21d72278b55d804458a5bf0de677bbdf5c88714b9121628ce7fa819261714389da%26scene%3D21%23wechat_redirect" target="_blank" rel="nofollow,noindex">《中國內地 GitHub 造假呈指數級增長,其背後是……》 爆料了 GitHub 上刷 star 的亂象,淘寶上竟然有公開代刷 star 和 fork 的,竟然明碼標價,再到 8 月 25 號我寫的文章 《GitHub 被國人玩出新高度,這是恥辱啊!》 ,上面竟然發現 GitHub 賬號可以被交易,簡直重新整理了我們的認知和新高度,GitHub 註冊日期越早越貴。
雖然我在這兩篇文章上對此行為進行了強烈的抨擊,不僅僅是造假,更嚴重的問題是破壞了 GitHub 上的生態,以後真正好的開源庫和開源專案就很難分辨了。
但是,就在 9 月 3 號一篇文章《石錘 github 買 star 行為》火了,引起了大家的強烈討論和反應。文章中有理有據的對此行為進行了抨擊。但是這可能還不夠吧!
就在今天我瀏覽掘金社群的時候,竟然發現有人做了一個開源專案,並寫了一篇文章,叫:《GitHub 虛假 Star 淨網行動》,作者是 楊蕭玉 。那我們就一起來看看這個開源專案的作者是如何利用技術來實現淨網行動的?
該開源專案的作者在文章中寫道:
這條黑產背後到底隱藏著什麼?GitHub 上還有哪些大笨蛋也曾靠買 Star 矇蔽了大神們的雙眼呢?我寫了個簡單的程式用於挖掘基於 Star 的關係鏈,並進行聚類分析。然後從 CocoaDebug 這個 repo 入手,沿著關係鏈一層層深挖下去。
所以作者,就有了淨網行動的思路,大致如下:

利用的技術棧就是: python3 + GraphQL 。大致內容如下:

說簡單點就是作者用 Python 爬蟲技術,遞迴訪問每個使用者的 repo 庫的情況,進行資料分析及使用者關注情況,來作出判斷,是否有刷 star 和 fork 數的行為。
當然,是利用技術和資料進行分析,也會有分析錯的地方,所以結果並不一定非常準確,僅供參考,存在一定的誤判。
通過這個作者在文中的描述,可以知道,改開源專案的作者利用的技術都是現學現賣,應該是剛剛學習了該項技術,在這裡僅僅是做實驗,拿出來分享罷了。
看到這裡我不禁感慨,看看人家這位開源作者,再看看那些刷量,刷 star 的人,人家在學完技術的時候,利用技術做一些開源專案分享給大家,去淨網逮你們,而你們呢?培訓完程式設計,就知道去刷量,為什麼不實實在在的做個專案去提高自己呢?紮紮實實的提高技術才是真本事。
作為程式設計師就應該好好學習技術,利用技術,使用技術,技術本身就是單純的,程式設計師更單純。不要去做那些偷雞摸狗禍害程式設計師形象的行為。
最後,該開源專案的地址是: https:// github.com/yulingtianxi a/FuckFakeGitHubStars
而作者部落格文章《GitHub 虛假 Star 淨網行動》的地址是: http:// yulingtianxia.com/blog/ 2018/09/16/Fuck-Fake-GitHub-Stars/
歡迎大家關注公眾號:「非著名程式設計師」,關注公眾號,回覆「1024」你懂得。關注我,與 10 萬程式設計師一起進步。