GitHub十週歲HanLP自然語言處理包使用者量超越CoreNLP
在本週,GitHub終於度過了屬於它自己的十週歲生日。這個在2008年由3個來自舊金山的年輕人建立的基於Git的程式碼託管網站,先後超越了元老級的SourceForge和背景強大的Google Code,成為了全世界範圍內最受歡迎的程式碼託管網站。
“十年前的今天,GitHub 正式上線。最一開始,我們只有一個特別簡單的目標:連結所有的開發者,讓他們用Git更輕鬆地進行專案協作。”聯合創始人Chris Wanstrath在部落格裡寫道,“十年過去了,我們作為公司,作為平臺都有了很大的變化,但GitHub存在的意義從未改變。”
截至到去年5月底,GitHub完成了第1億個PR合併請求命令。截至今天,GitHub
GitHub團隊作為對十週年的紀念和慶祝,並沒有像大多數公司一樣選擇回顧公司的發展歷史,而是整理了一份過去十年的幾大里程碑事件。這份光榮,不止屬於平臺自己,更是屬於那些為了讓這個世界變得更好,通過Git、GitHub、用JS、Python和各種語言共享程式碼的人們。
在GitHub十週年之際,大快搜索AI研究小組的,自然語言處理專家Hancks所主持的HanLP開源專案,全球使用者量首次超過了斯坦福大學的CoreNLP,以及老牌的自然語言處理開包Ansj
自2014年首次釋出,通過3年的不斷迭代,HanLP的分詞準確性和分詞速率得到了極大的提升。據阿里楊尚川的一份測評報告顯示,HanLP的分次準確率在全球排名第三,分詞速度在全球排名第一。卓越的效能自然帶來了大量的使用者。終於,在太平洋時間10月25日,GitHub上HanLP的使用者量超過Stanford-CoreNLP。
自然語言處理是人工智慧的一個重要分支,HanLP的使用者量證明了國產技術的高效能與可靠性,也再一次證明了大快搜索用心做技術、專注於大資料與人工智慧基礎軟體的決心。大快今後也將開發出更多元件用於建設大資料與人工智慧生態,繪出人工智慧與大資料的中國智慧。