1. 程式人生 > >GitHub十週歲HanLP自然語言處理包使用者量超越CoreNLP

GitHub十週歲HanLP自然語言處理包使用者量超越CoreNLP

在本週,GitHub終於度過了屬於它自己的十週歲生日。這個在2008年由3個來自舊金山的年輕人建立的基於Git的程式碼託管網站,先後超越了元老級的SourceForge和背景強大的Google Code,成為了全世界範圍內最受歡迎的程式碼託管網站。

 

“十年前的今天,GitHub 正式上線。最一開始,我們只有一個特別簡單的目標:連結所有的開發者,讓他們用Git更輕鬆地進行專案協作。”聯合創始人Chris Wanstrath在部落格裡寫道,“十年過去了,我們作為公司,作為平臺都有了很大的變化,但GitHub存在的意義從未改變。”

截至到去年5月底,GitHub完成了第1億個PR合併請求命令。截至今天,GitHub

上已經能夠擁有超過8000萬個repo,活躍使用者達到2700萬人,超過150萬家公司和機構進駐。大快搜索的HanLp自然語言處理開源專案同樣進駐了GitHub

GitHub團隊作為對十週年的紀念和慶祝,並沒有像大多數公司一樣選擇回顧公司的發展歷史,而是整理了一份過去十年的幾大里程碑事件。這份光榮,不止屬於平臺自己,更是屬於那些為了讓這個世界變得更好,通過GitGitHub、用JSPython和各種語言共享程式碼的人們。

GitHub十週年之際,大快搜索AI研究小組的,自然語言處理專家Hancks所主持的HanLP開源專案,全球使用者量首次超過了斯坦福大學的CoreNLP,以及老牌的自然語言處理開包Ansj

,成為全球範圍內最受開發人員喜愛的自然語言處理技術。

2014年首次釋出,通過3年的不斷迭代,HanLP的分詞準確性和分詞速率得到了極大的提升。據阿里楊尚川的一份測評報告顯示,HanLP的分次準確率在全球排名第三,分詞速度在全球排名第一。卓越的效能自然帶來了大量的使用者。終於,在太平洋時間1025日,GitHubHanLP的使用者量超過Stanford-CoreNLP

自然語言處理是人工智慧的一個重要分支,HanLP的使用者量證明了國產技術的高效能與可靠性,也再一次證明了大快搜索用心做技術、專注於大資料與人工智慧基礎軟體的決心。大快今後也將開發出更多元件用於建設大資料與人工智慧生態,繪出人工智慧與大資料的中國智慧。