Github 本週最有趣的 10 款「機器學習」開源專案
#世界上最簡單的人臉識別庫
本專案號稱世界上最簡單的人臉識別庫,可使用 Python 和命令列進行呼叫。該庫使用 dlib 頂尖的深度學習人臉識別技術構建,在戶外臉部檢測資料庫基準(Labeled Faces in the Wild benchmark)上的準確率高達 99.38%。
MUSE
#多語言詞向量 Python 庫
由 Facebook 開源的多語言詞向量 Python 庫,提供了基於 fastText 實現的多語言詞向量和大規模高質量的雙語詞典,包括無監督和有監督兩種。其中有監督方法使用雙語詞典或相同的字串,無監督的方法不使用任何並行資料。
無監督方法具體可參考 Word Translation without Parallel Data 這篇論文。
FoolNLTK
#中文處理工具包
本專案特點:
• 可能不是最快的開源中文分詞,但很可能是最準的開源中文分詞
• 基於 BiLSTM 模型訓練而成
• 包含分詞,詞性標註,實體識別,都有比較高的準確率
• 使用者自定義詞典
Arnold
#最擅長玩《毀滅戰士》的遊戲AI
本專案來自卡耐基梅隆大學,是 2017 年 VizDoom《毀滅戰士》AI 死亡競賽冠軍 Arnold 的 PyTorch 開原始碼。
Bottom-Up Attention VQA
#2017 VQA Challenge 第一名
本專案是 2017 VQA Challenge 第一名團隊兩篇論文的 PyTorch 復現。
■ 論文 | Bottom-Up and Top-Down Attention for Image Captioning and Visual Question Answering
■ 連結 | https://www.paperweekly.site/papers/754
■ 論文 | Tips and Tricks for Visual Question Answering: Learnings from the 2017 Challenge
■ 連結 | https://www.paperweekly.site/papers/1441
YOLOv2 - PyTorch
#PyTorch 版 YOLOv2
著名物體檢測庫 YOLOv2 的 PyTorch 版本,本專案還可以將訓練好的 model 轉換為適配 Caffe 2。
Simple Railway Captcha Solver
#基於 CNN 的臺鐵訂票驗證碼辨識
本專案利用簡單的 Convolutional Neural Network 來實作辨識臺鐵訂票網站的驗證碼,訓練集的部分以模仿驗證碼樣式的方式來產生、另外驗證集的部分則自臺鐵訂票網站擷取,再以手動方式標記約 1000 筆。
目前驗證集對於 6 碼型態的驗證碼的單碼辨識率達到 98.84%,整體辨識成功率達到 91.13%。
AlphaZero-Gomoku
#用 AlphaZero 下五子棋
這是一個將 AlphaZero 演算法應用在五子棋的實現,由於五子棋相比圍棋或國際象棋簡單得多,所以只需幾個小時就可以訓練出一個不錯的 AI 模型。
■ 論文 | AlphaZero: Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm
■ 連結 | https://www.paperweekly.site/papers/1297
■ 論文 | AlphaGo Zero: Mastering the game of Go without human knowledge
■ 連結 | https://www.paperweekly.site/papers/942
gym-extensions
#OpenAI Gym 擴充套件集
這是一個 OpenAI Gym 庫的擴充套件包,實現了包括:多工學習、遷移學習、逆增強學習等功能。
Myia
#Python 深度學習框架
Myia 是一個全新的 Python 深度學習框架,具有使用簡單、自動微分和效能優化的特點。