1. 程式人生 > >如何運營一家數據標註公司 (基礎架構篇)

如何運營一家數據標註公司 (基礎架構篇)

科技 巴巴 總監 溝通 face 進行 積極 ado 復雜

數據標註行業,一個因為人工智能崛起而新興的行業。

大多數AI實驗室、初創型AI公司在發展初期如果雇傭大量的人力進行數據標註,就不得不面臨下面兩種處境:首先對公司的管理方面就是巨大的挑戰,在研發產品的同時還得把大量精力放在如何管理大量標註人員身上。其次大量全職的標註人員的薪酬對於初創型公司和研究實驗室也是一個不小的挑戰。

為了更好的協調AI公司、AI實驗室與群體標註人員的供需關系,本文中所指的標註公司就是在這樣的大背景下,應需而生。

技術分享圖片
那麽問題來了,如何運營一家標註公司呢?
本文先從最基礎的標註公司架構開始介紹,不同階段的標註公司的運營是有差別的,可以通過接下來不斷更新的文章中獲取跟多的信息。

最基礎的標註公司應該具備以下4點:

1. 標註員
這也是組成標註公司最重要的一點,有一批優秀的標註員一定可以讓你的公司事半功倍。那麽怎麽樣的標註員才能算是優秀呢?這裏有幾個衡量標準:首先數據標註的終端是AI、是人工智能。數據標註的最終數據是為計算機服務的,所以越精細的標註對計算機的訓練越高效,這就要求我們的標註員一定要是一個細心認真的人。越細心、越認真,標註數據的精細度就越有保證。其次,因為需要標註的數據的場景是千變萬化的,會有各種各樣復雜的場景出現,這就要求我們的標註員要有較強的觀察能力。觀察能力越強的人,標註出的物體輪廓也就離物品的真實輪廓越相近,越準確。最後,因為數據標註在單一的場景中需要重復一個或者幾個動作,除去判斷,這種重復的勞動是相對比較枯燥的,這就要求我們的標註員需要有耐心能夠坐得住。越有耐心,能坐得住,標註數據的穩定性就越有保證。

2. 審核員
審核員一般都是從優秀的標註員中挑選出來的。因為數據標註是一個類似於熟能生巧的行業,一個標註員接觸過的標註對象越多,場景越復雜,那麽他也就越有可能更快、更準確的判斷出復雜場景中的被標註元素,這些都是靠時間和經驗堆積出來的。自身是一個優秀的標註員,這種標註員在審核時會同樣把自身對標註的要求傳達給其他標註員,這對於提升標註數據的整體質量是有很好的幫助帶動作用。

3. 項目經理
項目經理主要就是對於項目組的各個成員(包括標註員和審核員)的管理,項目經理最好是能夠有一定的AI基礎,有AI基礎的項目經理,在和上遊需求公司對接的時候能夠供輕松的進入項目本身,能夠更快更準確的了解上遊公司標註的具體需求,減少溝通時間的同時,避免因為溝通規則上的誤差導致下遊標註員重復返工的情況。

4. 運營總監
運營總監嚴格意義上也就是公司的創始人了,運營總監基本上就是奔波於各類AI企業,各種AI實驗室,說簡單一些就是尋找需求方。至於可能大家比較關心的怎麽找,本文後續會有更多詳細介紹。

人工智能或者說AI會成為未來的趨勢,已經是大勢所趨,不論國外還是國內的互聯網科技巨頭都在布局AI產業,從谷歌、亞馬遜、Facebook到阿裏巴巴、騰訊、百度、京東都在積極的布局自己的AI體系。

與此同時,我們國家的決策層提出:

人工智能是引領這一輪科技革命和產業變革的戰略性技術,具有溢出帶動性很強的“頭雁”效應。

人工智能的未來離我們其實並不遙遠。想了解更多關於未來,關於如何站在潮流的前端的朋友們,請多多留意博客更新。

閱讀原文請進入:http://www.awkvector.com/

如何運營一家數據標註公司 (基礎架構篇)