那些人工智慧背後的工人
一個週五早上的九點整,韋小惜坐在電腦前,身體縮在黑色棉衣裡。地處河南城鄉結合部的辦公室裡很安靜,只能聽到點選滑鼠的聲音和飲水機偶爾咕嚕冒泡的聲音。
此時,房間裡只剩下他的另一個同事吳文龍。
一張,兩張,三張…不同人穿著同款安全服的照片從吳文龍眼前劃過,他坐在電腦前,操控著滑鼠,眼睛專注地盯著電腦螢幕上的照片。他正在進行照片篩選,不是人物正面照或背景複雜的統統刪掉。篩選出來的照片,韋小惜再圈出目標,標記關鍵點,讓計算機能看圖識物。
他們正在進行單調乏味的貼標工作,卻是教機器變“聰明”的第一步。
在資料標註行業,國內兼職或全職的有幾十萬人,多是以工作室、團隊形式存在,少則十來人,多則上百人,貴州被稱為標註小鎮,青島、寧夏也都建了標註基地。
韋小惜把自己所處的位置比作房地產行業裡搬磚的人。和吳文龍一樣,他們彷彿是人工智慧產業鏈上最不起眼的塵埃。
千萬次點選
隨著滑鼠箭頭的拖動,黃色的直線沿著安全服的輪廓勾勒一圈,生成上百個節點。一張接著一張,重複同樣的動作。吳文龍在為檢查是否戴安全帽的人工智慧做資料標註,訓練機器人的識別能力,一些建築公司有這樣的需求。
這只是他標註過的眾多型別中的一種,他記不清自己標註過多少種類的圖片,令他印象深刻的是之前標註過排卵試紙,他聽說有人還標註過糞便。
他們的老闆韓錦皓在隔壁打電話,他那邊不時傳來催款、嘆氣的聲音。到年底了,公司相對清閒一些。
韓錦皓今年31歲,是一個身材高大魁梧的年輕人,普通話裡夾雜著河南口音。他的公司在河南商丘的西面,在居民樓裡。門口沒有貼任何表明那是家公司的標誌,他的公司很少有來訪者,偶爾會有朋友過來看看。公司在封閉式小區裡,沒有門禁卡無法進出,這讓他感到不便。
韓錦皓公司的員工正在標註圖片 澎湃新聞記者 袁璐 圖
因為臨近年末,員工相繼離職。現在,他僅剩下兩名員工,每天處理上千張圖片。圖片不一,難度不一,處理起來的速度也有快慢。韋小惜一天最多處理過3000張圖片,算下來,他在每張圖片上停留的平均時間為9.6秒。
做資料標註員之前,韋小惜賣過車,做過貸款,開過奶茶店,在一家工地上的辦公室物資部工作過,替人家管材料。
面試前,韋小惜並不知道這是什麼工作,他在網上看到資料標註員的工作簡介,圖“新鮮”就投了簡歷。
吳文龍今年22歲,在這家公司做資料標註工作已有半年,他每天要處理上千張各種各樣的圖片。但規則有時模稜兩可,他需要自己判斷。
他是2018年畢業的大學生,畢業前在當地一家網際網路公司實習做網頁設計。畢業後,他感到迷茫,沒有目標,最後網投來到這家公司,走一步看一步。同學中幾乎沒有跟他同行的。
韋小惜和吳文龍面對面坐著,中間只隔著電腦,但他們很少交流。像雕塑一樣每天坐在電腦前8小時,概述圖片背景、前景和特定物品,所有這些都是根據需要人工智慧的客戶所述規格而定。
複雜演算法與廉價勞力
老闆韓錦皓清楚地知道,自己只是人工智慧產業鏈最底層的工人,但這些工作必不可少。他的團隊現在做的,主要是人工智慧領域裡的“門檻低、最基礎的”資料採集工作——包括清洗(注:清洗指將採集到的資料轉換為統一的標準格式,成為機器可讀取的結構化資料)、分類、標註。
生活中常見的比如掃地機器人,它帶著攝像頭,幾乎類似於人的視覺,監測房間裡面所有的物品。標註完之後,它就很明確桌子腿、椅子腿、沙發腿、牆角,哪裡能碰,哪裡不能碰。
又比如自動駕駛,要讓計算機識別“斑馬線”、“紅綠燈”、“人臉”,“其實就好像訓練一隻小狗,讓它過馬路的時候要走斑馬線,要看得懂紅綠燈標誌,要記得住路上行人的相貌一樣。”
而基礎的人臉識別需要用到很複雜的演算法。人的眼睛,眉毛、鼻子、嘴巴的形狀都會用特徵點進行標註。
提到人臉識別,韓錦皓立馬想到了安防領域通過做人工智慧識別的系統來抓逃犯。2018年,鄭州的中悅萬達廣場安裝了識別系統之後,一天抓到六名犯罪嫌疑人。“公安通過身份證上的人像已經進行了大量標註,嫌疑人出現後,通過人臉識別,把資料傳輸到公安系統。”
第一次進行標註後,機器人會學習。“整張圖上沒有空白的地方,牆,帽子,臉,車,路標,打上標籤。”第二次標註相同的東西時,機器人就會有一定的識別能力,“就像教小孩學習算術,教他一加一等於二,二加二等於四,不需要無窮無盡地教下去,只要明白箇中規律,就學會了算數。”
這份工作在吳文龍眼裡是一個新的行業,雖然做的都是基礎工作,但他喜歡這種“新事物”。
資料標註依賴於廉價的人工,機器變得智慧在很多情況下都是由真人訓練。
2017年7月,國務院印發《新一代人工智慧發展規劃》,其中包含三步走戰略,第一步是到2020年人工智慧核心產業規模超過1500億元,帶動相關產業規模超過1萬億元。第二步到2025年人工智慧核心產業規模超過4000億元,帶動相關產業規模超過5萬億元。第三步到2030年人工智慧理論、技術與應用總體達到世界領先水平。
資料標註公司如雨後春筍般在全球各地湧現。韓錦皓印象中,資料標註這兩年才火起來,並且源源不斷有人加入,因為“成本低,只要有人、有電腦,稍微培訓一下立馬就可以開始做”。
韓錦皓說,北京這樣的城市房租高,所以資料標註業務轉移到三四線城市,價格已經壓得很低。在河南鄭州,一個數據標註員的工資在三四千左右,如果是在地租更便宜的城市,工資只有一兩千。
意外的開始
韓錦皓做資料標註,是他生意路上的一次巧合。
他在黃河中間一個小島上長大,那座島過去幾乎與世隔絕。小島南邊是洛陽,北邊是濟源,住著幾百戶人家,家家戶戶有船,他們大多是菜農。後來島上建了小浪底水電站,人們紛紛搬離小島。
大約是十五歲的時候,韓錦皓因為窮所以讀完初中就輟學了。他和姐姐一起拉著家裡的菜到批發市場賣,再把批發市場上的水果拉回村賣。那是他第一次做生意。
這樣的日子持續了兩年,韓錦皓決定到外面去碰運氣。他去了舅舅所在的成都,在一家動物園裡養海豹,一個月工資350塊。
一年後,他不幹了。家人希望他能學一門牢靠的手藝,以後好找工作。他就去學了電焊,當時洛陽高新區正在修建,他在那幹了幾天,把學費賺回來後,再沒幹過電焊。
接著他去了哥哥打工的蘇州,一個電子廠,做諾基亞N95這款手機最後的包裝工序和檢驗。
韓錦皓不甘心一直做流水線上的工人,三四個月後,他換到另一家電子廠,那裡是做山寨手機的。“一塊TCB板過去,光禿禿的,然後把所有電子元件裝上,把一些螢幕、電池、按鍵、外科、喇叭接入系統,測試各項功能,組裝、檢查之後就賣出去了。”
那會兒是2008年,廠裡有人開始賣手機,直接從生產線上拿手機,賣給隔壁廠裡的人。拿貨的價格是幾百塊,賣出去的價格八九百上千。韓錦皓手裡沒什麼錢,市面上諾基亞、摩托羅拉正火,他覺得風險大,沒敢做。
後來他幹過網路銷售,微信優化,微信營銷,開發公眾號,去過深圳,四川,蘭州,北京。他經歷了一次次風口,卻又相繼錯失機會。
從2003年出門,韓錦皓在外晃晃蕩蕩跑了十年後,家人催婚,專案沒進展,2015年,他回鄭州先成立了一個公司,做免費wifi無線路由器,通過wifi引流打廣告,但效果不好,他又改做資訊流廣告。
跌跌撞撞到了2017年,他給北京一家公司做廣告。公司的老闆以前是某知名網際網路公司的高管,做得好好的,突然離職了,後來韓錦皓才知道,當時這家網際網路公司在做無人汽車,需要大量資料標註團隊,那時候這類團隊比較少,這個老闆就辭職改做標註了。
韓錦皓也就跟著改做標註了。雖然他在三年前曾去過北京的網際網路大會,瞭解到AI、AR(注:AI指人工智慧,AR指增強現實技術),但當時覺得這些離自己太遙遠。
直到兩年前的夏天,他每月花費三千元,租下一套120平米的民居,擺上兩條長桌和十臺電腦,做起了資料標註和採集樣本的生意。
“人類智力任務”
2017年,韓錦皓剛組建團隊時,並不順利。很少有人知道資料標註員是幹什麼的,他招人只能在需求崗位上填“文員”。等招來人之後,他才跟人解釋工作內容,接著進行培訓。
第一批他招了十幾個員工,都是年輕人,有沒上過一天學的文盲,有患聽說障礙的殘障人士,有剛剛結束網際網路技術學習的大學畢業生。他們很少有人受過良好教育,也並不覺得自己投身時下正興盛的科技潮流中,甚至對人工智慧一無所知。大部分來工作的人都是生計所迫,每月能領到三千多元的工資。
資料標註團隊陸續到位,北京的公司發了任務給韓錦皓——主要標註內容包括行人和車輛,其中車輛分類為小轎車、中巴、大巴、手推車、自行車、三輪車、摩托車等,都要由近到遠,拉框標明,不能有任何遺漏。
這是韓錦皓帶領團隊第一次做資料標註的業務。他們對規則不甚清楚,圖片上一個十字路口密密麻麻一群車,但有些車輛,他們無法叫出名字,很難全部準確拉框標註。
做了一段時間後,對方覺得他們做的標註質量不好,老是出錯。“無人車要上路,對標註的精確度要求高,機器人一旦學習了錯誤的資料,是很危險的。”
這反而讓韓錦皓看到做標註的意義。他決定從簡單的標註業務入手。他接的第二個業務是移動公司的客服語音標註,把聽到的音訊內容按照客戶要求貼上標籤,比如使用者問及話費問題,機器可以迅速給到相應的回覆。
前半年的專案,他基本都是和第三方公司合作。第三方公司從甲方公司接到標註的活,他的團隊來做,專案多則收入三五萬塊。“目前市面上大多數公司都是這樣的。”
後來接觸多了,韓錦皓髮現,人工智慧輻射的領域很廣,不管是無人車、無人超市,還是運營商、保險公司等,都會用到。
這意味著,他做的資料標註業務前景廣闊。他做過無人超市的資料標註服務。無人超市的機器前期需要大量的訓練,比如一罐飲料究竟是可口可樂還是王老吉,需要無數次、各種場景的訓練,讓機器學會自動識別人像,“這就需要大量資料標註工作”。
人像標註的節點 採訪物件供圖
做資料標註的生意,韓錦皓憑的是“興趣”。家裡沒人懂他現在做的專案,他只說是做網際網路的。
嚴格來說,他說自己所在的城市沒有一家真正的人工智慧企業。韓錦皓把資料標準歸為小眾行業,“再做20年也不一定有人知道,”不像阿里巴巴和百度等涉足人工智慧的大公司,為人們所熟知。
這兩年,韓錦皓做過人臉識別,手勢標註,智慧客服等等。最常見的比如某個淘寶店家對買家評論的人工智慧回覆。
他現在做的事,很像邁克斯·泰格馬克筆下的歐米茄團隊。歐米茄團隊的第一個目標是亞馬遜的MTurk(注:一個眾包網路市場),它於2005年上線後,發展迅速,很快就聚集了成千上萬來自全球各地的人。
歐米茄團隊夜以繼日地奏出了一支支“HIT”奏鳴曲——HIT指的是“人類智力任務”(Human Intelligence Tasks),範圍十分廣泛,從音訊錄製到影象分類和網頁描述撰寫,應有盡有,但他們有一個共同點:只要你完成得足夠好,沒人在乎你是不是人工智慧。
歐米茄團隊認為,只要他們能讓一臺超級智慧機器——無論這個人多麼聰明,這臺機器能超越任何人的所有智力活動的機器,不斷迭代的“自我完善”過程持續下去,那麼最終,這臺機器就會變得非常聰明,足以自學其他有用的人類技能。
但韓錦皓對此不以為然,“總有機器不能替代人類的工作。”他臉上帶著自信,翹著二郎腿,坐在他辦公室的一個角落。他無法說清人工智慧在接下來的幾十年裡如何影響就業、法律和經濟,但他肯定地說,人工智慧將滲透各個領域。
人工智慧照片識別教學的標準是使用ImageNet的影象,這是一個由斯坦福大學教授李飛飛建立的數萬張影象的資料庫。這個資料庫依賴於亞馬遜的MTurk,後者將勞動密集型工作外包,交給網際網路使用者去做,試圖對這些圖片進行分類、打上標籤,為計算機提供學習用的“題庫”。
但是,隨著世界各地的企業越來越多地轉向從無人駕駛汽車到醫療診斷等行業的人工智慧應用,“題庫”被證明是不夠用的。這也正是韓錦皓認為有潛力的地方。
“別人看不到的工作”
韓錦皓的一個朋友周俊凱,在距離他一百六十多公里外的縣城,創辦了一個數據標註的公司。
周俊凱的公司坐落在河南省商丘市民權縣中部,東沙河在這裡劃出了一條新月形弧線,他的辦公室是一棟三層高的民宅,房子後面是一片莊稼地。這座縣城人口約三十萬。在這裡,似乎沒有人關心人工智慧。
周俊凱從貿易學院畢業後一直在找工作,但四處碰壁。後來找到一份汽車修理工的學徒工作,但幹了很短時間就辭職了,那份工一天要工作十四個小時。
周俊凱今年19歲,他是在平頂山西部的小鎮上看到一些資料標註的工廠,做了一段時間貼標員後,萌生了開店的想法。他和表兄弟一起拿出家裡的二十多萬積蓄,購買了幾十臺電腦,租下辦公空間。
2018年的秋初,他註冊了現在的公司。縣城唯一的資料標註公司開業了。在更小的地方,周俊凱的工作更難被理解。
招來的二十個員工都是他的老鄉或朋友。一窩人聚在一個房間,面前擺個電腦,幹著別人不知道的事情,親戚以為他乾的是傳銷。“周圍的人根本不知道這和人工智慧相關的。”
為了取得農民父母的信任,他抱著電腦坐他們旁邊,手把手在他們面前演示,“讓他們看我這個東西是怎麼賺錢的。”父母面露驚訝,他們從未見過這樣坐著“瞎比劃”就能賺錢的工作。
他把營業執照展示出來,下面的人都拿到了工資,人們才慢慢相信他做的事情合法。
現在有朋友問起,周俊凱一般不會提人工智慧,只說是做資料的。“你說的越高階越神祕,大家就越會覺得這東西和騙人似的。”他說不清楚他做的資料貼標和人工智慧到底有什麼關係,這不是他在意的,只隱約感覺現在從事的這個行業很有潛力。
韓錦皓的工作在老家人眼裡是“不務正業”,但他慢慢喜歡上這份“別人看不到的工作”。他像很多創業者一樣,把時間看得最重,每餐花費最少的時間,然後回辦公室和圖片打交道。
以前在別人眼裡,他沒學歷沒背景,做的事情都異想天開,但他愛折騰。公司他一個人撐著,也不覺得累。有兩年他起早貪黑,女朋友天天見不到他人,他覺得每天有探索不完的事情。
韓錦皓誤打誤撞做起了這個時代最前沿的工作,但他知道自己只是站在人工智慧領域的門口,想要往前走,腳卻不知道從哪裡邁。他的目標是成為河南一家真正的人工智慧公司,不再只是做資料標註。
今年,韓錦皓雄心勃勃投入了這個行業,他不想只做一名資料標註工人,正在開發一款資料標註的軟體工具,打算引入演算法到資料標註工作上,採用人工智慧方式做一部分資料標註工作,再人工進行處理。
想得更遠些,他希望有天能生產出人工智慧的產品。
韓錦皓說,在河南,自己算是最早盯上資料標註業務的人,他管理著一個近3000人的群,群裡全是做資料標註的人。他的辦公桌上堆放著一疊合同,都是主動找上門的甲方公司。
他已經不愁沒活兒。有個客戶之前做完一批業務,又換了一批繼續找他做,希望他在春節前做完。
那天突然停了電,韓錦皓讓兩個員工先回家。吳文龍和韋小惜拎著東西離開辦公室一個小時後,電來了。韓錦皓又電話讓他們回來繼續幹活,客戶那邊有要求,年前必須要全部標註完。