1. 程式人生 > >人臉識別出現,長得太黑無法識別?對不起我的錯嘍!

人臉識別出現,長得太黑無法識別?對不起我的錯嘍!

在演唱會“抓逃犯”上屢建奇功的人臉識別,其實還是不成熟的技術,具體表現在對膚色和性別的歧視上。

微軟發現,商用人臉識別識別膚色較淺的男性準確率最高,而失誤率最嚴重的是膚色較深的女性。

人臉識別出現“技術偏見”,長得太黑無法識別?

這可算是人臉識別的“技術偏見”了。

這種偏見一旦在大範圍應用中“顯現”,聲討種族和性別“歧視”的聲音,將會淹沒微軟。

為了解決充滿偏見的技術,微軟 Face API 團隊對其識別系統進行了三次重大改進。最新的人臉識別系統,識別膚色較深的人錯誤率降低了 20 倍,識別所有女性的失誤率減低了 9 倍。

儘管有了改進,但目前的人臉識別,還不是完美的系統。微軟認為,問題的根本解決辦法還是訓練資料庫,需要收集更多的資料,包括不同膚色、髮型和麵部飾品等。

人臉識別出現“技術偏見”,長得太黑無法識別?

▲ 研究發現,微軟和 IBM 的識別黑人女性出錯率高。圖片來自:Daily Mail

中國人普遍的黃面板,剛好避開了“最淺”和“最深”的膚色。但我國也有外貌特徵各異的少數民族,如果人臉識別對此產生技術偏見,就不是簡單的“開地圖炮”了,可能會引發嚴重的民族矛盾。

至於“更大範圍攻擊”的性別歧視話題,在我國也變得非常敏感,該慶幸人臉識別技術目前還沒有惹來“性別歧視罵戰”。

偏見的鍋不能完全甩給人工智慧,技術也是反映真實社會的鏡子。

微軟研究實驗室的高階研究員、AI 系統公平性專家 Hanna Wallach 在一份宣告中迴應:

如果我們訓練機器學習系統使用有偏見的社會產生的資料,來模擬那個社會做出決定,那麼這些系統必然會重現它的偏見。

例如,在一些社群中,黑人的犯罪率更高,AI 根據收集來的資料,更容易把膚色較深的人劃分到“逃犯”的分類中。這是群體給個體的傷害,人臉識別只不過“遵循了”社會偏見。人臉識別出現“技術偏見”,長得太黑無法識別?

▲ 微軟人臉識別的情緒檢測功能。圖片來自:thenextweb

相比起導致“歧視”,研究團隊更希望 AI 能檢測和減輕偏見,以彌補現實社會中的不完美。

追捕逃犯用大範圍攻擊的“種族炮”和“性別炮”容易傷及無辜,人臉識別的方向是更精密的“狙擊槍”。

一直對人臉識別技術保持警惕的美國,其海關部門也要啟用人臉識別系統,但收到強烈的反對。

關於人臉識別,最近亞馬遜的么蛾子也很多,先是美國公民自由聯盟向亞馬遜提交請願信,接著 100 多名內部員工也要求執行長 Jeff Bezos 停止向美國警方出售人臉識別軟體。目前,美國奧蘭多市警察局與亞馬遜的人臉識別合同已過期,雙方還沒決定續約。

“亞馬遜人”簽署的部分內容:

我們公司不應該在監控業務中; 我們不應該參與警務工作; 我們不應該從事支援監督和壓迫邊緣化人群的人。

人臉識別出現“技術偏見”,長得太黑無法識別?

▲ ICE 將啟用微軟人臉識別軟體. 圖片來自:Inc.

儘管微軟員工與亞馬遜員工的想法一致,堅決認為人臉識別軟體侵犯人權,對美國最近的移民政策尤其不滿,希望微軟 CEO Satya Nadella 停止與 ICE (美國移民和海關執法部門)簽署協議,但目前仍沒收到成效。

人臉識別技術到底帶來了安全保障,還是帶來了歧視,侵犯了個人自由?美國科技公司們的“糾結”,也許值得我們思考,看演唱會被人臉識別,到底是不是妥當的?

AI這把火燒透了人臉識別這個狹小賽道。先是行業外BAT等巨頭攜著資本、品牌力量順勢攪局;緊接著身處於這個行業的老兵也不甘示弱,紛紛“揭竿而起”,一場人臉識別登陸戰就此拉開。
  
  
  對於人臉識別這個狹小AI賽道上的熱鬧景象,早在2017年3月份,李開復就驚歎“國內出現了四家以人臉識別為主的創業公司現象不合理”,甚至還有投資人表示,2018年6月份可能就是AI的冬天。
  
  
  2018年,人臉識別這個美麗神話到底如何發展?
  
  
  人臉識別的“囚徒困境”
  
  
  一方面是大量資本湧向這個行業,另外一方面,則是人臉識別的變現渠道遙遙無期。
  
  
  因此,人臉識別行業被圈內人號稱“囚徒困境”,要多尷尬有多尷尬。
  
  
  2017年人臉識別行業融資堪稱瘋狂,好像一場龍爭虎鬥的比賽,無論是行業裡的傳統老兵,還是迅速催生的人臉識別四個小獨角獸們,都讓人眼花繚亂。火熱現象背後,對於很多由演算法驅動的人臉識別公司的商業模式有待探索。
  
  
  “行業內的創業公司,幾乎沒有誰在賺錢,大家基本上都在虧錢。”一位人臉識別業內專家向GPLP君透露,各個公司都在探索合適的商業化模式,但是目前沒有誰走出一條已經被證明是完全可行的商業化路徑。
  
  
  “人臉識別公司最開始的優勢是演算法,但隨著相同賽道上各家演算法技術的進步,事實上同一梯隊上的公司技術差距已經越來越小。這也就意味著靠售賣SDK軟體的變現的方式很難行得通。”該專家表示。
  
  
  持相同觀點的還有曠視科技聯合創始人唐文斌。“沒有什麼技術是不能被取代的。演算法也好,技術也罷都不過是手段,最後能夠提供的不過是產品價值。”他說。
  
  
  然而,“產品”二字恰是隱藏在人臉識別公司背後的難以盈利的答案。拋開研發晶片變現路徑,事實上,粗略歸納人臉識別能夠真正落地的產品形態只有兩種:一種是靜態拍照監控,另一種是動態的視訊監控。
  
  
  人臉識別的美麗神話一位安防行業內的專家告訴GPLP君,“動態視訊監控方面,主要的產品就是攝像頭,但該領域已經有很多家硬體廠商在前面阻擋,比如海康威視、大華、宇視等,一般新興的創業公司較難突破。”
  
  
  以海康威視為例,公司資料顯示,目前該公司已經有2000多萬臺攝像應用裝置在世界上應用,銷售額位居攝像頭領域第一。同時,海康威視也積極在人工智慧領域進行佈局。
  
  
  根據公開資料顯示,早在2006年,其就開始佈局智慧技術的研發,比如有2015年後端產品海康“獵鷹”&“刀鋒”智慧伺服器的推出與應用, 2016年基於深度學習技術、從後端智慧到前端智慧的全系列智慧產品家族,2017年公司正式釋出了“IOT-基於神經網路的認知計算系統--海康AI Cloud框架”。
  
  
  以海康威視為代表的傳統攝像頭監控廠商,讓一些人臉識別演算法公司望而卻步。一位行業內專家向GPLP君透露:“當調研完視訊流領域的硬體廠家之後,覺得在前面這些巨無霸面前,很難有機會彎道超車,於是就切換到靜態監控領域。”
  
  
  背後的原因是,攝像頭領域的產業鏈很長,傳統的硬體廠商已經深耕多年;而一般新興的人臉識別演算法公司很難把產品的價效比降低到與海康威視等傳統硬體廠商一樣的水平。
  
  
  因此,對於演算法驅動的人臉識別類的創業公司而言,要在靜態的拍照監控領域建立較好的盈利方式並非易事。一位深耕行業多年的創業老兵向GPLP君表示:“那麼多人臉識別的創業公司當中,很少有能夠聞到‘錢味兒’的公司,大都在探索變現渠道。”
  
  
  創業公司“聞不到錢味兒”怪現象的原因到底是什麼呢?
  
  
  第一,技術的瓶頸。一位業內專家表示,目前演算法導致的差距已經逐漸縮小,但這只是相對於頭部的公司的而言,例如商湯科技、曠視、雲從、依圖、中科奧森等,後面梯對的公司在技術上還有較大的差距。
  
  
  例如,安全防護的前端缺少活體防偽技術,人臉識別可能就是一個“偽命題”。2017年3·15晚會就顯示,人臉識別建立的安防系統十分容易被攻破。一位人臉識別行業的專家告訴GPLP君,目前還只有少數的幾家能夠擁有這項技術。
  
  
  通過研發突破短時間內可能性並不高,因為現在各大頭部公司正在搶佔數量稀缺的人才資源。據媒體報道,商湯科研人員配製寧可過度也不願意放手。所以,一般實力較弱的人臉識別公司根本無法與行業內獨角獸抗衡。
  
  
  第二,客戶的門檻。
  
  
  2017年,人臉識別應用最火熱的兩個領域為金融和安防,一些沒有客戶積累的創業公司很難擠進去。
  
  
  “要麼在行業裡有很好積澱如漢王、中控等,要麼是能夠聯合地方政府、行業外巨頭進行深入,如雲從、商湯、雲天勵飛等,否則要想進入金融和安防領域困難重重。例如,處於人臉識別頭部的依圖把醫療健康作為其AI應用的一個主要領域。”一位人臉識別行業專家告訴GPLP君。
  
  
  第三,來自硬體公司的競爭讓“錢味兒”離大家越來越遠。
  
  
  聞不到“錢味兒”的人臉識別公司除了來自同行的你追我趕,上游硬體公司的奪食也佔有很重要的因素。一位行業從業者向GPLP君坦然,“一些硬體公司通過買人臉識別公司的演算法技術,然後整合到硬體中,形成有競爭力的產品,這讓他們壓力很大。”
  
  
  可見,人臉識別的演算法只是一個工具,能否用這個工具結合到具體的場景,然後打造出一個標準化能夠落地的產品變現,這對於人臉識別創業公司是最重要的要素;而前面提到的能夠盈利公司,無論海康威視還是硬體廠商都是因為離應用場景最近,他們可以以較快的速度打造出可以變現產品。所以,對於技術水平不能衝到頭部,同時也不掌握關鍵落地產品,在獲客能力又比不上行業老兵的人臉識別創業公司而言,當資本熱消退以後,可能面臨的是生存問題。
  
  
  資料路徑變現是明天嗎?
  
  
  資料變現是很多人臉識別創業公司說服投資人的一個理由——人臉識別公司的價值在於大資料,可以通過資料進行變現。
  
  
  一位行業資深人士也告訴GPLP君,“資料是人臉識別行業所有公司都心照不宣的祕密,每一家公司都或多或少都瞅著這個領域的機會。”
  
  
  然而,真的可以通過資料進行變現嗎?
  
  
  不可否認,資料有很高的價值。據媒體報道,在國外政府就已經探索和企業共同開發大資料的價值。2016年10月美國國家科技委員會公佈的《美國國家人工智慧研究和發展戰略計劃》中有七大戰略計劃,第五個就是開發用於人工智慧培訓及測試的公共資料集和環境。
  
  
  例如,早在十幾年前,加拿大就已經出現了採集大量客戶資料對社會消費特徵進行整體畫像的企業。這些資料收集和分析企業根據廣泛收集的跨行業客戶資訊,把全國居民細分為68個子類,並對每個子類進行畫像,抽取其消費特徵和潛在需求,為零售、金融、通訊等各個面向消費者服務的企業所用。
  
  
  在我國,政府機構、部門之間的資料是分散的,一家的人臉識別的公司可以把裝置售賣到各個部門,如稅務、銀行、教育等,打通各個部門的資料鴻溝,然後實現最終變現。
  
  
  但是過程並不容易實現,首先受制於我國通過人臉識別公司的資料採集和分析能力。
  
  
  “現在,我國人臉識別發展還處於級階段,沒有那麼多資料可以利用,還需經歷一個大規模推廣的階段。”一位人臉識別公司負責人告訴GPLP君,“從使用者資料一側發力,估計還要約5年時間才能獲得商業價值。”
  
  
  又回到GPLP君在前面提到的話題,如果該人臉識別公司在獲客、產品方面的水平很弱,那麼它就很難進行大規模推廣,又從何處獲得規模化可以利用的資料呢?
  
  
  人臉識別的美麗神話雞生蛋,蛋生雞,但如果是惡性迴圈,那麼資料變現也將沒有明天。
  
  
  另一方面,人工智慧領域針對區域性領域獲得資料進行訓練,並不是就能夠獲得一個全面的解決方案或者說是結果。一個好的、有價值的資料需要在全面資料搜尋領域獲得突破,而不是區域性突破,比如,單單獲得沒有標註個體的人臉識別資料,價值就相對較小。
  
  
  當然,對於人臉識別的創業公司而言,可以對人臉識產品進行補貼的方式進行價格戰,迅速獲得市場的,實現大規模推廣,類似於共享單車領域小黃車、摩拜的打法。可是,這樣路徑的背後,成本無疑是一個巨大的數字,能否支撐起資金消耗也是一個問題。
  
  
  最後,就是人臉識別產生的法律風險。比如,前不久360水滴直播平臺一事,就是因為涉及隱私因素自動關閉。雖然,這只是公司的自主行為,並不是法律的強制結果。但不排除相關立法會跟進。
  
  
  一位專家告訴GPLP君,“在人工智慧領域法律還處於灰色地帶,但是不能夠保證政府的不會通過立法的手段進行監管。如果站在法律邊緣的打擦邊球的方式創業,風險無疑太大。”

  鑑於資料側是一個長期的投入,產品側又無法和傳統的硬體廠商叫板,因此很多人臉識別領域的創業公司說服投資人轉向了別領域,比如機器人、自動駕駛、醫療健康等。但這背後有多少是概念,落地時困難程度的如何,都是投資者進行投資時需要考量的問題。

  比如,有人臉識別創業公司就表示,要通過計算機視覺技術與NLP技術的結合,製造出能“識別萬物”的智慧機器人。

  可是,考慮到萬物識別機器人的研發的難度、市場推廣的成本等因素,相關的人臉識別公司在現金流枯竭之前找到變現的途徑恐怕困難重重。