AI 會做網頁了,那設計師會失業嗎| 阿里智慧設計實驗室樂乘
這期節目我們請到了阿里巴巴智慧設計實驗室的負責人樂乘。這個智慧設計實驗室有個最著名的專案叫魯班(現更名為鹿班),大家可以簡單的把魯班理解為一個人工智慧設計師,去年這個名叫魯班的智慧設計師在雙 11 期間為阿里繪製了 4.1 億張各不相同的個性化廣告圖,而今年魯班甚至開始學會設計網頁了。人工智慧會對設計這個行業造成怎樣的影響,它會判斷美醜嗎?魯班會像 AlphaGo 超越人類圍棋手一樣,在未來超越人類設計師的水平嗎?所有這些問題,我們會在這期節目裡和樂乘一一討論。

雙 11 的 4.1 億個廣告 banner,全都出自「他」之手
UX COFFEE: 魯班這個專案的由來是什麼?
樂乘: 阿里在 2015年的雙 11 第一次嘗試了個性化推送,不同的使用者在會場的介面中會看到不同的商品和內容。這次的轉型非常成功,很大地提升了流量的分發效率。但那時的個性化推送還是很有限的,我們只能在搜尋的結果,或者說推送的商品上做到個性化。2016 年初,我們和演算法團隊就開始思考,能不能再往前邁一步,從設計的角度出發,讓使用者不僅看到的商品不同,而且看到的廣告圖也是千人千面的。我們覺得這會是一個非常大的突破,所以就起步做了這個專案。
UX COFFEE: 在魯班之前,商品廣告推送的設計流程是什麼樣的?
樂乘: 在魯班之前,靠的都是人力。比如說,我們有十張廣告的輪播,大家可以去申請,然後根據業務的重要程度排優先順序,批覆以後再找設計師畫圖,到了時間點上線圖片,時間過了再下線,這一切都是靠人力完成的。有了魯班之後,就算有十幾萬個商品參加申請廣告輪播,魯班也可以把所有商品進行摳圖、自動生成廣告,然後再投放,全部過程都是由系統來實現的。
UX COFFEE: 你們是怎麼在阿里這麼大體量的公司裡自下而上推動這個專案的?
樂乘: 最早發起的時候,我們只是自己覺得這個想法挺靠譜的,就抽出時間嘗試這個想法。我們最早是在手機淘寶的廣告 banner 上做了嘗試,把用機器生成的幾萬張圖和人力生成的圖片進行對比。我們發現機器生成的圖片加上精準的個性化投放,能讓同一位置的點選率翻一倍。有了這樣直觀的驗證,我們就把魯班接入了整個產品,魯班的價值越來越高,團隊也從早期三個人開始慢慢擴大。
有一個非常關鍵的節點,就是我們意識到如果設計的產能不能快速升級,魯班是滿足不了千人千面的海量圖片需求的。所以我們當時對魯班的定位做一次升級,我們要把魯班從一個個性化廣告的推薦系統,變成一個人工智慧設計師。
UX COFFEE: 你們對這個「人工智慧設計師」有更詳細的定義嗎?
樂乘: 準確地來說,現階段我們想要做的是人工智慧的平面視覺設計師。
UX COFFEE: 2016 年我在網上看到一個數據,之前你接受採訪的時候說,阿里用魯班設計了 1.7 億個廣告圖。你們有沒有計算過,這些廣告圖如果要人力來做,需要多少人力和時間?
樂乘: 我們去年其實投放了 4.1 億張廣告圖,我們大概算了一下,相當於是 200 個設計師不吃不喝做 200 年。但是話說回來,純粹站在產能的角度去評判這件事情的意義並不大,因為機器本身擅長的就是批量生產,這並有沒什麼可炫耀的。我們也很少站在節省成本的角度去評價這個系統的價值。 當機器做到了人做不到的事情,產生了過去產生不了的價值,打開了業務新的邊界,這個才有意義。

所以……人工智慧是如何學習設計的?
UX COFFEE: 魯班具體是怎麼運作的呢?你們生成千人千面的廣告圖片的機制是什麼?
樂乘: 魯班的整體架構有三個核心單元。第一就是我們從過去海量的設計稿中利用深度學習提煉出設計經驗。 深度學習就是從很多高維的、海量的資料中提取隱含的特徵。 舉例來說,一張廣告設計圖中,有一件碎花連衣裙、花朵和藍天的背景。這張圖片是含有很多維的資訊,比如背景的紋理、字型的大小、色彩的搭配、還有設計元素之間的位置關係等等。通過深度學習,我們就能把這些高維的畫素圖片抽象為了一個蘊含這些多維資訊的量化圖。通俗來說,這張量化圖就是這張設計圖中蘊含的設計知識。當資料量足夠大時,魯班就能總結出一個通用的設計的知識模型。
當我們總結了許多設計知識後,面對一個設計需求,魯班要怎麼去根據量化圖反向生成一張畫素圖片呢?這就要說到第二個核心單元——行動器。舉例來說,通過學習那張碎花連衣裙的廣告圖,再遇到類似的需求時,魯班就會在這張設計的基礎上,從一個海量的設計素材庫裡索引,匹配和替換其中的元素,然後經過大量的計算跟迭代,最後生成一張新的圖片。 這其實就是強化學習的過程,就是在一個受限的空間和範圍內去不斷嘗試,通過內部或外部會提供的反饋,得出一個最優的結果。
第三個核心單元就是評估。因為魯班會得到非常多的結果,需要一個評判的機制來鑑定這些結果是否符合設計的要求和標準。這個部分的進展沒有前兩個單元那麼快,因為這是一個非常巨集大的命題。我們也在和很多高校合作,研究如何讓機器來評判美、醜,設計的好、壞。我們現在離讓機器懂得審美這麼高階的階段還很遠。我們能夠做到的是制定一些規則約束。比如當一個設計明顯不合理時,就可以作為一個約束條件放進去。另一方面,我們會人工給過去的設計成品進行打分,來讓魯班學習給任意一張圖片打分。這個模組現在還在早期的階段,還有很長的路要走。
UX COFFEE: 評估這個模組很有意思。你們想讓機器學會審美,但是聽起來我們距離這一天還很遙遠,因為目前大部分判斷美、醜的工作還是有人工介入的。這和 Google AlphaGo 的機器學習就很不一樣,因為下圍棋有一個非常特定的條件,就是獲勝。但是設計這件事情並沒有獲勝的概念,美醜的概念是相對的,甚至是非客觀的。聽起來魯班這套系統並不會設計出人還沒有設計出來的東西,就是不會超出人類設計師的水平,是這樣嗎?
樂乘: 這個問題問得很好,我覺得不能用一個是或者不是來回答。我更想分享一下我對這個事情背後的想法。還是回到和 AlphaGo 的對比來看,正是因為圍棋是一個規則評判標準非常清晰的遊戲,它的量化的評估方式非常確定,所以 AlphaGo Zero 才能夠脫離人的輸入自己學習,甚至通過學習發現人下圍棋的方式可能都錯了。AlphaGo Zero 的成功是這個場景的特性決定的。但是人類社會裡面有多少問題,能像圍棋規則這麼確定呢?其實大部分都不是。設計就是非常典型的,有著無窮無盡的計算空間,歷史的進化的過程中有不同的趨勢。它是個人文問題,也是個社會問題,而不是一個純粹的數學問題。當我們做到比較深的一個階段之後,這個命題背後的複雜度和對演算法技術的挑戰,遠比我們早期想的要複雜得多。
現階段魯班確實不能生成出超出人類能力太遠的設計來。未來的幾年我們還會繼續深入這個命題。未來有一天,機器有可能真的會做出我們都沒有見過的設計。

讓商家有自己的小魯班
UX COFFEE: 在淘寶上賣貨的很多品牌商家,他們對於自己的品牌形象、設計風格,應該也是有要求的,魯班要如何去滿足他們的要求呢?
樂乘: 對於這個問題,我們的解決方案就是向品牌商家開放我們的訓練體系。阿里作為平臺方,我們只能知道這個品牌過去做過什麼設計,卻沒法知道他們對未來的需求,所以我們決定開放魯班這個平臺,讓企業主也都能使用自己的小魯班來做設計。
UX COFFEE: 那魯班生成的這個設計的結果如何?會不會有設計程式化的、模板化的問題?
樂乘: 其實這個模型裡的多樣性和確定性的引數問題。多樣性高了,機器就會產生很多新的變化,但有可能結果就會過度發散。但如果把確定性做到極致,在演算法裡面就有一個過擬的問題,機器學出來東西跟原來一模一樣,這就失去了學習的意義。所以我們儘量要在多樣性和確定性之間的有一個平衡。
UX COFFEE: 你們下一步的計劃和目標是什麼?
樂乘: 除了剛剛提到的向商家開放平臺,另一方面就是內容設計。因為廣告圖還只是一個單張圖片的設計,但平面設計師還有很大一部分的工作是在做網頁、易拉寶、宣傳單,這種內容複雜度高於廣告圖的設計。這類的設計在技術原理上其實是相通的,只是我們會更側重對複雜內容的表達。這樣魯班能夠覆蓋的平面設計的工作就更廣了。
UX COFFEE: 那國內的路邊攤廣告公司可能要感受到很大的威脅。因為我以前在大學的時候就會去做很多講座的海報、易拉寶,確實都是很模板化的,我可以想見魯班的這套人工智慧系統會更快,甚至更好地完成這些工作。我也知道阿里是一家非常重運營的公司,你們幾乎每天都有運營活動,如果運營活動的頁面能夠全都使用人工智慧來做設計的話,對公司運營的規模化也能起到很大的幫助。

那……設計師們真的會失業嗎?
UX COFFEE: 如果人工智慧可以做設計師的工作,那設計師以後的飯碗會不會受到威脅。你會不會思考做這件事情是不是搬石頭砸自己的腳?
樂乘: 這個問題很有意思。我覺得不同角色會有不同的視角看待這個產品。我作為這個專案的牽頭人,我想的是如果這事能夠做成,它會對設計行業有巨大的顛覆。就算有一天我真的被這個智慧設計師淘汰,我也是很開心的。 因為這件事即使我們不做,未來也一定會有人做。歷史潮流或技術趨勢對專業領域 (的改變),是不以任何人的意志而改變的。
而我的設計同事,他們的態度比較中立。他們覺得「魯班想淘汰我還早得很」,魯班還不具備設計複雜系統的能力。所以他們對魯班是一個開放的態度。他們會覺得「如果魯班能幫我做一些我不想做的事,也不錯」。
但和我們合作的外包供應商的設計師是有些心慌的。因為他們本來的工作是很容易被取代的。他們會開始想辦法轉型跟升級。
UX COFFEE: 人類和機器這對關係,可能是未來 100 年我們都會一直討論的問題。對於魯班來講,這個命題更小一些,它是人類設計師和機器設計師之間的這樣一個關係。你覺得人工智慧設計未來會變成什麼樣?
樂乘: 之前我聽過一個很有意思的比喻 —— 如果說真正的人工智慧相當於人類登月,那現在的人工智慧就只是人類爬到了樹上。所以這真的是一個很巨集大的一個命題。我們現在也只是走出了一小步。現階段主流的演算法技術是資料驅動的智慧 —— 有多少資料就有多少智慧,沒有資料就沒有智慧。 但真正的設計智慧,我覺得他應該不是純粹資料驅動的。 像剛剛提到的審美,光靠資料可能真的搞不定。當然未來也許像神經網路這類學科會有突破性的發展,人們真的搞清楚了人類是怎麼理解、認知問題的,到那個時候可能機器才能到到「登月」的階段吧。阿里現在也在和頂尖的研究所合作,做一些像美學評估這類面向未來的研究。

人工智慧離能夠「思考」還有多遠?
UX COFFEE: 在你看來,機器具備設計智慧的下一個節點會是什麼?
樂乘: 如果站在資料智慧的這個邊界內去思考的話,我覺得當資料規模到達一個臨界點之後會有一次跨越。直白的說,就是當今天人類做過的設計,機器都做過,人類看過的東西,機器都看過的時候,我覺得他可能就真的成為了一個大而全的資料智慧機器。另一個可能的突破就是腦神經領域。如果真的能把腦神經的知識與跟人工智慧結合,可能會帶來一次比深度學習更大的革命。
UX COFFEE: 你認為人類設計師和機器設計師相比,彼此的優勢和劣勢是什麼?
樂乘: 我覺得人類設計師在靈感、創造、人文、社會問題的理解是機器哪怕到了未來階段也不一定能做到的。現在機器的一個很明確的短板是它的認知能力是有限的,它不是真正地懂得內容。比如各國的文化禁忌,你覺得機器能理解嗎?我覺得很難。
UX COFFEE: 為什麼會很難?
樂乘: 比如說,在歐洲某個國家黑色的貓是不吉利的,所以天貓進入那個國家的時候,不能用黑貓的形象。今天你可以用一個指令告訴人工智慧你不能做什麼,但是它並不是智慧,像這類的文化禁忌,今天機器是不會理解這背後的文化內涵的。
UX COFFEE: 它需要去理解嗎?我覺得 AlphaGo 給我的一個很大的衝擊就是我覺得它其實並沒有去像人類那樣去理解圍棋這件事情,我們對圍棋總結出了很多的規則,甚至上升到了哲學高度。但機器沒有,它就是自我博弈,就習得了圍棋的技巧。在它眼裡,沒有那些哲學概念,但它依然可以下到最好。
樂乘: 對,人工智慧把圍棋當作一個數學問題在解,而人類把圍棋當成了一種文化或者是藝術。但我也聽到過一個反面觀點,就是正因為今天人類沒法去解這個巨集大的數學問題,所以才用文化來解釋它,其實也是因為人拿它沒辦法。 也許我們下了那麼多年的圍棋,可我們並沒有下對。
UX COFFEE: 會不會有一天我們發現我們做了這麼多年的 UI 都沒做對,我們對介面的理解還是太淺薄。
樂乘: 對,也就說有可能機器會做出比人更懂人的一些設計出來,或者讓人更喜歡的設計出來,我覺得這個腦洞真的有可能。
UX COFFEE: 作為人工智慧設計師的設計者,你會給現在設計師什麼樣的建議?
樂乘: 因為魯班是從大規模的資料裡抽象出的一種設計能力跟設計執行的產品,這就決定了它的上限 —— 它的最好水平和人類的最好水平是有差距的。但是機器的下限或它最差水平卻要比人類的設計要好很多。所以我判斷人工智慧設計會在中上游的水平,它到達不了頂尖,但是它會比很多剛入行的設計師要做的好。這可能是從設計院校剛畢業的同學必須要面臨的問題,對於他們來說, 剛走出社會的第一啟動階段的壓力會比前輩們要高很多,你將不能在低階上不能停留太久,自己的設計執行力要趕緊補上 。對於高階的設計師,我倒覺得不用擔心,因為如果你知道它的原理,你就會知道哪些東西是可以給機器乾的,哪些東西要自己專注去幹,我覺得未來高階設計師永遠是稀缺的。
參考連結
鹿班官網: ofollow,noindex">https://luban.aliyun.com
Alpha Go: https:// deepmind.com/research/a lphago/
嘉賓聯絡方式
樂乘所在的阿里智慧設計實驗室正在招募人手哦。
工作郵箱: [email protected]
本期編輯:shirley、吳艾蔚、鄭芃、帆阿帆
你可以在蘋果的播客 app、網易雲音樂 、喜馬拉雅 FM、或是任何泛用性播客客戶端搜尋 「設計咖」 ,就可以找到並收聽這期採訪的完整版音訊。
微信公眾號 uxcoffee —— 每週一杯手作設計咖啡