1. 程式人生 > >不需要敲程式碼就可以開發深度學習應用?我們來探個究竟

不需要敲程式碼就可以開發深度學習應用?我們來探個究竟

640?wx_fmt=gif

深度學習仍然需要不少的數學和計算機程式設計能力的現在,如果突然出現了一個不需要寫任何公式和程式碼的深度學習應用開發平臺,你會是什麼感覺?震驚?鄙夷?

Verge 的一篇文章就近距離觀察了這個新的視覺化開發平臺 Lobe,並詢問了領域內的研究者和開發人員的意見。我們是否應當和他們一樣充滿信心還是抱有疑慮呢?

640?wx_fmt=jpeg

Lobe 是一種新型的人工智慧開發工具,它專注於視覺化介面而不是程式設計

許多公司都在努力讓人工智慧技術更加易於使用,但是很少有公司能夠做到像 Lobe(http://lobe.ai/)這樣簡單。今年早些時候成立的這個初創公司,為使用者提供了一個簡潔的介面,使用者通過拖拽操作即可從頭開始構建深度學習演算法。這個工具的側重點主要是計算機視覺。這意味著如果你想要構建一個能識別不同的盆栽植物,或者可以統計出一棵樹上的鳥的數量的工具,你可以在不輸入任何一行程式碼的情況下在 Lobe 中完成所有的工作。

該公司的聯合創始人Mike Mata 告訴《Verge》網站,他們開發 Lobe 系統並不是為了和那些專業的機器學習人員使用的軟體(如 Pytorch 和TensorFlow)競爭。相反,他們是想要為業餘愛好者提供一個簡單的構建深度學習演算法的方式。Matas說:「人們往往在機器學習領域由自己想要嘗試的一些想法,但是並不是所有人都有正確的方式構建原型系統」。Lobe 讓這些業餘愛好者在沒有受過任何訓練的情況下邁出了第一步,使得深度學習相對於從建築學到天文學等各個領域的專業人士的准入門檻更低。Matas 補充道:「我們希望具備更廣泛的吸引力」。

Lobe 以及類似的工具可以提供無需程式設計就能構建深度學習演算法的平臺

為了驗證以上的說法,本文作者自己動手嘗試了一下 Lobe。作者構建了一個通過攝像頭識別拼字遊戲的深度學習演算法。如果我們向攝像頭展示一個字母「a」,機器就會說出「a」;如果向它展示字母「b」,機器則會說出「b」,以此類推。(這是具有開創性的工作。)為了做到這一點,我們只需要完成大多數機器學習應用程式的通用步驟。首先我們需要收集資料集(拼字遊戲的圖片),對資料進行標註(將資料按照字母分到不同的資料夾中),接著讓神經網路仔細檢查每一張圖片,然後慢慢學習構成每個字母的形狀。

用 Lobe 構建這種應用程式真是再簡單不過了!你不需要下載任何東西,只需要在你的瀏覽器中載入 Lobe.ai,通過谷歌賬號登陸,你就可以開始進行這項工作了。你可以選擇一個模版(在這種情況下,使用預訓練好的標籤和影象進行匹配),從你的桌面將資料載入進去,然後讓這個模版為你處理資訊。目前還只有少量幾個可供選擇的模版,但是Lobe 的建立者說它們打算通過加入新的神經網路架構來進行擴充套件,並且建立一個使用者可以分享它們的最佳模型的社群。

神經網路的不同部分在螢幕上以方框的形式顯示出來(這種方框被大家自然地稱作「lobes」),這些方框通過線條連線成一個類似於流程圖的結構。你還可以檢視每個節點的「內部」結構,並調整它們處理資料的方式。當你完成這些組織工作後,你可以將最終得到的模型匯出到不同的平臺上,包括谷歌的 TensorFlow 和蘋果在 iOS 上執行的 CoreML。

Lobe.ai 目前還處於測試階段,所以在設計中還存在一些粗糙的補丁和許多不直觀的細節。但是它整體的外觀和感覺還是很炫酷的,令人印象深刻,這有一部分歸功於 Matas 的背景。作為一名商業設計師,他曾任職於蘋果公司,為第一代 iPhone 和第一代iPad 完成了使用者介面的設計工作。之後,他轉投到 Nest 公司,為公司的恆溫器產品進行設計來;再接下來,他在 Facebook 和他的團隊一起開發了一款顏值超高(但註定要失敗)的名為「Paper」(https://www.theverge.com/2014/2/3/5373488/facebook-paper-app-review)的應用。

在構建我們的拼字遊戲探測器時,我一開始確實遇到了一些困難(主要原因是沒有給系統輸入足夠的資料),但是通過反覆地修修補補、調整模型,這些問題得到了解決。不久之後,我在瀏覽器中執行出了一個拼字遊戲識別程式。

640?wx_fmt=gif

我的拼字遊戲探測器簡單易構建。

很明顯,我所構建的系統是相當簡單的。但是我們也要看到,這種技術是十分具有潛力的,不要把它看作人工智慧應用。不妨將它想象為一隻在家中訓練好的聽話的猴子,你已經教會了它識別你選擇的視覺線索。只要猴子發現了你要求它尋找的東西,它除了發出「eee eee eee」的叫聲,啥也做不了!但是有這樣一隻猴子還是很方便的。有了合適的訓練素材和一點點耐心,你可以教它做各種各樣有用的事情,比如識別出惡性的痣和良性的痣之間的區別;或者觀察嬰兒監控器,看看你的寶寶是否從嬰兒床中跑了出來。如果你講音訊訊號轉化成了視覺資料的格式來表示聲波,你甚至可以讓猴子識別出不同的聲音。是的,這都是我們可以使用 Lobe 構建的真實應用程式。

當然,儘管 Lobe 通過其簡單易用的特性吸引了機器學習的業餘愛好者,這也並不意味著它就沒有缺陷。一些專家爭論道,這樣的工具對這個學科進行的扁平化處理是沒有益處的,它知識使用視覺化的替身代替了程式設計的過程,但實際上並不能教會使用者如何構建高質量的演算法。Jeremy Howard 是一位資料科學家和企業家,也是 Fast.AI 的聯合創始人,這是一個通過工具和教程使人們更容易使用深度學習技術的研究實驗室。他說,他早就預見到了這一切!

Howard 說道:「出於某種原因,每個一兩年,就會有人出來設計一個機器學習訓練系統,這樣的系統的功能包括從工具箱中拖拽出方框,然後用線條將他們連線在一起。我還不是十分明白為什麼構造這樣的系統會如此吸引人,但事實就是如此」。「這樣的系統往往會受到一定程度的關注,因為專業社群之外的人認為這些工具讓機器學習變得更加簡單易用了,但是事實上它們並沒有做到這一點。」

如果 Lobe 過度簡化了機器學習,將會如何呢?

Howard 說,這樣的視覺化介面並沒有太大意義;這樣構建深度學習系統的過程在本質上和編寫程式碼是一樣的。但是它卻比程式設計「更加笨拙,更加費時,而且你一次性地從螢幕上看到的資訊更少。」他指出,要想構建最基礎的應用(就像我設計的拼圖遊戲探測器)之外的任何東西,你仍然需要知道:「你想要使用哪些元件」,「如何將他們連線在一起」這樣的技術細節。但是由於 Lobe 這樣的工具將這些資訊封裝在了方框和連線線中,這些資訊就不像在程式碼中那樣容易獲知了。「資料科學的難點不在於打字!」Howard 說道。「難的是知道應該寫些什麼。」

他還建議,Lobe 的一些更加複雜的設定是出於美觀的考慮,而不是實際的功能性。「它們可以顯示出你改變了模型架構,但事實上並沒有人手動編寫了架構」Howard 說道。「這種通過把數字輸入方框構建深度學習模型的想法說明它們完全不知道人們需要做的是什麼。」

如果你贊同 Howard 對Lobe 的批評,那麼 Lobe 似乎是一種過於複雜的讓人們開始構建機器學習模型的方式。(與其他免費的類似產品相比,Lobe 可能會付費使用,儘管 Matas 說價格還沒有最終敲定。)但是即使像這樣的視覺化工具只是現有軟體的一個面板,它們仍然是有其價值的。如今程式碼的流行的文化形象——那些不停滾動的,無窮無盡的難以理解的符號——是一種讓人生畏的形象。Lobe 使人們開始構建機器學習模型的過程不再那麼可怕,反過來說,它也可以幫助那些從最新的機器學習技術中受益的專業人士。

Jean-olivier Irisson 是這種現象的一個很好的例子。作為位於「Villefranche-sur-Mer,」的法國海洋學實驗室的助理教授,Irisson 在接受Verge 採訪時說,他對程式設計並不是一無所知,但是他在使用Lobe 之前對於深度學習並沒有一個直接的經驗。現在他是Lobe 的封閉測試人員中的一份子,並且正在使用該公司的軟體幫助實驗室對浮游生物圖片進行分類。

Irisson 說,他和她的同事們都意識到新的深度學習技術的效能會在他們的領域超越傳統的方法。「但是深度學習目前的發展速度是我們這些非專業人士跟不上的。」他說 Lobe 意味著:他可以在不用購買新的硬體或掌握新的程式設計框架的情況下,開始使用最新的神經網路架構。他說:「它讓我專注於閱讀論文,理解概念,並且應用到那些我認為前景光明的方向上去」。

與本文作者一樣,Irisson 說他發現 Lobe 使用者介面的某些部分還存在一些問題。但我們在這裡需要再次強調的是,現在我們使用的僅僅是測試版的軟體。總的來說,他認為,這種體驗是非常直觀的。他通過電子郵件對 Verge 網站說:「我認為 Lobe 這樣的工具可以幫助非專業人士開啟神祕的『黑箱』(深度學習模型通常被認為是一種黑箱模型),並且理解它們,Lobe 實實在在地幫助了我」。

這似乎與 Matas 對 Lobe 的願景是吻合的:這是一款幫助人們儘可能快地開始構建人工智慧應用的工具。Matas 說道:「如果你對某件事已經有了一個概念,並且你擁有訓練資料,你可以通過Lobe 很快地訓練一個機器學習模型」。「如果它可能利用你所擁有的1000 個樣本能夠訓練出很好的結果,你可以找到能夠進行提升的地方,並且這會給你繼續前進的動力」。

如果說人工智慧技術真的要改變世界,那麼很顯然,參與到其中的人越多越好——尤其是科技界外的人。有些科學領域的專業人士可能認為自己沒有時間學習程式設計,但是它們可以在瀏覽器中構建這種模型從而獲得某種研究的感覺。從這一點上來說,Lobe 看上去就像是一個完美的為機器學習革命打 call 的宣傳工具!

來源:AI科技評論

640?wx_fmt=gif

640?wx_fmt=png