1. 程式人生 > >谷歌AI的七個“不正經”玩法,個個能玩一整天

谷歌AI的七個“不正經”玩法,個個能玩一整天

郭一璞 問耕 發自 凹非寺 量子位 報道 | 公眾號 QbitAI

誰說AI只能搞一些一本正經的工作?

谷歌最近就放出了幾隻比較搞笑的AI,可以完成一些不走尋常路的工作,比如:幫你實現靠臉吃飯,讓你說的跟唱的一樣~

是謂:谷歌AI的七個“不正經”玩法。

每個我都能玩一整天~

玩法1:跳著舞就把琴彈了

正常人彈琴,都是乖乖的坐在鋼琴前按鍵盤,或是以演奏姿勢抱著吉他、手風琴彈。

640?wx_fmt=gif

但是谷歌這個名叫Body Synth的專案不一樣,是讓你在電腦前,以手為鍵,以腿為弦,手舞足蹈,自己彈自己。

先看一下效果,請欣賞由量子位帶來的谷歌AI樂器獨奏:《和絃》

其中的原理很簡單,開啟攝像頭,自動開啟人體姿態識別,四肢和腦袋分別對應不同的音調。

只要監測到身體某個部分有動作,就可以發出對應的音調。

跟我念,

1~2~3~4~5~6~7~

do re mi fa so la si~

以預設的C大調為例,搖頭晃腦,發出的就是so的聲音。

640?wx_fmt=png

動動左手,就是mi。

640?wx_fmt=png

動動右手,就是do。

640?wx_fmt=png

動動右腿,就是低音so。

640?wx_fmt=png

動動左腿,就是低音do。

640?wx_fmt=png

即使轉身背對鏡頭,也是一樣可用。

640?wx_fmt=gif

另外,你還可以設定音色音調。

640?wx_fmt=png

或者開啟語音控制開關,預設的音色是吉他,喊一聲strings,就可以變成管絃樂,喊一聲drums,就可以變成鼓點。

玩法2-5:靠臉吃飯

除了“靠四肢彈琴”,還可以“靠臉吃飯”。

當然,不是真的靠臉吃飯的意思,而是你可以用臉來完成一系列工作(混口飯吃)。

比如說,依靠Sound Canvas

工具,你就可以用臉來畫畫或者寫字。

開啟Sound Canvas之後,預設是用鍵鼠來畫畫。

這太低階了,簡直是windows 98自帶畫圖程式的水平。

所以,需要先把Tracking改一下,選中Body,就可以開啟攝像頭,用臉畫畫了。

640?wx_fmt=png

此時,你臉的朝向就是螢幕上畫筆的位置,慢慢移動自己的腦袋,微微轉頭,就可以在螢幕上勾勒線條。

640?wx_fmt=gif

比如,寫“量子位”三個字。

640?wx_fmt=gif

人呀,一旦發現了臉的用途,就開始開發新工具。

除了寫字,還可以彈琴。

Keyboard就是用來彈琴的。和用臉寫字的操作差不多,臉的朝向就是小圓點在螢幕上的位置,操控小圓點敲擊螢幕上的琴鍵,就可以發出對應的聲音。

640?wx_fmt=gif

和前面的“跳舞彈琴”一樣,Keyboard上也可以選擇不同的音色音調,如果你覺得只有5個音不夠發揮的話,可以設定到最多15個琴鍵,兩個八度足夠演奏很多音樂了。

640?wx_fmt=gif

當然,兩個八度的話,琴鍵太窄了,臉太大不好操作,可以切換回滑鼠操作……

熟悉了之後,還可以玩Clarion Lite,雖然也是一個用臉彈琴的專案,不過做了幾種不同的花樣。

640?wx_fmt=png

螢幕上的每個彩色區域都應對這一個音調,同樣用臉把小圓點放上去即可觸發,搖頭晃腦,樂聲出現。

640?wx_fmt=gif

但是,演奏樂曲對音樂知識還是有一點要求的,有沒有小白即刻上手(上臉)的操作?

沒問題,谷歌還準備了“用臉當DJ”的Sampler專案,包含鼓點、吉他、號角、古鋼琴四段簡短的音樂,只要用臉控制小圓點移動上去,就開始自動播放。

640?wx_fmt=gif

現在,請欣賞下一個節目,由量子位為大家演奏《靠臉吃飯的音樂家》。

(中間有一段大家熟悉的歌,聽出來的朋友評論區見)

玩法6:說的跟唱的一樣

我有個同事,就是雷軍的粉絲,不是米粉,單純就是B站鬼畜區知名歌手雷布斯的粉絲。

鬼畜簡單來說,就是通過調音,把一句話變成歌聲~B站上個個都是人才,但對於普通人來說,這種操作還是很難。

不妨試試這個Word Synth吧~

你只要輸入一些單詞,然後就能按照自己的喜好調節旋律,探索不同的聲音、聲調的組合,嘗試構建鬼畜一般的歌聲。

我們嘗試了一下,限於只能放三個視訊,這裡就用一個動圖和一個音訊呈現了:

640?wx_fmt=gif

這個專案背後,主要應用了谷歌雲的文字轉語音API,它靠DeepMind開發的WaveNet來合成你聽到的這些聲音。

玩法7:用聲音畫畫

640?wx_fmt=jpeg

這其實是一個音樂視覺化的工具。

所謂的音樂,既包括人聲也包括多種樂器。你可以開啟麥克風自己哼唱,也能呼叫內建的聲音看看效果。

所有輸入的聲音,能夠以不同的模式呈現,比方Hilbert Scope以及Spectrogram,能夠顯示出聲音的細緻紋理和旋律的形狀。

據一位聾人音樂家表示,這個工具還能更好的幫助他們在聽不到或者聽不清聲音的情況下,更好的學習歌唱。

正經揭祕

但,谷歌搞出這麼多奇妙的功能,並不是只想讓你玩一天而已。

所有以上這些,是一個被稱為Creatability的專案,旨在探索如何通過網路和AI技術,讓更多人能夠釋放自己的創造力。

紐約大學的Claire Kearney-Volpe,曾經作為藝術治療師遇到過各行各業的人,她認為每個人都能從參與創作的過程中受益。

640?wx_fmt=png

例如通過畫畫、製作音樂等方式,幫助患有自閉症的中學生;藉助不同的技術手段,為盲人構建工具以完成晚宴的規劃和設計。

正是秉持著同樣的目的,她和谷歌團隊、無障礙社群的夥伴合作,共同搞出了Creatability專案。

在這個專案的幫助下,即便你聽不見,也能參與音樂創作。即便你行動不便,可以對著螢幕動動手指或者腦袋,也能感受到音樂的魅力。

在谷歌的宣傳片中,行動不便人士的笑容真的很燦爛。

640?wx_fmt=gif

640?wx_fmt=gif

這一專案背後的AI動力,主要是谷歌的TensorFlow.js等工具,讓機器學習技術能夠在瀏覽器中實現。

無論你是老師、學生、研究人員還是藝術家,都可以參與其中。你可以玩,也可以利用相關技術,開發並提交自己創造的專案。

當然前提是你還得有科學的方法才能訪問~

傳送門

這些專案的官網:g.co/creatability

GitHub:https://github.com/googlecreativelab/creatability-components

加入社群

量子位AI社群開始招募啦,歡迎對AI感興趣的同學,在量子位公眾號(QbitAI)對話介面回覆關鍵字“交流群”,獲取入群方式;

此外,量子位專業細分群(自動駕駛、CV、NLP、機器學習等)正在招募,面向正在從事相關領域的工程師及研究人員。

進專業群請在量子位公眾號(QbitAI)對話介面回覆關鍵字“專業群”,獲取入群方式。(專業群稽核較嚴,敬請諒解)

活動策劃招聘

量子位正在招聘活動策劃,將負責不同領域維度的線上線下相關活動策劃、執行。歡迎聰明靠譜的小夥伴加入,並希望你能有一些活動策劃或運營的相關經驗。相關細節,請在量子位公眾號(QbitAI)對話介面,回覆“招聘”兩個字。

640?wx_fmt=jpeg

量子位 QbitAI · 頭條號簽約作者

վ'ᴗ' ի 追蹤AI技術和產品新動態