谷歌AI的七個“不正經”玩法,個個能玩一整天
郭一璞 問耕 發自 凹非寺 量子位 報道 | 公眾號 QbitAI
誰說AI只能搞一些一本正經的工作?
谷歌最近就放出了幾隻比較搞笑的AI,可以完成一些不走尋常路的工作,比如:幫你實現靠臉吃飯,讓你說的跟唱的一樣~
是謂:谷歌AI的七個“不正經”玩法。
每個我都能玩一整天~
玩法1:跳著舞就把琴彈了
正常人彈琴,都是乖乖的坐在鋼琴前按鍵盤,或是以演奏姿勢抱著吉他、手風琴彈。
但是谷歌這個名叫Body Synth的專案不一樣,是讓你在電腦前,以手為鍵,以腿為弦,手舞足蹈,自己彈自己。
先看一下效果,請欣賞由量子位帶來的谷歌AI樂器獨奏:《和絃》
其中的原理很簡單,開啟攝像頭,自動開啟人體姿態識別,四肢和腦袋分別對應不同的音調。
只要監測到身體某個部分有動作,就可以發出對應的音調。
跟我念,
1~2~3~4~5~6~7~
do re mi fa so la si~
以預設的C大調為例,搖頭晃腦,發出的就是so的聲音。
動動左手,就是mi。
動動右手,就是do。
動動右腿,就是低音so。
動動左腿,就是低音do。
即使轉身背對鏡頭,也是一樣可用。
另外,你還可以設定音色音調。
或者開啟語音控制開關,預設的音色是吉他,喊一聲strings,就可以變成管絃樂,喊一聲drums,就可以變成鼓點。
玩法2-5:靠臉吃飯
除了“靠四肢彈琴”,還可以“靠臉吃飯”。
當然,不是真的靠臉吃飯的意思,而是你可以用臉來完成一系列工作(混口飯吃)。
比如說,依靠Sound Canvas
開啟Sound Canvas之後,預設是用鍵鼠來畫畫。
這太低階了,簡直是windows 98自帶畫圖程式的水平。
所以,需要先把Tracking改一下,選中Body,就可以開啟攝像頭,用臉畫畫了。
此時,你臉的朝向就是螢幕上畫筆的位置,慢慢移動自己的腦袋,微微轉頭,就可以在螢幕上勾勒線條。
比如,寫“量子位”三個字。
人呀,一旦發現了臉的用途,就開始開發新工具。
除了寫字,還可以彈琴。
Keyboard就是用來彈琴的。和用臉寫字的操作差不多,臉的朝向就是小圓點在螢幕上的位置,操控小圓點敲擊螢幕上的琴鍵,就可以發出對應的聲音。
和前面的“跳舞彈琴”一樣,Keyboard上也可以選擇不同的音色音調,如果你覺得只有5個音不夠發揮的話,可以設定到最多15個琴鍵,兩個八度足夠演奏很多音樂了。
當然,兩個八度的話,琴鍵太窄了,臉太大不好操作,可以切換回滑鼠操作……
熟悉了之後,還可以玩Clarion Lite,雖然也是一個用臉彈琴的專案,不過做了幾種不同的花樣。
螢幕上的每個彩色區域都應對這一個音調,同樣用臉把小圓點放上去即可觸發,搖頭晃腦,樂聲出現。
但是,演奏樂曲對音樂知識還是有一點要求的,有沒有小白即刻上手(上臉)的操作?
沒問題,谷歌還準備了“用臉當DJ”的Sampler專案,包含鼓點、吉他、號角、古鋼琴四段簡短的音樂,只要用臉控制小圓點移動上去,就開始自動播放。
現在,請欣賞下一個節目,由量子位為大家演奏《靠臉吃飯的音樂家》。
(中間有一段大家熟悉的歌,聽出來的朋友評論區見)
玩法6:說的跟唱的一樣
我有個同事,就是雷軍的粉絲,不是米粉,單純就是B站鬼畜區知名歌手雷布斯的粉絲。
鬼畜簡單來說,就是通過調音,把一句話變成歌聲~B站上個個都是人才,但對於普通人來說,這種操作還是很難。
不妨試試這個Word Synth吧~
你只要輸入一些單詞,然後就能按照自己的喜好調節旋律,探索不同的聲音、聲調的組合,嘗試構建鬼畜一般的歌聲。
我們嘗試了一下,限於只能放三個視訊,這裡就用一個動圖和一個音訊呈現了:
這個專案背後,主要應用了谷歌雲的文字轉語音API,它靠DeepMind開發的WaveNet來合成你聽到的這些聲音。
玩法7:用聲音畫畫
這其實是一個音樂視覺化的工具。
所謂的音樂,既包括人聲也包括多種樂器。你可以開啟麥克風自己哼唱,也能呼叫內建的聲音看看效果。
所有輸入的聲音,能夠以不同的模式呈現,比方Hilbert Scope以及Spectrogram,能夠顯示出聲音的細緻紋理和旋律的形狀。
據一位聾人音樂家表示,這個工具還能更好的幫助他們在聽不到或者聽不清聲音的情況下,更好的學習歌唱。
正經揭祕
但,谷歌搞出這麼多奇妙的功能,並不是只想讓你玩一天而已。
所有以上這些,是一個被稱為Creatability的專案,旨在探索如何通過網路和AI技術,讓更多人能夠釋放自己的創造力。
紐約大學的Claire Kearney-Volpe,曾經作為藝術治療師遇到過各行各業的人,她認為每個人都能從參與創作的過程中受益。
例如通過畫畫、製作音樂等方式,幫助患有自閉症的中學生;藉助不同的技術手段,為盲人構建工具以完成晚宴的規劃和設計。
正是秉持著同樣的目的,她和谷歌團隊、無障礙社群的夥伴合作,共同搞出了Creatability專案。
在這個專案的幫助下,即便你聽不見,也能參與音樂創作。即便你行動不便,可以對著螢幕動動手指或者腦袋,也能感受到音樂的魅力。
在谷歌的宣傳片中,行動不便人士的笑容真的很燦爛。
這一專案背後的AI動力,主要是谷歌的TensorFlow.js等工具,讓機器學習技術能夠在瀏覽器中實現。
無論你是老師、學生、研究人員還是藝術家,都可以參與其中。你可以玩,也可以利用相關技術,開發並提交自己創造的專案。
當然前提是你還得有科學的方法才能訪問~
傳送門
這些專案的官網:g.co/creatability
GitHub:https://github.com/googlecreativelab/creatability-components
— 完 —
加入社群
量子位AI社群開始招募啦,歡迎對AI感興趣的同學,在量子位公眾號(QbitAI)對話介面回覆關鍵字“交流群”,獲取入群方式;
此外,量子位專業細分群(自動駕駛、CV、NLP、機器學習等)正在招募,面向正在從事相關領域的工程師及研究人員。
進專業群請在量子位公眾號(QbitAI)對話介面回覆關鍵字“專業群”,獲取入群方式。(專業群稽核較嚴,敬請諒解)
活動策劃招聘
量子位正在招聘活動策劃,將負責不同領域維度的線上線下相關活動策劃、執行。歡迎聰明靠譜的小夥伴加入,並希望你能有一些活動策劃或運營的相關經驗。相關細節,請在量子位公眾號(QbitAI)對話介面,回覆“招聘”兩個字。
量子位 QbitAI · 頭條號簽約作者
վ'ᴗ' ի 追蹤AI技術和產品新動態