1. 程式人生 > >溫暖的旅館:手機主動服務背後的秘密

溫暖的旅館:手機主動服務背後的秘密

手機

三百萬年以前,古人類第一次使用工具,便天然地揭示了人和動物的最大區別。鬥轉星移,人類緩慢地跨過了石器時代、青銅時代、鐵器時代乃至於近代的蒸汽、電氣時代。時至今日,信息科技日新月異,人類使用的工具也愈來愈豐富和便捷。

技術分享圖片

然而,縱然時代不同,世界經歷了滄桑巨變,人和工具的本質關系卻從未被真正地動搖。一直以來,人都必須主動地使用工具。工具是靜止的、無意識的,它只能被動地為人類服務。即便是堪稱是人類歷史以來最偉大的發明——智能手機,也難逃天命。

直到最近幾年人工智能技術的迅速發展,乃至去年全球第一款AI芯片麒麟970的問世和使用,我們看到:隨著手機AI的日益強大,人類和工具的關系似乎悄悄出現了某種被顛覆的可能性。這種可能性,正是基於AI手機的主動服務。

那麽,手機主動服務的背後,究竟有哪些秘密存在?

AI的主動:開啟解放雙手的時代

一直以來,要想獲取手機的信息或者對其發出指令,就必須要依賴手動操作。比如最原始的密碼或圖案解鎖。這些都存在操作失誤的可能,如果哪個熊孩子多輸錯了幾次,手機出於自我保護就可能要幾分鐘甚至幾十分鐘無法解鎖。為此,手機廠商開始探索藏於人體的天然的生物密碼。

移動端現有指紋識別、人臉識別和虹膜識別三種生物識別方式,而應用最廣泛的當數指紋識別,其被廣泛應用於解鎖、支付、進入應用等種種場景。與此同時,更為安全和精準的虹膜識別也處於緊鑼密鼓的開發當中。而隨著手機算力的提高,尤其是AI芯片的推出,其對人臉結構的分解也更為細致,手機人臉識別也正在成為標配。

技術分享圖片

在語音交互領域,當蘋果的Siri出現,其立刻引領了一股語音助手的熱潮。隨著技術的進步,市面上的絕大多數手機都加入了語音助手的功能。利用語音助手,人們只需要動動嘴就可以完成打電話、搜索等任務。有意思的是,給用戶講笑話卻是目前語音助手的常用功能。這可能也充分體現了我國人民風趣幽默的性格特點。然而如果只用手機講笑話,恍若有點大炮打蚊子的感覺。

生物識別和語音助手出現的歷史性意義比實際用途更為重要:對人的雙手的解放。而這,也是手機AI為實現主動服務而邁出的堅實的一步。

當華為P20發布,我們看到AI的主動服務已經聚焦在了攝影領域。其搭載的AI攝影大師系統可以實現從場景檢測、推薦規則、用戶習慣三個層面定義拍攝技術,為用戶帶來更加強大的拍照體驗。看起來,攝影技術是讓用戶越來越傻,所有的問題都交由手機來解決,用戶只需要點一下快門甚至說一聲“拍照”,就可以享受手機為自己帶來的視覺盛宴。

當手機主動服務的範圍越來越廣,或許有必要把這些分散式的服務綜合起來,來給用戶帶來更深度的服務體驗。比如榮耀推出的Magic Live系統,其可以自動添加聯系人、識別微信聊天內容,為你建立事件檔案並發布提醒。

而主動服務目前在華為手機上體現最為直接的應屬情景智能功能。比如你購買了一張火車票,手機會在出發前的三天對你進行每天的提醒,在出發之前為你規劃路線,預計所需時間等。又或者記錄你的停車位置,不止於在開開心心地逛完商場之後出門不知道車停在那兒了。更多的比如提示下雨出門帶傘、即時跟蹤快遞信息等。

技術分享圖片

這些智能提醒功能實際上已經初步具備了主動服務的形態。其運行模式也相對簡單,集中對單個的信息進行獨立的提取分析,而且主要是基於地理、天氣、交通三個系統的提醒。換句話說,這些都是既定的模式,只需要經過少量的數據分析和處理就能得出相應的結論,然後作出提醒。

然而,更高級的主動服務形態勢必不是基於既定程序和數據的分析,而是通過對人的習慣、愛好和思維方式的學習,來實現手機對人的思考。

這樣一個實現的過程可以總結為:從一開始的人學習操作手機,到現在的手機向人學習,從而更像人。

乍一聽似乎非常玄妙,其實體現在主動服務的進化上,完全可以用兩個詞來解釋:提醒和建議。

我們上面說到,情景智能的運行模式是對單個信息進行獨立的提取分析,再結合地理位置等信息後作出有關交通、天氣等“提醒”。那麽,更深度的主動服務對單個信息的處理則要調動更為復雜的手機模塊來進行綜合分析處理,然後提出“建議”。

比如你對手機說“我想看電影”,手機就會根據你的觀影傾向比如評分、題材、電影院等給你買好一張電影票,然後安排好最適宜的出行方式、路線,給出觀影結束後的活動建議。又如你來到一家餐廳,手機會根據你的習慣主動幫你點餐,或者根據你的用餐口味點一些你從來沒有吃過但是會喜歡吃的菜。

這就需要更強大算法和算力來進行數據的儲存和處理。在慢慢對人進行學習的過程中,能夠進一步地理解和判斷人的意向,從而由最初的人能用手機幹什麽向手機能為人做什麽轉化,手機也就越來越像人。

我們的雙手,也便在這樣的被理解中解放,得以騰出空來去完成其他的事業。

托起的可能:硬實力的背後加持

世界上第一臺計算機問世的時候,誰也沒有想到它的體積會越來越小,但算力會變得如此之強大。從電子管、晶體管、集成電路再到如今的量子計算機,從最初的每秒5000次計算到如今的接近10億億次,人類技術進步的腳步快得令人窒息。

正是擁有如此強大的運算能力,計算機在當下的應用廣泛程度才無可匹敵。由此觀之,要實現對人類行為的計算理解,硬件的保障顯得十分重要。

所以,首先必須要為手機裝上一個智能大腦,而這個大腦就是AI芯片。麒麟970是球首款內置神經網絡單元(NPU)的人工智能處理器。它的加入,讓手機各主體單元的分工更加明確和細致:GPU和CPU負責計算的速度和力度,NPU則負責計算的深度,再加上負責提高AI性能密度的HiAI移動計算架構則,計算任務被明確分配,資源調配的獨立進行在各個模塊上實現了可能。這就實現了在移動終端進行深度學習、神將網絡技術等任務的進行,為整體計算工作大大的提高了效率。可以說,AI芯片的算力加持,是一切主動服務的首要前提。

技術分享圖片

然而,在提升配置、改進AI芯片的基礎上,也必須要對手機的基礎的傳感器硬件進行升級。比如現在手機更新中非常重視的攝像頭。從最初諾基亞的200萬像素到如今P20的高達4000萬像素,攝像頭像素的提升令照片更清晰、更精細。在未來你看到一件喜歡的東西,只需要拍照就能自動購買的時候,高清的照片會讓手機識別得更快更精準,減少買錯的可能。又如對語音識別模塊的技術提高,可以讓手機適應多種環境下的收音功能,尤其是在嘈雜的環境或者會議低聲場下,讓手機更快速精準地識別語音,從而做出相應的理解和應答。

除了讓手機輕松地進行圖像識別和語音識別,為了推進更好的主動服務,也可以嘗試著加強手機的空間感知能力。這樣,當你從口袋裏拿出手機,手機就可以根據你掏出手機的角度、方向等來判斷你的目的是解鎖、拍照還是接聽電話。在拍照的時候,陀螺儀可以檢測你按下快門的瞬間的手機抖動幅度,然後自動修復偏移誤差。再比如借助陀螺儀的定位功能,在GPS信號弱的時候可以根據手機移動距離來進行暫時的導航。此外,在VR遊戲等場景下,陀螺儀的重要性也不言自明。

這就像一位學武之人,他若想修煉出一套獨門劍術,就必須要有一身鋼筋鐵骨、一把絕世利器。外修於形,內練於神,才能利刃出鞘,天下拜服。

同樣,以AI芯片為主導,圍繞著其增強硬件配置,同時發揮手機內部各模塊之間的聚合效應,才能為手機主動服務的落地提供硬性條件。

風險的平息:安全是上臺的底氣

也許會有人擔心:如果一切硬件、軟件、AI生態等條件統統達到了標準,基於用戶個性而打造的主動服務也必然會讀取大量的用戶私人信息。可以說,人好似在手機裏裸奔。其綁定的各種金融賬戶一旦遭竊,輕易就能令人一夜回到解放前。Facebook隱私泄露事件至今折騰得小紮焦頭爛額,萬一在手機裏出現這樣重大的安全事件怎麽辦?

技術分享圖片

所以,數據安全、本地算力和傳感器豐富三者協同共進,才能共同構成手機主動服務的前提。

AI芯片的研發與應用其實正是解決這個問題的最好辦法。普通的CPU和GPU算力不足,其在處理用戶數據的時候往往會將其上傳到雲端。雖然雲端加密技術也在不斷地進步,但在上傳和返回的途中仍然會存在泄密的可能。蘋果的iCloud被破解導致好萊塢眾女星顏面盡失,慘痛的教訓歷歷在目。而AI芯片的強大算力令對數據的處理在移動終端就可以實現,不上雲就斷絕了泄漏的可能。移動終端就相當於一個U盤,把U盤揣兜裏還能有被復制的可能的話,那這個世界的技術估計必須得經歷一次前所未有的爆炸,甚至……推翻現有的物理理論體系。這個在理論上顯然不太可能。

另一方面必須要註意的是,AI獲取用戶的數據必須要建立在一個基礎上:用戶的授權。一切未經用戶的授權而讀取隱私和硬性要求授權的行為都是耍流氓,我們必須要堅決抵制這種流氓行徑。只有用戶讓手機理解自己,手機才能理解。生殺大權仍然是用戶掌握。

用戶的數據又可以分為兩類:核心數據和非核心數據。

核心數據,顧名思義,是對用戶極其重要的數據內容。如支付密碼。上文提到的即拍即買中“買”的行為就必須要涉及到手機支付,而手機支付就必須要用到支付密碼。由於涉及到資金的安全,手機只有在用戶授權自動劃撥的情況下,才能完成這一服務,否則就是無稽之談。又如對用戶地理位置信息的記錄。如果用戶不授權AI的GPS定位,那麽諸如停車位置、目的地規劃也就無法實現。因此,種種涉及到用戶的資金、位置、照片等隱私數據的讀取,都必須要經過用戶的授權才可以。

技術分享圖片

非核心數據,則是手機必須要讀取的用戶信息,且只在本手機上才能使用。如開鎖用的用戶指紋、面部結構,用於接收語音服務、識別等指令的聲紋等,這類信息功能定向,不具有普遍適用性和價值,是進行手機操作的必備數據。這類數據基本不存在授權的問題。

從這個層面上來講,主動服務實質上是用戶的一種情願行為。在用戶授權的前提下讀取數據,訓練手機AI的理解力和關懷力,才會讓用戶覺得到被理解和被關懷的溫暖。牛不喝水強摁頭,不是AI服務的邏輯。

此外,在應對本地數據安全方面,手機也會提供一些加密方法。比如為了保護用戶的圖片、音頻、視頻和文檔等數據,專門開發保密櫃功能,給用戶隱私再加上一塊防盜大鎖。

移動終端計算、用戶授權和保密功能的多重數據隱私保護手段齊下,讓用戶的隱私零泄漏,才是能讓用戶主動服務在這個溫暖的旅館中安然入睡的最優方案。

當手機的主動服務被徐徐打開,也就意味著更多變革的可能。工具從此被賦予了更廣闊的意義:它不再是被人施以冰冷的指令去執行,而是用心去感知人的靈魂與情感。它愈加像人,又保持著距離,跟隨著刀耕火種一路走來,也將以新的姿態緊隨著我們,在未來之路上昂首而立。


溫暖的旅館:手機主動服務背後的秘密