1. 程式人生 > >快消品影象識別丨無人店背後的商品識別技術

快消品影象識別丨無人店背後的商品識別技術

人工智慧一浪接一浪地席捲全球,AI的其中一個重要分支——計算機視覺,也如雨後春筍,不斷湧現出新的想法和應用。人臉識別已經逐漸滲透我們的日常生活,機器能夠認準人臉,想必大家都有所耳聞;而另一類計算機視覺的應用,是進行商品識別

當前新興的一些人零售店,背後就需要機器對商品進行自動識別,拍圖購物、AR互動營銷等場景,也運用了商品識別技術。人工智慧商業公司ImageDT,則利用商品影象識別技術提供2B商業服務,包括基於網際網路圖片大資料的商業分析,以及基於門店貨架識別渠道資料洞察,幫助消費品企業提升業績。今天,圖醬就跟大家科普應用在無人店、新零售中的商品識別技術。

資料邏輯

1 讓小孩“記住”超市裡的所有商品

我們教一個小孩識物的時候,比如“蘋果”,首先要讓他反覆的看到 “蘋果”,他便能認識“蘋果”;他可能會認錯,把“梨”認成“蘋果”,這個時候應該幫他指出來。小孩看到的“蘋果”越多,辨識的能力就越強。

0?wx_fmt=jpeg

基於深度神經網路的人工智慧,讓機器具備理解的能力,基本過程就像教一個小孩認蘋果一樣。首先要有大量的資料, 比如“蘋果”的圖片;同時,要增加大量機器會認錯的“負樣本”,比如“梨”的圖片;然後經過一個深度神經網路,反覆學習,最終獲得一個有效的識別模型。對於快消商品的識別,我們不僅要認出一個瓶子包裝,還要認出是一瓶酸奶還是啤酒;不僅要認出酸奶,還要認出是哪個品牌的酸奶,甚至是哪個口味和規格。要讓機器能夠準確識別成千上萬的快消商品SKU,是一項極其龐大而複雜的AI工程。

資料採集

2 讓機器獲得學習的原始素材

首先,我們需要梳理出所有的目標商品清單,並設法獲得每一件商品的圖片資料。根據商品的特徵辨識度,通常需要幾十到幾百張的有效圖片。資料採集是一套組合拳。電商平臺上擁有結構化的商品介紹圖片以及大量的買家晒圖,社交平臺上也能獲取到大量的消費者晒圖,是價效比最高的資料來源。超市店內的真實貨架資料,是最可靠的資料來源,但獲取和後期處理的成本都比較高。除此之外,ImageDT還通過自主研發智慧燈箱智慧採集車,模擬各種不同的場景對商品進行360°拍攝從而建立龐大的訓練資料庫,以此來獲取最豐富的訓練資料

0?wx_fmt=jpeg

資料標註

3 有多少人工,才有多少智慧採集到原始圖片資料,通常會混雜許多“髒資料”,需要進行清洗;大部分情況下,還需要對圖片中的物體進行標註

分類。只有可靠的資料才能產生高質量的識別模型。在每一個人工智慧公司,都有一支特殊的軍隊——資料標註團隊。ImageDT也不例外,在背後支撐這個團隊的是一個充滿黑科技的標註系統。

0?wx_fmt=jpeg

比如,圖片在標註前通常會先經過弱模型的處理,讓機器先解決 50%的問題;系統有支援批量標註的小圖模式,讓標註員可以一目十行,成倍提高標註的速度;產品經理反覆打磨每一個功能,做A/B測試,從每處細節提高標註的體驗和效率。除此之外,標註團隊還為不同任務配置了不同等級的質量保證機制,包括抽樣稽核、全量稽核、交叉校驗、埋點校驗等,確保讓機器學習最準確最可靠的訓練資料。

模型訓練

4 “活到老學到老”,機器也要不斷學習

準備好了資料,下一步就是讓機器進行學習,建立識別模型的過程。同樣的資料,選擇不同的神經網路演算法、以及不同的引數設定,將會影響最終模型的效果。模型建立之後,還需要進行管理:模型之間存在層次關係,資料和模型會存在版本的迭代,這些問題,當遇到大量商品類別的時候,顯得非常艱難。在ImageDT內部,有一個自助式的深度學習平臺,支援拖拉拽的演算法和引數測試,甚至一個非程式設計師都可以傻瓜式的完成一次建模任務,並獲得模型的效果評估報告。每一位ImageDT的新員工,不管是工程師,還是前臺,都會接受一次半小時的建模培訓;而在培訓結束後,每個人都將能夠獨立的建立一個影象識別模型,整個過程只需要半小時

0?wx_fmt=jpeg

同時,深度學習平臺就像一個模型倉庫,兼顧著物件、資料和模型的管理。整個建模的過程已經標準化,最快只需要一天,就能完成從資料採集、標註、建模到上線的整個流程ImageDT的研發團隊分為四個組,產品組、建模組、資料組和研究組。前三個組,負責實現流水線的搭建和經營,使得每天都能井井有條地建立大量新的商品識別模型,並快速上線,對每天數千萬的圖片資料進行識別和分析。研究組,則要克服各種疑難雜症,比如容易產生褶皺的軟包裝、商品側面和背面的識別、遮擋和反光環境下的識別等等。

0?wx_fmt=jpeg

目前,在實際生產環境下,已經達到95%以上的識別準確率。人臉都有眼睛、鼻子、嘴巴等固定的特徵,而超市中琳琅滿目的商品,則千奇百態。與人臉識別相比,商品識別有更高的工程複雜度。ImageDT正在做的,就是實現這個龐大的AI工程,讓機器能夠自動地、準確地識別每一件商品。零售智慧貨架演示

0?wx_fmt=gif