曠視RPC大型商品資料集釋出!
近期,我們曠視南京研究院釋出了一個新零售自動結算場景下的大型商品資料集RPC(論文戳: RPC: A Large-Scale Retail Product Checkout Dataset ),旨在為相關領域的基礎研究提供一個演武場。

RPC資料集的特點
- 【量大】:無論商品類別(達200)還是影象總量(達83k)均是目前該領域之最。

- 【跨域】:RPC中影象資料分為「單品圖 exemplar image」和「結算圖 checkout image」兩種形態。模型需在單品圖上進行訓練,但真正測試環境則為結算圖。


- 【真實】:在構造和採集結算圖時,我們儘可能追求模擬真實購買場景,無論商品類別、商品個數、擺放角度及遮擋等等因素均接近實際零售場景。
- 【層級】:RPC中的200類商品隸屬於17個商品大類(如方便麵、紙巾、飲料等),天然構成了層次的結構。
- 【難易】:對於RPC中的結算圖我們設計了三種難度:easy,medium和hard,包含的商品類別數和數量分別為:

- 【強弱】在監督資訊層面,我們為每張RPC的結算圖均提供了由弱(shopping list)到中(point)再到強(product bbox)的三種強度監督資訊。

Beyond RPC
除文章中定義的自動結算任務外,該資料集還可用於以下領域(但不限於)的科學研究:
- Few-shot detection / recognition
- Fine-grained detection / recognition
- Domain transfer learning
- Multi-category counting
- Online learning
- Weakly-supervised learning
- And many more ...
BTW,目前baseline還很低,歡迎大家來刷榜!
專案和下載連結速戳 :