1. 程式人生 > >【文獻閱讀】Fashion-MNIST: a Novel Image Dataset for Benchmarking Machine Learning Algorithms

【文獻閱讀】Fashion-MNIST: a Novel Image Dataset for Benchmarking Machine Learning Algorithms

https://blog.csdn.net/u011995719/article/details/77834375

        命名技巧:
        專案目的:
        資料來源:
        資料製作:

推薦閱讀:資料製作

paper 地址:https://arxiv.org/abs/1708.07747
資料集下載:https://github.com/zalandoresearch/fashion-mnist
上個月底突然被Fashion-MNIST刷屏,於是乎看看這個資料集是個什麼樣的資料集。
命名技巧:

Fashion-MNIST其命名很有技巧,“蹭”了MNIST,要不然也火不了。就像JAVAsript 的命名,JAVAsript和JAVA沒啥關係,就是“蹭”熱度,起個好名字啊!引用知乎 的圖片:
這裡寫圖片描述
專案目的:

製作這個資料集的目的就是取代MNIST,作為機器學習演算法良好的“檢測器”,用以評估各種機器學習演算法。為什麼不用MNIST了呢? 因為MNIST就現在的機器學習演算法來說,是比較好分的,很多機器學習演算法輕輕鬆鬆可以達到99%,因此無法區分出各類機器學習演算法的優劣。
為了和MNIST相容,Fashion-MNIST 與MNIST的格式,類別,資料量,train和test的劃分,完全一致。
資料來源:

paper中提到,資料來源於Zalando’s website . 這是什麼鬼? 查了一下才知道,Zalando是德國的電商, 其主要產品是服裝和鞋類。再一看作者,是Zalando研究部門的,好吧。可不可以認為是打廣告呢!剩下一大筆廣告費啊!作者是華人:肖涵。
資料來自不同gender group: men women kids and neutral ;並且,不包含白色的商品,因為白色商品與背景的對比度較低。

類別如下:
標註編號     描述
0     T-shirt/top(T恤)
1     Trouser(褲子)
2     Pullover(套衫)
3     Dress(裙子)
4     Coat(外套)
5     Sandal(涼鞋)
6     Shirt(汗衫)
7     Sneaker(運動鞋)
8     Bag(包)
9     Ankle boot(踝靴)

———————————————–分割線—————————————————-
名稱     描述     樣本數量     檔案大小     連結
train-images-idx3-ubyte.gz     訓練集的影象     60,000     26 MBytes     下載
train-labels-idx1-ubyte.gz     訓練集的類別標籤     60,000     29 KBytes     下載
t10k-images-idx3-ubyte.gz     測試集的影象     10,000     4.3 MBytes     下載
t10k-labels-idx1-ubyte.gz     測試集的類別標籤     10,000     5.1 KBytes     下載
資料製作:

在paper中有一點比較值得學習,就是圖片如何製作成 28*28的灰度圖的過程,可以借鑑此種方法來對自己的圖片進行“resize”。
最原始圖片是背景為淺灰色的,解析度為762*1000 的JPEG圖片。然後經過resampled 到 51*73 的彩色圖片。然後依次經過以下7個步驟,最終得到28*28的灰度圖
這裡寫圖片描述

    JPEG –> PNG
    裁剪背景
    按比例: max(h,w)28

    將影象縮放,也就是將一個維度縮放至28
    銳化
    再擴充至28*28,再把object調整至圖片中央
    將負的畫素點剔除
    轉化成28*28的灰度圖

這一套方法覺得比平時僅採用resize或許會好,可以考慮嘗試
---------------------  
作者:TensorSense  
來源:CSDN  
原文:https://blog.csdn.net/u011995719/article/details/77834375?utm_source=copy  
版權宣告:本文為博主原創文章,轉載請附上博文連結!