【文獻閱讀】Fashion-MNIST: a Novel Image Dataset for Benchmarking Machine Learning Algorithms

阿新 • • 發佈：2018-11-10

https://blog.csdn.net/u011995719/article/details/77834375

        命名技巧：
        專案目的：
        資料來源：
        資料製作：

推薦閱讀：資料製作

paper 地址：https://arxiv.org/abs/1708.07747
資料集下載：https://github.com/zalandoresearch/fashion-mnist
上個月底突然被Fashion-MNIST刷屏，於是乎看看這個資料集是個什麼樣的資料集。
命名技巧：

Fashion-MNIST其命名很有技巧，“蹭”了MNIST，要不然也火不了。就像JAVAsript 的命名，JAVAsript和JAVA沒啥關係，就是“蹭”熱度，起個好名字啊！引用知乎的圖片：
這裡寫圖片描述
專案目的：

製作這個資料集的目的就是取代MNIST，作為機器學習演算法良好的“檢測器”，用以評估各種機器學習演算法。為什麼不用MNIST了呢？因為MNIST就現在的機器學習演算法來說，是比較好分的，很多機器學習演算法輕輕鬆鬆可以達到99%，因此無法區分出各類機器學習演算法的優劣。
為了和MNIST相容，Fashion-MNIST 與MNIST的格式，類別，資料量，train和test的劃分，完全一致。
資料來源：

paper中提到，資料來源於Zalando’s website . 這是什麼鬼？查了一下才知道，Zalando是德國的電商，其主要產品是服裝和鞋類。再一看作者，是Zalando研究部門的，好吧。可不可以認為是打廣告呢！剩下一大筆廣告費啊！作者是華人：肖涵。
資料來自不同gender group： men women kids and neutral ；並且，不包含白色的商品，因為白色商品與背景的對比度較低。

類別如下：
標註編號    描述
0    T-shirt/top（T恤）
1    Trouser（褲子）
2    Pullover（套衫）
3    Dress（裙子）
4    Coat（外套）
5    Sandal（涼鞋）
6    Shirt（汗衫）
7    Sneaker（運動鞋）
8    Bag（包）
9    Ankle boot（踝靴）

———————————————–分割線—————————————————-
名稱    描述    樣本數量    檔案大小    連結
train-images-idx3-ubyte.gz    訓練集的影象    60,000    26 MBytes    下載
train-labels-idx1-ubyte.gz    訓練集的類別標籤    60,000    29 KBytes    下載
t10k-images-idx3-ubyte.gz    測試集的影象    10,000    4.3 MBytes    下載
t10k-labels-idx1-ubyte.gz    測試集的類別標籤    10,000    5.1 KBytes    下載
資料製作：

在paper中有一點比較值得學習，就是圖片如何製作成 28*28的灰度圖的過程，可以借鑑此種方法來對自己的圖片進行“resize”。
最原始圖片是背景為淺灰色的，解析度為762*1000 的JPEG圖片。然後經過resampled 到 51*73 的彩色圖片。然後依次經過以下7個步驟，最終得到28*28的灰度圖
這裡寫圖片描述

    JPEG –> PNG
    裁剪背景
    按比例： max(h,w)28

    將影象縮放，也就是將一個維度縮放至28
    銳化
    再擴充至28*28，再把object調整至圖片中央
    將負的畫素點剔除
    轉化成28*28的灰度圖

這一套方法覺得比平時僅採用resize或許會好，可以考慮嘗試
---------------------
作者：TensorSense
來源：CSDN
原文：https://blog.csdn.net/u011995719/article/details/77834375?utm_source=copy
版權宣告：本文為博主原創文章，轉載請附上博文連結！

【文獻閱讀】Fashion-MNIST: a Novel Image Dataset for Benchmarking Machine Learning Algorithms

【文獻閱讀】Fashion-MNIST: a Novel Image Dataset for Benchmarking Machine Learning Algorithms

【論文閱讀】Meta-SR: A Magnification-Arbitrary Network for Super-Resolution

【文獻閱讀】玻利維亞Andes地區冰湖潰決影響建模（Ioannis Kougkoulos等人，2018.09，Natural Hazards）

【文獻閱讀】受山體陰影影響的冰湖製圖方法研究（Li JunLi等人，2018.09，IJRS）

【文獻閱讀】Stacked What-Where Auto-encoders -ICLR-2016

【博士文獻閱讀】2018-10-5

【論文閱讀】A Correlated Topic Model Using Word Embeddings

【論文閱讀】A Neural Probabilistic Language Model

文獻閱讀--A systematic approach to identify novel cancer drug targets using machine learning, inhibitor

【文章閱讀】【超解像】--Photo-Realistic Single Image Super-Resolution Using a Generative Adversarial Network

【論文閱讀】A Closer Look at Spatiotemporal Convolutions for Action Recognition

【論文閱讀】Quo Vadis, Action Recognition? A New Model and the Kinetics Dataset

【論文閱讀】Learning a Deep Convolutional Network for Image Super-Resolution

【矩陣乘法】OpenJ_POJ - C17F - A Simple Math Problem

【前端閱讀】——《活用PHP、MySQL建構Web世界》摘記之設計技巧

【線段樹】HUD1698:Just a Hook

【文章閱讀】短鏈接服務系統開發

【HDU 6191】Query on A Tree 【可持久化字典樹】

【二分答案】POJ - 1064 A - Cable master

主席樹+LCA【p2633 (bzoj2588】 Count on a tree

【文獻閱讀】Fashion-MNIST: a Novel Image Dataset for Benchmarking Machine Learning Algorithms

相關推薦