如何快速構建深度學習影象資料集

阿新 • • 發佈：2018-12-13

1、介紹

為了構建我們的深度學習影象資料集，我們將利用微軟的Bing影象搜尋API，這是微軟認知服務的一部分，用於將AI應用在視覺，語音，文字等的軟體。

2、建立您的Cognitive Services帳戶

點選下面的網頁進入： https://azure.microsoft.com/en-us/try/cognitive-services/?api=bing-image-search-api 如截圖中，要註冊Bing影象搜尋API，請單擊“獲取API金鑰”按鈕。從那裡您可以通過登入您的Microsoft，Facebook，LinkedIn或GitHub帳戶進行註冊（為了簡單起見，我使用GitHub）。完成註冊過程後，您將在您的API頁面看到類似於我的瀏覽器的頁面：

3、使用Python構建深度學習資料集

3.1 閱讀文件

如果您對 API如何工作或我們在發出搜尋請求後如何使用API 有任何疑問，您應該參考這兩個頁面。

3.2 安裝requests包

$ workon your_env_name
$ pip install requests

3.3 建立指令碼檔案SearchBingAPI.py來下載影象

'''
任務： 利用BING API從網上抓取特定圖片，作為人臉識別的資料集。
操作： 1. 在linux下，命令列輸入： python SearchBingAPI.py --query "鍾漢良" --output DataSet/ZhongHanLiang
      2. 註釋掉ap.add_argument部分，對建立的args字典直接輸入值後，執行SearchBingAPI檔案即可。
    - 2018/7/4
    - kerrwy
''' 


from requests import exceptions
import argparse
import requests
import cv2
import os

# 1. 解析輸入引數
ap = argparse.ArgumentParser()
# ap.add_argument("-q", "--query", required=True,
#                 help="search query to Bing Image APT for")
# ap.add_argument("-o", "--output", required=True,
#                 help="path to output directory of image") 

args = vars(ap.parse_args())  # vars() 函式返回物件object的屬性和屬性值的字典物件，接收的物件為命令列中輸入的。


# args["query"] = "鍾漢良"
# try:
#     os.mkdir("./DataSet/ZhongHanLiang")
# except Exception as e:
#     print("[INFO] Path have made.")
#
# args["output"] = r"./DataSet/ZhongHanLiang"

# args["query"] = "鄧超"
# try:
#     os.mkdir("./DataSet/DengChao")
# except Exception as e:
#     print("[INFO] Path have made.")
#
# args["output"] = r"./DataSet/DengChao"

# args["query"] = "蔣勤勤"
# try:
#     os.mkdir("./DataSet/JiangQinQin")
# except Exception as e:
#     print("[INFO] Path have made.")
#
# args["output"] = r"./DataSet/JiangQinQin"

args["query"] = "趙麗穎"
try:
    os.mkdir("./DataSet/ZhaoLiYing")
except Exception as e:
    print("[INFO] Path have made.")

args["output"] = r"./DataSet/ZhaoLiYing"


# 2. 配置一些全域性變數
MAX_RESULTS = 50  # 總共需要的圖片張數
GROUP_SIZE = 25   # 每頁搜尋多少張
API_KEY = "abd938ec58594f5f9aa680d030175fcc"
URL = "https://api.cognitive.microsoft.com/bing/v7.0/images/search"

# 3. 先列出搜尋過程中可能出現的異常,在後面捕捉並優雅處理。
EXCEPTIONS = set([IOError, FileNotFoundError, exceptions.RequestException,
                  exceptions.HTTPError, exceptions.ConnectionError, exceptions.Timeout])

# 4. 初始化搜尋引數並進行搜尋
term = args["query"]  # 影象查詢內容：如胡歌
headers = {"Ocp-Apim-Subscription-key": API_KEY}
params = {"q": term, "offset": 0, "count": GROUP_SIZE}

print("[INFO] searching Bing API for '{}'".format(term))
search = requests.get(URL, headers=headers, params=params)
search.raise_for_status()

result = search.json()
estNumResults = min(result["totalEstimatedMatches"], MAX_RESULTS)
print("[INFO] {} total result for '{}'".format(estNumResults, term))

total = 0

# 5.批處理結果的估計數量,搜尋5次，每次50張
for offset in range(0, estNumResults, GROUP_SIZE):
    print("[INFO] Making request for group {}-{} of {}...".format(offset, offset+GROUP_SIZE, estNumResults))
    params["offset"] = offset
    search = requests.get(URL, headers=headers, params=params)
    search.raise_for_status()
    result = search.json()
    print("[INFO] saving images for group {}-{} of {}...".format(offset, offset+GROUP_SIZE, estNumResults))

    # 6. 儲存當前批次中的影象
    for v in result["value"]:
        try:
            # 請求下載影象
            print("[INFO] fetching: {}".format(v["contentUrl"]))
            r = requests.get(v["contentUrl"], timeout=30)

            # 定義輸出影象的路徑
            ext = v["contentUrl"][v["contentUrl"].rfind("."):]   # '.jpg'
            p = os.path.sep.join([args["output"], "{}{}".format(str(total).zfill(8), ext)])  # 路徑分割符'/'

            # 影象寫入磁碟
            f = open(p, "wb")
            f.write(r.content)
            f.close()

        # 捕捉不能下載影象的錯誤
        except Exception as e:
            if type(e) in EXCEPTIONS:
                print("[INFO] Skipping: {}".format(v["contentUrl"]))
                continue

        image = cv2.imread(p)
        if image is None:
            print("[INFO] deleting: {}".format(p))
            # 從磁碟中刪除
            os.remove(p)
            continue



我們可以通過使用一些find 計算每個查詢下載的影象總數。



$ find . -type d -print0 | while read -d '' -r dir; do
> files=("$dir"/*)
> printf "%5d files in directory %s\n" "${#files[@]}" "$dir"
> done
    2 files in directory .
    5 files in directory ./dataset
  235 files in directory ./dataset/bulbasaur
  245 files in directory ./dataset/charmander
  245 files in directory ./dataset/mewtwo
  238 files in directory ./dataset/pikachu
  230 files in directory ./dataset/squirtle

4、結束語

正如你所看到的，你只需要刪除每個類的一些影象。Bing Image Search API工作得非常好！

如何快速構建深度學習影象資料集

1、介紹為了構建我們的深度學習影象資料集，我們將利用微軟的Bing影象搜尋API，這是微軟認知服務的一部分，用於將AI應用在視覺，語音，文字等的軟體。 2、建立您的Cognitive Services帳戶點選下面的網頁進入： https://azure

深度學習影象資料集擴充辦法：翻轉、旋轉、拉伸、五部分提取、明暗度變化python

一：日誌依賴二：程式碼實現 from diagnose_logging import Logger from PIL import Image import os # 宣告日誌 log = Logger('img_pre.py') logger = log.g

深度學習常用資料集 API

基準資料集深度學習中經常會使用一些基準資料集進行一些測試。其中 MNIST, Cifar 10, cifar100, Fashion-MNIST 資料集常常被人們拿來當作練手的資料集。為了方便，諸如 Keras、MXNet、Tensorflow 都封裝了自己的基礎資料集，如

機器學習、深度學習開源資料集分享

轉自：機器學習演算法與Python學習機器學習演算法與Python學習微訊號guodongwei1991 功能介紹作為溝通學習的平臺，釋出機器學習與資料探勘、深度學習、Python實戰的前沿與動態，歡迎機器學習愛好者的加入，希望幫助你在AI領域更好的發展，期待與你相遇！今天

深度學習常用資料集資源（計算機視覺領域）

目錄 1、MNIST 2、ImageNet 4、COCO 5、PASCAL VOC 6、FDDB 1、MNIST 深度學習領域的入門資料集，當前主流的深度學習框架幾乎都將MNIST資料集的處理

有無GPU執行深度學習mnist資料集時間對比

#硬體配置 *本人用的是 lenovo小新銳7000筆記本，cpu是intel -core -i5-7300Q 四核，記憶體4G，機械硬碟320G，雙顯示卡，整合intel® HD Graphics630 獨顯 GeForce GTX 1050，這塊顯示卡位寬1

深度學習開放資料集

摘要：還在發愁找不到資料集訓練你的模型？快來收藏一下史上最全的深度學習資料集彙總吧，有它在，一切都ok~ 介紹深度學習的關鍵是訓練。無論是從影象處理到語音識別，每個問題都有其獨特的細微差別和方法。但是，你可以從哪裡獲得這些資料？現在你看到的很多研究論文都使用專有

深度學習常用資料集介紹

各領域公開資料集下載 1.Mnist 手寫字型資料集官方資料集下載 MNIST資料集簡介轉載戳這裡 MNIST（Mixed National Institute of Standards and Technology database）是一個計算機視覺資料集，它包

深度學習常用資料集

NIST: similar to MNIST, but largerPerturbed NIST: a dataset developed in Yoshua’s class (NIST with tons of deformations)CIFAR10 / CIFAR100: 32×32 natural i

深度學習中資料集很小是一種什麼樣的體驗

# 前言今天提一個比較輕鬆的話題，簡單探討資料集大小對深度學習訓練的影響。不知道大家有沒有看過這篇文章：[Don't use deep learning your data isn't that big](https://simplystatistics.org/2017/05/31/deeplearni

《Gluon 動手學深度學習》顯示影象資料集Fashion-MNIST

%matplotlib inline import sys sys.path.append('..') import gluonbook as gb from mxnet.gluon import data as gdata import time mnist_train=gdata.vision

快速上手深度學習掌握TensorFlow模型構建與開發

第5章第6章優勢損失函數學習過程 htm 項目機器過程第1章課程介紹介紹機器學習的背景，介紹tensorflow的背景，介紹課程python，numpy，virtualenv等前置學習內容，安裝tensorflow1-1 導學1-2 課程安排1-3 深度學習

[深度學習][CIFRA資料處理] Python 讀取CIFRA-10資料集

CIFRA-10資料集介紹：https://blog.csdn.net/weixin_41028208/article/details/85145776 CIFRA-10資料集結構以Python載入，每個批處理檔案都包含一個字典，包含以下elements：

[深度學習][CIFRA資料處理] CIFRA-10 與 CIFRA-100 資料集介紹

作為主流的分類資料集，這一篇主要講 CIFRA-10 與 CIFRA-100 資料集下載與Python版本的處理資料集下載地址：http://www.cs.toronto.edu/~kriz/cifar.html 資料介紹 CIFAR-10和CIFAR-100是兩

機器學習&amp;深度學習視訊資料彙總

pandax視訊教程連結: https://pan.baidu.com/s/1pLqavVX 密碼: fath python入門到精通連結: https://pan.baidu.com/s/1mhVNIkC 密碼: cvp3

騰訊AI Lab開源業內最大規模多標籤影象資料集（附下載地址）

參加 2018 AI開發者大會，請點選 ↑↑↑ 今日（10 月 18 日），騰訊AI Lab宣佈正式開源“Tencent ML-Images”專案。該專案由多標籤影象資料集 ML-Images，以及業內目前同類深度學習模型中精度最高的深度殘差網路 ResNet-101 構成。

深度學習之資料增強庫imgaug使用方法

在上一篇文章中，介紹了常用的資料增強的方法，並提到了實現這些方法的一個庫imgaug，這篇文章就對該庫的使用方法進行一個總結。 1 介紹 imgaug是一個用於機器學習實驗中影象增強的python庫，支援python2.7和3.4以上的版本。它支援多種增強技術，允許輕鬆組合這些技術，具

深度學習相關資料總結

近這兩年裡deep learning技術在影象識別和跟蹤等方面有很大的突破，是一大研究熱點，裡面涉及的數學理論和應用技術很值得深入研究，這裡總結一些在微博釋出和轉載的相關資料，以便查閱：一、 @winsty #NIPS2013#

建立自己的影象資料集

適用範圍 1、python機器學習庫scikit learn 2、有監督/無監督程式碼組成 1、裁剪圖片建立初始影象資料集 2、將影象資料集轉換為可以訓練的模式我們在運用機器學習演算法對影象進行分類、識別時，是將二維矩陣拉成一維向量。skl

深度學習影象標註工具LabelImg安裝說明

Python3.5.0、PyQt5、lxml 安裝Python3.5.0: Python3.5.0的下載地址（官網）在安裝過程中，有一個自動新增安裝路徑到環境變數的步驟，如果不想後面手動配置環境變數的話，就可以先這樣做：按照圖片中說的

如何快速構建深度學習影象資料集

1、介紹

2、建立您的Cognitive Services帳戶

3、使用Python構建深度學習資料集

3.1 閱讀文件

3.2 安裝requests包

3.3 建立指令碼檔案SearchBingAPI.py來下載影象

4、結束語

相關推薦