kaggle 入門系列翻譯（五） RSNA 肺炎預測

阿新 • • 發佈：2018-11-09

第二課：肺部X光結果的語義分割

本課主要介紹應用MD.ai使用U-Net來進行語義分割；

使用MD.ai註釋器檢視DICOM影象，並建立影象級別註釋。然後使用MD.ai python客戶端庫下載影象和註釋，準備資料集，然後用於訓練模型進行分類。

MD.ai官網如下：https://www.md.ai/

是一個專門用於醫療AI的開源庫，不過目前好像就只有這個kaggle專案呀，可以很方便的看這次比賽裡面的各個圖片。。

參照第一課安裝和匯入需要的庫並進行初始準備：

這裡需要匯入一個token，是mdai需要的，進入https://public.md.ai/hub/settings#tokens

頁面，登入後左側有個usersetting 的tab，點進去後可以點生成token。

p = mdai_client.project('aGq4k6NW', path='')

該行程式碼用於在網上搜索為aGq4k6NW的專案，path表示下載路徑，置空表示當前路徑。

pip install pydicom 
pip install tqdm 
pip install imgaug
pip install mdai

import os
import sys
import random
import math
import numpy as np
import cv2
import matplotlib.pyplot as plt
import json
import pydicom
from imgaug import augmenters as iaa

import skimage.io
import skimage.measure
from tqdm import tqdm
from PIL import Image

import requests
import shutil
import zipfile

import mdai

mdai_client = mdai.Client(domain='public.md.ai', access_token="")

p = mdai_client.project('aGq4k6NW', path='./lesson2-data')

p.show_label_groups()

labels_dict = {'L_A8Jm3d':1 # Lung   
              }

print(labels_dict)
p.set_labels_dict(labels_dict)

p.show_datasets() 

dataset = p.get_dataset_by_id('D_rQLwzo')
dataset.prepare()

image_ids = dataset.get_image_ids()
len(image_ids)

# 檢視部分訓練圖片 
mdai.visualize.display_images(image_ids[:3], cols=2)

下載UNet實現：

簡要介紹一下UNet:

UNET_URL = 'https://s3.amazonaws.com/md.ai-ml-lessons/unet.zip'
UNET_ZIPPED = 'unet.zip'

if not os.path.exists(UNET_ZIPPED): 
    r = requests.get(UNET_URL, stream=True)
    if r.status_code == requests.codes.ok:
        with open(UNET_ZIPPED, "wb") as f:
            shutil.copyfileobj(r.raw, f)
    else:
        r.raise_for_status()

    with zipfile.ZipFile(UNET_ZIPPED) as zf:
        zf.extractall()

進行訓練

imgs_anns_dict = dataset.imgs_anns_dict

from unet import dataset
from unet import dilated_unet
from unet import train

images, masks = dataset.load_images(imgs_anns_dict)

img_index = random.choice(range(len(imgs_anns_dict)))

print(img_index)
img_fps = list(imgs_anns_dict.keys())
img_fp = img_fps[img_index]
img = mdai.visualize.load_dicom_image(img_fp)
ann = imgs_anns_dict[img_fp]
img_width = img.shape[1]
img_height = img.shape[0]

mask = np.zeros((img_height, img_width), dtype=np.uint8) 
for a in ann:     
    vertices = np.array(a['data']['vertices'])
    vertices = vertices.reshape((-1,2))                     
    cv2.fillPoly(mask, np.int32([vertices]), (255,255,255))
    
plt.figure(figsize=(30, 20))
plt.subplot(2,3,1)
plt.imshow(img, cmap=plt.cm.bone)
plt.axis('off')

plt.subplot(2,3,2)
plt.imshow(mask, cmap=plt.cm.bone)
plt.axis('off')

plt.subplot(2,3,3)              
plt.imshow(cv2.bitwise_and(img, img, mask=mask.astype(np.uint8)), cmap=plt.cm.bone)
plt.axis('off')

plt.subplot(2,3,4)
plt.imshow(images[img_index,:,:,0], cmap=plt.cm.bone)
plt.axis('off')

plt.subplot(2,3,5)
plt.imshow(masks[img_index,:,:,0], cmap=plt.cm.bone)
plt.axis('off')

plt.subplot(2,3,6)
plt.imshow(cv2.bitwise_and(images[img_index,:,:,0], images[img_index,:,:,0], 
                           mask=masks[img_index,:,:,0].astype(np.uint8)), cmap=plt.cm.bone)
plt.axis('off')

import tensorflow as tf 
config = tf.ConfigProto()
config.gpu_options.allow_growth = True

CONFIG_FP = 'unet/configs/11.json'
name = os.path.basename(CONFIG_FP).split('.')[0]
print(name)

with open(CONFIG_FP, 'r') as f:
    config = json.load(f)

# increase the number of epochs for better prediction 
history = train.train(config, name, images,masks, num_epochs=20)

#畫出學習曲線

import matplotlib.pyplot as plt

print(history.history.keys())

plt.figure()
plt.plot(history.history['acc'], 'orange', label='Training accuracy')
plt.plot(history.history['val_acc'], 'blue', label='Validation accuracy')
plt.plot(history.history['loss'], 'red', label='Training loss')
plt.plot(history.history['val_loss'], 'green', label='Validation loss')
plt.legend()
plt.show()

from keras.models import load_model
import keras.backend as K

model_name = 'unet/trained/model_'+name+'.hdf5'
print(model_name)
model = load_model(model_name, custom_objects={'dice': train.dice, 'iou': train.iou})

images, masks = dataset.load_images(imgs_anns_dict)

plt.figure(figsize=(20, 10))

img_index = random.choice(range(len(images)))

plt.subplot(1,4,1)
random_img = images[img_index,:,:,0]
plt.imshow(random_img, cmap=plt.cm.bone)
plt.axis('off')
plt.title('Lung X-Ray')

plt.subplot(1,4,2)
random_mask = masks[img_index,:,:,0]
plt.imshow(random_mask, cmap=plt.cm.bone)
plt.axis('off')
plt.title('Mask Ground Truth')

random_img_2 = np.expand_dims(np.expand_dims(random_img, axis=0), axis=3)
mask = model.predict(random_img_2)[0][:,:,0] > 0.5
plt.subplot(1,4,3)
plt.imshow(mask, cmap=plt.cm.bone)
plt.axis('off')
plt.title('Predicted Mask')

plt.subplot(1,4,4)
plt.imshow(cv2.bitwise_and(random_img, random_img, mask=mask.astype(np.uint8)), cmap=plt.cm.bone)
plt.axis('off')
plt.title('Predicted Lung Segmentation')

預測出的肺部區域

kaggle 入門系列翻譯（五） RSNA 肺炎預測

第二課：肺部X光結果的語義分割本課主要介紹應用MD.ai使用U-Net來進行語義分割；使用MD.ai註釋器檢視DICOM影象，並建立影象級別註釋。然後使用MD.ai python客戶端庫下載影象和註釋，準備資料集，然後用於訓練模型進行分類。 MD.ai官網如下：https://www

kaggle 入門系列翻譯（六） RSNA 肺炎預測

https://www.kaggle.com/zahaviguy/what-are-lung-opacities 這篇從醫學的角度來闡述檢測影象的特徵這篇文章說比賽主要是檢測肺渾濁而非肺炎，反正也是一種肺病吧。通常肺部的圖片還包括很多部分，如血管、脂肪、心臟等。一個正常人的x光

kaggle 入門系列翻譯（三） RSNA 肺炎預測

概述比賽主要用來識別二維高解析度影象的胸片中是否存在肺炎的區域。肺炎只是導致胸片顯示出問題的一種可能，且每幅圖可能有數個肺炎區域或沒有肺炎區域。文章由一個放射科醫師和機器學習雙重專家編寫，介紹該資料集的底層結構、成像結構和標籤型別首先匯入依賴庫： imp

kaggle 入門系列翻譯（四） RSNA 肺炎預測

上述是官方提供的一個教學，點進去之後共有四個章節，本文先翻譯第一個章節：針對使用深度學習進行醫療影象識別第一課：胸部和腹部x光的分類這是對用於醫學影象分類的實用機器學習的高階介紹。本教程的目標是建立一個深度學習分類器來精確區分胸部和腹部x光。該模型使用從Ope

Python入門系列教程（五）函數

st3 python入門 test print 缺省 .com 教程技術 log 全局變量修改全局變量 a=100 def test(): global a a=200 print a 多個返回值缺省參數 d

PWA(Progressive Web App)入門系列：（五）Web Worker

前言在說Service Worker前有必要說一下Web Worker，因為Service Worker本身就屬於Web Worker的延伸，大部分功能也是基於Web Worker進行的擴充套件。背景眾所周知，JavaScript引擎是以單執行緒排程的方式進行，我們無法

資料探勘入門系列教程（五）之Apriori演算法Python實現

資料探勘入門系列教程（五）之Apriori演算法Python實現載入資料集獲得訓練集頻繁項的生成生成規則獲得support獲得confidence獲得Lift進行驗證總結參考資料探勘入門系列教程（五）之Apriori演算法Python實現在上一篇部落格中，我們介紹了Apriori演算法的演算法流

python爬蟲從入門到放棄（五）之正則的基本使用

語言代碼例子 name 添加 iter ima 制表符 imp things 什麽是正則表達式正則表達式是對字符串操作的一種邏輯公式，就是事先定義好的一些特定字符、及這些特定字符的組合，組成一個“規則字符”，這個“規則字符” 來表達對字符的一種過濾邏輯。正則並不是

Python入門系列教程（二）

字符小寫無符號 bsp div width raw_input abc body 字符串 1.字符串輸出 name = ‘xiaoming‘ print("姓名：%s"%name) 2.字符串輸入 userName = raw_input(‘請輸

JXLS 2.4.0系列教程（五）——更進一步的應用和bug修復

erl dir 問題 create sna 過程 idl es2017 cal 註：本文代碼建立於前面寫的代碼。不過不看也不要緊。　　前面的文章把JXLS 2.4.0 的基本使用寫了一遍，現在講講一些更進一步的使用方法。我只寫一些我用到過的方法，更多的高級使用方法請參

Linux系列教程（五）——Linux鏈接命令和權限管理命令

密碼 mission pos link 掩碼 Owner 最大的 linux系統 passwd 　　前一篇博客我們講解了Linux文件和目錄處理命令，還是老生常淡，對於新手而言，我們不需要完全記住命令的詳細語法，記住該命令能完成什麽功能，然後需要的時候去查就好了，用的多了我

回顧2017系列篇（五）：人工智能給UI/UX設計帶來的影響

如今，我們正處於設計新紀年的轉折點上，用機器人和人工智能方面的專家說法表達即“The end is near（終點近了）”。但這並不意味著世界末日，但未來機器人將毫無疑問地接管一部分目前被人類占領的工作。正如未來學家Thomas Frey在TED Talks演講中所預測，到2030年將會消失20億個工作

JVM調優系列：（五）JVM常用調試參數和工具

框架 break 統計進程 -i 內存文件的 /etc/ action 轉自：http://blog.csdn.net/opensure/article/details/46715769 JVM常用調試參數: –verbose:gc在虛擬機發生內存

react.js從入門到精通（五）——組件之間的數據傳遞

efault def 通道 span 代碼 serve urn div mar 一、組件之間在靜態中的數據傳遞從上面的代碼我們可以看出，兩個組件之間的數據是分離，但如果我們有某種需求，將數據從一個組件傳到另一個組件中，該如何實現？場景設計：將Home.js中的Home

TensorFlow從入門到理解（五）：你的第一個迴圈神經網路RNN（迴歸例子）

執行程式碼： import tensorflow as tf import numpy as np import matplotlib.pyplot as plt BATCH_START = 0 TIME_STEPS = 20 BATCH_SIZE = 50 INPUT_SIZE = 1 OUTP

Linux（centos 7）系列之（五）----maven的安裝和配置

最近需要做個Jenkins的自動部署，因此需要在伺服器上配置maven，下面是我的配置過程： 1.切換你要存放壓縮包的資料夾 2.選擇線上安裝 wget http://mirror

[搬運工系列]-JMeter（五）集合點

集合點:（高併發測試）簡單來理解一下，雖然我們的“效能測試”理解為“多使用者併發測試”，但真正的併發是不存在的，為了更真實的實現併發這感念，我們可以在需要壓力的地方設定集合點，每到輸入使用者名稱和密碼登入時，所有的虛擬使用者都相互之間等一等，然後，一起訪問。注意： 1.JMeter裡面的集合點通過新

Matlab從入門到精通（五）--常用函式

1、傅立葉(Fourier)變換及拉普拉斯(Laplace)變換在MATLAB中，進行傅立葉變換的函式是： fourier(f,x,t)：求函式f(x)的傅立葉像函式F(t)。 ifourier(F,t,x)：求傅立葉像函式F(t)的原函式f(x)。在MATLA

SVM支援向量機系列理論（五）SVM中幾種核函式的對比

核函式可以代表輸入特徵之間特殊的相似性。 5.1 線性核形式： K(x,x′)=xTx′ K ( x ,

C#入門基礎知識（五）

C#流程控制用流程圖描述程式邏輯流程是程式步驟圖形化表示方法，流程圖中包括如下符號：上面圖形中，流程線用來連線兩個相鄰的兩個步驟，每個程式都有且僅有一個開始和結束。下面的流程圖，運用C#來編寫 namespace Test { class Program {

kaggle 入門系列翻譯（五） RSNA 肺炎預測

第二課：肺部X光結果的語義分割

參照第一課安裝和匯入需要的庫並進行初始準備：

下載UNet實現：

進行訓練

相關推薦