RLE格式標註檔案轉為PNG格式（Run Length Encode）

阿新 • • 發佈：2018-12-19

一、什麼是 RLE 格式

在機器視覺領域的深度學習中，每個資料集都有一份標註好的資料用於訓練神經網路。

但是神經網路的輸入一定是一張圖片，為此必須把RLE格式的檔案轉變為影象格式。

影象格式主要又分為 .jpg 和 .png 兩種格式，其中label資料一定不能使用 .jpg，因為它因為壓縮算演算法的原因，會造成影象失真，影象各個畫素的值可能會發生變化。分割任務的資料集的 label 影象中每一個畫素都代表了該畫素點所屬的類別，所以這樣的失真是無法接受的。為此只能使用 .png 格式作為label，pascol voc 和 coco 資料集正是這樣做的。

二、如何轉化為 .png

#!/usr/bin/env python3
# -*- coding: utf-8 -*-

import numpy as np # linear algebra
import pandas as pd # data processing, CSV file I/O (e.g. pd.read_csv)
from PIL import Image


# ref: https://www.kaggle.com/paulorzp/run-length-encode-and-decode
#將圖片編碼成rle格式
def rle_encode(img, min_max_threshold=1e-3, max_mean_threshold=None):
    '''
    img: numpy array, 1 - mask, 0 - background
    Returns run length as string formated
    '''
    if np.max(img) < min_max_threshold:
        return '' ## no need to encode if it's all zeros
    if max_mean_threshold and np.mean(img) > max_mean_threshold:
        return '' ## ignore overfilled mask
    pixels = img.T.flatten()
    pixels = np.concatenate([[0], pixels, [0]])
    runs = np.where(pixels[1:] != pixels[:-1])[0] + 1
    runs[1::2] -= runs[::2]
    return ' '.join(str(x) for x in runs)

#將圖片從rle解碼
def rle_decode(mask_rle, shape=(768, 768)):
    '''
    mask_rle: run-length as string formated (start length)
    shape: (height,width) of array to return
    Returns numpy array, 1 - mask, 0 - background
    '''
    s = mask_rle.split()
    starts, lengths = [np.asarray(x, dtype=int) for x in (s[0:][::2], s[1:][::2])]
    starts -= 1
    ends = starts + lengths
    img = np.zeros(shape[0]*shape[1], dtype=np.uint8)
    for lo, hi in zip(starts, ends):
        img[lo:hi] = 1
    return img.reshape(shape).T  # Needed to align to RLE direction


def masks_as_image(in_mask_list):
    # Take the individual ship masks and create a single mask array for all ships
    all_masks = np.zeros((768, 768), dtype = np.uint8)
    for mask in in_mask_list:
        if isinstance(mask, str):
            all_masks |= rle_decode(mask)
    return all_masks

#將目標路徑下的rle檔案中所包含的所有rle編碼，儲存到save_img_dir中去
def rle_2_img(train_rle_dir,save_img_dir):
    masks = pd.read_csv(train_rle_dir)
    not_empty = pd.notna(masks.EncodedPixels)
    print(not_empty.sum(), 'masks in', masks[not_empty].ImageId.nunique(), 'images')
    print((~not_empty).sum(), 'empty images in', masks.ImageId.nunique(), 'total images')
    all_batchs = list(masks.groupby('ImageId'))
    train_images = []
    train_masks = []
    i = 0
    for img_id, mask in all_batchs:
        c_mask = masks_as_image(mask['EncodedPixels'].values)
        im = Image.fromarray(c_mask)
        im.save(save_img_dir+img_id.split('.')[0] + '.png')
        print(i,img_id.split('.')[0] + '.png')
        i += 1
        
    return train_images, train_masks



if __name__ == '__main__':
    rle_2_img('D://DL//airbus-kaggle//dataset_V2//train_ship_segmentations_v2.csv',
              'D://DL//airbus-kaggle//dataset_V2//mask//')

RLE格式標註檔案轉為PNG格式（Run Length Encode）

一、什麼是 RLE 格式在機器視覺領域的深度學習中，每個資料集都有一份標註好的資料用於訓練神經網路。但是神經網路的輸入一定是一張圖片，為此必須把RLE格式的檔案轉變為影象格式。影象格式主要又分為 .jpg 和 .png 兩種格式，其中label資料一定不能使用

利用Python將WEBVTT格式的視訊字幕檔案轉為SRT格式

1 WebVTT & SRT 格式 WebVTT字幕格式與SRT字幕格式主要區別在於時間格式的區分。下面是一個WebVTT格式的字幕檔案 WEBVTT 1 00:00:20.000 --> 00:00:24.400 En répons

將三星手機備忘錄vnt格式檔案轉為txt格式備份

最近想把手機上的備忘錄匯出到電腦上備份，結果發現匯出來的並不是txt格式，而是三星自己的vnt格式。於是自己用java寫了幾行程式碼把它轉為txt格式用於備份。留著以後備份的時候用。 import java.io.BufferedReader; import java.io

Java 使用科大訊飛MSC SDK，在web服務端將文字合成語音，將pcm檔案轉為wav格式返回

本文講述的是使用科大訊飛MSC SDK將語文字合成語音，然後以web介面的形式把合成的音訊資料返回前端。流程 1、接收介面引數傳入的要合成的資料 2、使用MSC SDK把資料合成*.pcm檔案 3、獲取wav檔案格式頭 4、將格式頭與檔案內容拼接

如何將ts檔案轉為mp4格式

問題描述：想要將新浪微博上的視訊下載下來，開啟原始碼發現找不到視訊，通過查詢，在js檔案裡找到視訊儲存的檔案目錄。根據該檔案目錄一一下載下來字尾為ts的視訊檔案。想要發給朋友分享，所以需要轉為mp4格式。將所有ts檔案下載下來存到b資料夾裡面在b資料夾下新建1.bat檔案，輸

在伺服器端，轉換amr格式音訊檔案為MP3格式

由於當前pc端瀏覽器及移動端瀏覽器都不支援直接播放amr格式檔案，因此考慮在伺服器端，將amr檔案轉換為MP3檔案，使瀏覽器可直接播放。在伺服器使用ffmpeg工具，供php呼叫，用來轉換amr檔案。基本流程是：微信瀏覽器中錄音並上傳（上傳到微信平臺伺服器）—

Shp格式資料檔案到GML格式的轉換

實現Shapefile格式資料到GML格式資料的轉換過程可分為兩個大步驟，一是依據Shapefile資料文件資料獲取資料，二是依據GML標準構建GML格式資料。從上面對shapefile資料格式和GML格式的分析可知，對shapefile的文件資料的獲取主要是讀取座標檔案和屬

android 資料儲存<一>----android簡訊傳送器之檔案的讀寫（手機+SD卡）

本文實踐知識點有有三： 1.佈局檔案，android佈局有相對佈局。線性佈局，絕對佈局。表格佈局。標籤佈局等，各個佈局能夠巢狀的。本文的佈局檔案就是線性佈局的巢狀 <LinearLayout xmlns:android="http://schemas.and

對xml檔案的sax解析（增刪改查）

crud(增刪改查)： c：creat r：retrieve u：update d：delete 以下筆記來自於韓順平老師的講解。現在是用java來操作。第一步：新建java工程。file-new-Java Project，輸入工程的名字，點選finish. 第二步：放

Python常用操作之excle檔案的基本操作（功能後續更新）

廢話不多說，直接上程式碼： #!/usr/bin/env python3 # encoding : utf-8 # @author : 'Jonny' # @location: '北京' # @date : '2018/11/12 17:37' # @Email : [email

檔案上傳下載（簡易體驗版）

檔案上傳寫在servlet dopost中的方法： //建立讀取的檔案的工廠類 DiskFileItemFactory factory = new DiskFileItemFactory(); //讀取request裡面流的解析類 ServletFileUpload up

PHP任意檔案上傳漏洞（CVE-2015-2348）

安全研究人員今天釋出了一箇中危漏洞——PHP任意檔案上傳漏洞（CVE-2015-2348）。在上傳檔案的時候只判斷檔名是合法的檔名就斷定這個檔案不是惡意檔案，這確實會導致其他安全問題。並且在這種情況下，在你自己的檔案中檢查漏洞很不現實，因為這個漏洞可以繞過你對檔名字尾、檔案型別(Content-Typ

Linux - 檔案與目錄管理（李作強）

我們知道Linux的目錄結構為樹狀結構，最頂級的目錄為根目錄 /。其他目錄通過掛載可以將它們新增到樹中，通過解除掛載可以移除它們。在開始本教程前我們需要先知道什麼是絕對路徑與相對路徑。絕對路徑：路徑的寫法，由根目錄 / 寫起，例如： /usr/share/doc 這個目錄。

將python打包成exe檔案，詳細介紹（各種坑解決）

安裝pyinstaller 一開始偷懶，直接使用的pip安裝，結果各種問題 pip install pyinstaller 所以還是去github去下載最新的pyinstaller，替換掉用pip安裝好的pyinstaller，下載連結：pyinstall

linux檔案系統結構樹（強烈建議儲存）

根目錄是整個系統最重要的一個目錄，因為不但所有的目錄都是由根目錄衍生出來的，同時根目錄也與開機/還原/系統修復等動作有關。由於系統開機時需要特定的開機軟體、核心檔案、開機所需程式、函式庫等等檔案資料，若系統出現錯誤時，根目錄也必須要包含有能夠修復檔案系

python資料夾，檔案監聽工具（pyinotify，watchdog）

pyinotify庫支援的監控事件 @cvar IN_ACCESS: File was accessed. @type IN_ACCESS: int @cvar IN_MODIFY: File was

php excel檔案線上預覽（走過的坑）

首先感謝以往分享相關問題的小夥伴，從中收貨很多部分內容也是引用了前人的內容，希望對後來的人有幫助。 1.已經布好的服務如微軟的Office365等平臺服務例項：http://technet.microsoft.com/zh-cn/library/jj21

PDF檔案水印怎麼新增（文字或圖片）

如何給PDF檔案新增水印呢？平常處理一些比較重要的檔案來說，這裡就拿製作完之後的PDF檔案來說，為了他人直接挪用自己的編輯成果，大多數人都會給這份PDF檔案新增自己專屬的水印，那大家是否知道PDF新增水印的方法嗎？操作起來其實也比較簡單，下面就跟著小編的方法一起

微信小程式檔案預覽原始碼（可以直接用）

微信小程式的檔案預覽微信小程式的檔案預覽需要先使用wx.downloadFile下載檔案，然後使用下載檔案的臨時路徑通過wx.openDocument進行檔案的預覽 wxml程式碼： <button bindtap='preview'>簡歷預覽&

影象標註工具labelImg安裝方法（win10 + Python3.5）

系統環境：win10 64位，Python3.5。 2，安裝Python3.5 3，安裝PyQt5 進入cmd後，輸入：pip install PyQt5 4，安裝PyQt

RLE格式標註檔案轉為PNG格式（Run Length Encode）

一、什麼是 RLE 格式

二、如何轉化為 .png

相關推薦