利用LSTM對腦電波訊號進行分類

阿新 • • 發佈：2019-01-12

最近我們在做利用LSTM網路對腦電波訊號(紡錘體)進行分類的相關工作。我們的資料集是來自於美國開源的睡眠資料集（national sleep research resource）https://sleepdata.org

我們獲得資料包含紡錘波的持續時間，振幅，時間，等幾個特徵。我們採集的樣本主要來自於正常人和病人。我們初步的思想是將紡錘波視為一個事件，生成一個序列。出現紡錘波訊號的為1，反之為0.然後利用神經網路，來學習這個序列的內部特徵，通過序列來判斷病人有沒有患病。

眾所周知LSTM神經網路在處理時序資訊時有一個很好的效果，特別是幾年來nlp的飛速發展。

我們首先需要的是對序列進行二進位制編碼

def bit_coding(data, step): #對一個數據進行編碼
    code = []
    pre_data = 0
    count = 0
    length = len(data)
    while count < length:
        n = (data[count]-pre_data) / step
        if n > 0:
            if n % 1 > 0:
                n = int(n)
                code += [0] * n + [1]
            else:
                n = int(n)
                code += [0] * (n - 1) + [1]
        pre_data = data[count]
        count += 1
    return code

其中的step就是設定的精度，多少步長進行統計，這個值就取決於你獲得一個腦電波的序列的維度大小。

我們再生成一個腦電波的類的相關資訊

class SpindleData:
    path = ""
    paths = []
    labels = []
    data = []
    step = 0.0001
    max_length = 0#設定預設的編碼間隔
    coding_q = []

    def __init__(self, path="datasets", step=0.0001 ):
        self.path = path
        self.step =step
        self.paths, self.labels = self.get_data_labels()   #獲得路徑以及標籤
        self.coding()

    def get_data_labels(self):  # 返回獲取的資料以及標籤[0,1,0,1,...]  "./datasets/"
        path = self.path
        cate = [(os.path.join(path, x)) for x in os.listdir(path)]
        paths = []
        labels = []
        for i, p in enumerate(cate):
            path_tmps = glob.glob(os.path.join(p, "*.csv"))
            for p in path_tmps:
                paths.append(p)
                labels.append(i)
        np.asarray(labels)                  #將標籤轉化為np的格式
        return paths, labels

    def coding(self):#所有的資料讀取以及儲存(這裡儲存了資料的原始資料佔用記憶體可能比較大)
        codeing_q = []
        for p in self.paths:
            data = pd.read_csv(p, skiprows=(0, 1), sep=",")
            print("正在讀取第%d個csv檔案..." % (self.paths.index(p)+1))
            data =data['Time_of_night']
            self.data.append(data)
        for i, d in enumerate(self.data):
            code = bit_coding(d, step=self.step)
            print("正在對第%d個序列進行編碼..."%(i+1))
            codeing_q.append(code)#將二位的編碼加入到序列中
        self.max_length = max([len(x) for x in codeing_q])
        codeing_q = preprocessing.sequence.pad_sequences(codeing_q, maxlen=self.max_length)   #將所有的串都弄成相同的維度
        self.coding_q = np.asarray(codeing_q)

這個類主要包含編碼後的0/1序列，1序列表示的是紡錘波出現，0表示的是紡錘波沒有出現。同時我們再生成一個labels陣列，這個對應的是病人時候患病。其實就是一個二分類問題。

我們再來搭建一個LSTM神經網路

def learning_lstm():                   #lstm暫時還是比較適合於文字中，對於有序序暫不合適
    x_train, y_labels, length = data_test()
    x_train = np.expand_dims(x_train, axis=2)

    model = Sequential()
    # model.add(Embedding(max_feature, 32))
    model.add(LSTM(32, input_shape=(length, 1)))

    model.add(Dense(1, activation='sigmoid'))

    model.compile(optimizer='rmsprop', loss='binary_crossentropy', metrics=['acc'])
    model.summary()

    history = model.fit(x_train, y_labels, epochs=10, batch_size=16, validation_split=0.2)
    draw(history)


def data_test():
    length = 0   #每一個系列的長度
    spindle = SpindleData()
    x_train = spindle.coding_q
    y_train = spindle.labels
    length = spindle.max_length
    return x_train, y_train, length

我實驗中的step設定的最小間距0.0001，因此每個序列都有120,000維.暫時實驗的效果不是很明顯。我先把github原始碼發上來

利用LSTM對腦電波訊號進行分類

利用LSTM對腦電波訊號進行分類

Tensorflow學習教程------利用卷積神經網路對mnist資料集進行分類_利用訓練好的模型進行分類

利用opencv呼叫tensorflow的pb模型對jpg圖片進行分類

利用CNN對股票“圖片”進行漲跌分類——一次嘗試【附原始碼】

利用隨機森林和梯度替身決策樹對titanic資料進行分類，並對結果進行分析

django 利用ORM對單表進行增刪改查

利用logrotate對Tomcat日誌進行切分

利用logrotate對nginx日誌進行切分

利用opencv對圖片大小進行修改

TensorFlow-cifar訓練與測試（可對自己資料進行分類和測試）

利用Comparator對列舉型別進行排序的實現（ComparatorChain、BeanComparator、FixedOrderComparator）

資料處理-------利用jieba對資料集進行分詞和統計頻數

使用LogisticRegression和SGDClassifier對良/惡性腫瘤進行分類，並計算出準確率召回率和F1的值

圖解利用Jira對Scrum專案進行跟蹤管理(一)

利用lucene對檔案內容進行關鍵字檢索

Spark 中文文件分類(一) IKAnalyzer對文件進行分類

計算機視覺（四）：使用K-NN分類器對CIFAR-10進行分類

Flume原始碼分析—利用Eclipse對Flume原始碼進行遠端除錯分析環境搭建（一）

【自然語言處理入門】01：利用jieba對資料集進行分詞，並統計詞頻

利用pandas對初創公司進行資料分析

利用LSTM對腦電波訊號進行分類

相關推薦