1. 程式人生 > >機器學習面試知識點之決策樹相關

機器學習面試知識點之決策樹相關

決策樹面試知識點最全總結(一)

一:首先明確以下幾個基本問題: 1.決策樹是幹什麼用的? 一種最基本的分類與迴歸方法,因為實際應用中基本上全是用來分類,所以重點討論分類決策樹。 2.決策樹優缺點: 優點: 1)模型具有可讀性,分類速度快 2)適合處理有缺失屬性的樣本,對缺失值不敏感(後面會講) 缺點: 1)容易發生過擬合(剪枝 隨機森林) 2)分類過程中每一步都依據單一特徵,忽視了資料之間的關聯性,在處理 特徵關聯性強的資料時表現不好 3)對於樣本不均衡的資料集,表現不好。在特徵選擇時ID3演算法偏好於選取可取值數目較多的屬性,C4.5演算法偏向選取可取值數目較少的屬性(實際中是在演算法中採用啟發式原則,先從候選屬性中選出資訊增益高於平均水平的屬性,再從中選擇增益率最高的屬性) 3.學習策略 根據損失函式最小化原則建立決策樹模型 4.決策樹學習步驟 決策樹學習通常包括3個步驟:特徵選擇、決策樹生產和決策樹的修剪 二 決策樹模型與學習

定義:分類決策樹模型是一種描述對例項進行分類的樹形結構。 其本質就是一顆樹,由結點(node)和有向邊(directed edge)組成,結點分為內部結點和葉子結點,內部結點表示一個特徵(其實是一個集合,該集合中的樣本在該結點的父節點上的屬性取值相同,有點繞),葉子結點表示一個類。 決策樹進行分類的過程如下: 用決策樹進行分類,從根節點開始,對例項的某個特徵進行測試(每個結點都會內部維護一個特徵的欄位),根據測試結果,將例項分配到其子節點;此時,每一個子節點對應著該特徵的一個取值,如此遞迴的對例項進行測試並分配,直到到達葉子結點,最後將例項分到葉子結點代表的類中。

快捷鍵

  • 加粗 Ctrl + B
  • 斜體 Ctrl + I
  • 引用 Ctrl + Q
  • 插入連結 Ctrl + L
  • 插入程式碼 Ctrl + K
  • 插入圖片 Ctrl + G
  • 提升標題 Ctrl + H
  • 有序列表 Ctrl + O
  • 無序列表 Ctrl + U
  • 橫線 Ctrl + R
  • 撤銷 Ctrl + Z
  • 重做 Ctrl + Y

Markdown及擴充套件

Markdown 是一種輕量級標記語言,它允許人們使用易讀易寫的純文字格式編寫文件,然後轉換成格式豐富的HTML頁面。 —— [ 維基百科 ]

使用簡單的符號標識不同的標題,將某些文字標記為粗體或者斜體,建立一個連結等,詳細語法參考幫助?。

本編輯器支援 Markdown Extra ,  擴充套件了很多好用的功能。具體請參考Github.

表格

Markdown Extra 表格語法:

專案 價格
Computer $1600
Phone $12
Pipe $1

可以使用冒號來定義對齊方式:

專案 價格 數量
Computer 1600 元 5
Phone 12 元 12
Pipe 1 元 234

定義列表

Markdown Extra 定義列表語法:
專案1
專案2
定義 A
定義 B
專案3
定義 C

定義 D

定義D內容

程式碼塊

程式碼塊語法遵循標準markdown程式碼,例如:

@requires_authorization
def somefunc(param1='', param2=0):
    '''A docstring'''
    if param1 > param2: # interesting
        print 'Greater'
    return (param2 - param1 + 1) or None
class SomeClass:
    pass
>>> message = '''interpreter
... prompt'''

腳註

生成一個腳註1.

目錄

[TOC]來生成目錄:

數學公式

  • 行內公式,數學公式為:Γ(n)=(n1)!nN
  • 塊級公式:
x=b±b24ac2a

更多LaTex語法請參考 這兒.

UML 圖:

可以渲染序列圖:

Created with Raphaël 2.1.2張三張三李四李四嘿,小四兒, 寫部落格了沒?李四愣了一下,說:忙得吐血,哪有時間寫。

或者流程圖:

Created with Raphaël 2.1.2開始我的操作確認?結束yesno
  • 關於 序列圖 語法,參考 這兒,
  • 關於 流程圖 語法,參考 這兒.

離線寫部落格

即使使用者在沒有網路的情況下,也可以通過本編輯器離線寫部落格(直接在曾經使用過的瀏覽器中輸入write.blog.csdn.net/mdeditor即可。Markdown編輯器使用瀏覽器離線儲存將內容儲存在本地。

使用者寫部落格的過程中,內容實時儲存在瀏覽器快取中,在使用者關閉瀏覽器或者其它異常情況下,內容不會丟失。使用者再次開啟瀏覽器時,會顯示上次使用者正在編輯的沒有發表的內容。

部落格發表後,本地快取將被刪除。 

使用者可以選擇 把正在寫的部落格儲存到伺服器草稿箱,即使換瀏覽器或者清除快取,內容也不會丟失。

注意:雖然瀏覽器儲存大部分時候都比較可靠,但為了您的資料安全,在聯網後,請務必及時發表或者儲存到伺服器草稿箱

瀏覽器相容

  1. 目前,本編輯器對Chrome瀏覽器支援最為完整。建議大家使用較新版本的Chrome。
  2. IE9以下不支援
  3. IE9,10,11存在以下問題
    1. 不支援離線功能
    2. IE9不支援檔案匯入匯出
    3. IE10不支援拖拽檔案匯入
  1. 這裡是 腳註內容.