1. 程式人生 > >學習筆記 | 機器學習-周志華 | 4

學習筆記 | 機器學習-周志華 | 4

在這裡插入圖片描述

習題

  1. 版本空間:存在著一個與訓練集一致的“假設集合”。
    在這裡插入圖片描述
    此時,只有1, 4兩個樣例。
    求版本空間的步驟:
    ①寫出假設空間:先列出所有可能的樣本點(即特徵向量)(即每個屬性都取到所有的屬性值)
    ②對應著給出的已知資料集,將與正樣本不一致的、與負樣本一致的假設刪除。
    ③得出與訓練集一致的假設集合,即版本空間。
    首先,訓練資料集對應的假設空間如下
    1 色澤 = *, 根蒂 = *,敲聲 = *
    2 色澤 = 青綠, 根蒂 = *,敲聲 = *
    3 色澤 = 烏黑, 根蒂 = *,敲聲 = *
    4 色澤 = *, 根蒂 = 蜷縮,敲聲 = *
    5 色澤 = *, 根蒂 = 稍蜷,敲聲 = *
    6 色澤 = *, 根蒂 = *,敲聲 = 濁響
    7 色澤 = *, 根蒂 = *,敲聲 = 沉悶
    8 色澤 = 青綠, 根蒂 = 蜷縮,敲聲 = *
    9 色澤 = 青綠, 根蒂 = 稍蜷,敲聲 = *
    10 色澤 = 烏黑, 根蒂 = 蜷縮,敲聲 = *
    11 色澤 = 烏黑, 根蒂 = 稍蜷,敲聲 = *
    12 色澤 = 青綠, 根蒂 = *,敲聲 = 濁響
    13 色澤 = 青綠, 根蒂 = *,敲聲 = 沉悶
    14 色澤 = 烏黑, 根蒂 = *,敲聲 = 濁響
    15 色澤 = 烏黑, 根蒂 = *,敲聲 = 沉悶
    16 色澤 = *, 根蒂 = 蜷縮,敲聲 = 濁響
    17 色澤 = *, 根蒂 = 蜷縮,敲聲 = 沉悶
    18 色澤 = *, 根蒂 = 稍蜷,敲聲 = 濁響
    19 色澤 = *, 根蒂 = 稍蜷,敲聲 = 沉悶
    20 色澤 = 青綠, 根蒂 = 蜷縮,敲聲 = 濁響
    21 色澤 = 青綠, 根蒂 = 蜷縮,敲聲 = 沉悶
    22 色澤 = 青綠, 根蒂 = 稍蜷,敲聲 = 濁響
    23 色澤 = 青綠, 根蒂 = 稍蜷,敲聲 = 沉悶
    24 色澤 = 烏黑, 根蒂 = 蜷縮,敲聲 = 濁響
    25 色澤 = 烏黑, 根蒂 = 蜷縮,敲聲 = 沉悶
    26 色澤 = 烏黑, 根蒂 = 稍蜷,敲聲 = 濁響
    27 色澤 = 烏黑, 根蒂 = 稍蜷,敲聲 = 沉悶
    28 Ø
    根據樣例進行學習:

    色澤 = 青綠, 根蒂 = 蜷縮,敲聲 = 濁響 -> 好瓜
    刪除不一致的假設:3 5 7 9-11 13-15 17-19 21-28
    色澤 = 烏黑, 根蒂 = 稍蜷,敲聲 = 沉悶 -> 壞瓜
    刪除一致的假設:1
    學習後的剩餘假設為2 4 6 8 12 16 20
    2 色澤 = 青綠, 根蒂 = *,敲聲 = *
    4 色澤 = *, 根蒂 = 蜷縮,敲聲 = *
    6 色澤 = *, 根蒂 = *,敲聲 = 濁響
    8 色澤 = 青綠, 根蒂 = 蜷縮,敲聲 = *
    12 色澤 = 青綠, 根蒂 = *,敲聲 = 濁響
    16 色澤 = *, 根蒂 = 蜷縮,敲聲 = 濁響
    20 色澤 = 青綠, 根蒂 = 蜷縮,敲聲 = 濁響
    所以版本空間為

    在這裡插入圖片描述