1. 程式人生 > >K-Nearest Neighbors近鄰演算法(KNN)

K-Nearest Neighbors近鄰演算法(KNN)

通過KNN演算法計算唐人街探案是哪個型別的電影

import pandas as pd


# 取出列表中出現次數最多的字元
def max_list(lt):
    temp = 0
    for i in lt:
        if lt.count(i) > temp:
            max_str = i
            temp = lt.count(i)
    return max_str


def fun(x, y, z, company, n):
    list = []
    new_list = []
    type = []
    for i in range(len(company)):
        # 得到歐式距離
        dis = ((company.iloc[i, 0] - x) ** 2 + (company.iloc[i, 1] - y) ** 2 + (company.iloc[i, 2] - z) ** 2) ** 0.5
        # 將歐式距離全部放到list裡面
        list.append(dis)
    # 排序得到list_
    list_ = sorted(list)
    # 排序後將前n個放入new_list 中
    for i in range(n):
        new_list.append(list_[i])
    # 通過對於的值在list裡面找下標,然後再求出電影的型別
    for i in range(n):
        type.append(company.iloc[list.index(new_list[i]), 3])
    # 將得到的型別列表呼叫方法max_list
    max_str = max_list(type)
    print(type)
    return max_str


# 讀取檔案獲得陣列
company = pd.read_excel(r"C:\Users\Administrator\Desktop\電影分類資料.xlsx", encoding="gbk")
# 除去名字叫電影名稱和序號的兩列
company.drop(labels=['電影名稱', '序號'], axis=1, inplace=True)

print(fun(23, 3, 17, company, 5))