如何統計檔案重複率
假設某個目錄下有N個資料夾,每個資料夾下是某個人的專案程式碼,一個人一個資料夾,程式碼有可能檔名不同,但內容可能相同
程式執行時,通過指定路徑,分析出某個人和其他人的重複率,如:
被比較者姓名 比較者姓名1 重複率
張三 李四 90
張三 王五 30
重複率是所有檔案比較完成後,每個檔案的重複率平均值,在分析的過程中,要有分析的過程情況,如:
**************歡迎使用xxx查重系統*************************
此次查重總共需要分析【20】人
開始分析第【1】人張三
正在分析【張三】和【李四】,完成度【30%】,當前重複率【50%】
分析完成【張三】和【李四】,重複率為【90%】
開始分析第【2】人【王五】
。。。
最後輸出整體比對結果:
此次查重總共分析【20】人,用時【20分鐘】
結果如下:
被比較者姓名 比較者姓名1 重複率
張三 李四 90
張三 王五 30