1. 程式人生 > >CSDN博文“待稽核”檢測規則分析之如何避免“待稽核”

CSDN博文“待稽核”檢測規則分析之如何避免“待稽核”

        這些天一直很鬱悶,自己的博文一直是"待稽核", 自己當然很不爽啦。然後今天晚上終於成為發表成功一篇非“待稽核”的文章,以為這個CSDN的這一新規則因為大家的反映而放棄了,沒想到我後面又測了一篇文章,結果還是“待稽核”,這讓一向喜歡專研的我有了想探究原因的衝動。說幹就幹。

       於是複製貼上曾經被歸為“待稽核”的文章,並發表,自然而然還是“待稽核”。然後就不停的刪除一些內容,最後終於成功發表。其實這個測試過程和除錯bug一樣,不停新增列印,然後回溯,哈哈。在測試的過程中有了如下結論:
        1)CSDN檢測到文章中的連結大於5,就會將文章列為“待稽核”,這個其實在諮詢CSDN的客服的時候,她有提到,但是自己當時想了了想文章中沒有5個連結啊,就沒放在心上。之所以沒放在心上,是因為下面的兩種情況都算作連結了。
        2)文章的每個圖片算一個連結,這個就是我忽略的第一種連結。這個有點扯淡,一般有水平的部落格很可能少不了圖片的,反而將這種提高博文質量的元素作為限制的元素,不得不讓人汗顏。這也讓我恍然明白,我的部落格一般圖片較多,自然躺著中槍。
        3)@,/等特殊字元也是連結。我的博文一般也都有很多實踐的命令,而這些命令多是以下面的形式
[email protected]
:/tmp/test$ git hash-object -w test.txt

          這個很老火的,一條命令會佔用兩個連結([email protected], /tmp/test),很容易讓我的文章被“待稽核”。

         原因找到了,避免的方法當然就是儘量避免這些規則。但是我還是要說下,csdn為啥要以連結作為標準徠限制呢?且連結的檢測還不夠準確,並且自己博文中自己上傳的圖片也算一個連結。為啥不能夠用更好的方法來實現呢。
比如為了避免圖片盜鏈,可以採用如下方法檢測:
         1)非csdn的連結可以直接歸類為嫌疑連結。

         2)使用者自己上傳的圖片,直接給使用者的網址連結。這樣使用者自己的博文中新增自己的圖片,直接檢測博文中的圖片連結可以很容易檢測出是否是使用者上傳的,如果是,怎麼也不會有盜鏈的嫌疑啊。

而/tmp/test這種被歸為連結就有點不負責了,這應該可以很容易過濾掉的。