1. 程式人生 > >論文反查重各種攻略

論文反查重各種攻略

知己知彼:

一.論文思路相同算抄襲麼?

1.在學術上,算是借鑑,但是如果沒有創新點,是沒有學術價值的,沒有意義的論文和研究。

2.在抄襲檢測中,如果論文思路相同,軟體是查不出來的。

所以,思路相同,文字不同,也是大部分人避過論文抄襲檢測的有效手段。

二:碩士論文檢測是如何運作的?

1.提交完整版的論文word文件

2.系統對標註格式的文件進行分章

3.每一章節獨立檢測抄襲率

4.對引用的參考文獻進行處理,剔除參考文獻部分

5.計算全文抄襲率,並標註

6.檢測不出繁體字論文

三.知網論文檢測

1、對格式的要求
    知網學位論文檢測為整篇上傳,格式對檢測結果可能會造成影響,需要將最終交稿格式提交檢測,將影響降到最小,此影響為幾十字的小段可能檢測不出。都不會影響通過。系統的演算法比較複雜,每次修改論文後再測可能會有第一次沒測出的小段抄襲(經2 年實踐經驗證明,該小段不會超過200 字,並且二次修改後論文一般會大大降低抄襲率)

2、對比庫
    對比庫為:中國學術期刊網路出版總庫,中國博士學位論文全文資料庫/中國優秀碩士學位論文全文資料庫,中國重要會議論文全文資料庫,中國重要報紙全文資料庫,中國專利全文資料庫,個人比對庫,其他比對庫, 部分書籍不在知網庫,檢測不出抄襲。知網庫是國家指定的論文檢測對比庫,國家指定高校論文檢測系統為知網學位論文檢測系統,該系統是目前效果最好、範圍最廣的官方檢測系統,所有高校都是知網的檢測系統,這是教育部出於全國學術不端公平性考慮而實施的。

3、關於分段和分章出結果
    上傳論文後,系統會自動檢測該論文的章節資訊,如果你學校的目錄設定符合知網系統內建的分章判斷條件,系統就會按章檢測,分章出結果,否則會分段出結果。關於分段或分章主要涉及4 中的閥值。不論是分章還是分段,保持和學校一致即可。

4、引用的能檢測出來嗎?
   有的同學問:“我明明引用了別人的段落或句子,為什麼沒有檢測出來?”也有的同學問:“我的引用標註了出處,為什麼還算抄襲?”首先,引用算不算抄襲,與標註出處沒有任何關係,引用能不能檢測出來,與系統準不準確也沒有關係。所有這些都靠系統的閥值來決定。中國知網對該套檢測系統的靈敏度設定了一個閥值,該閥值為3%,以段落(或章節)的字數來計算,單篇文獻低於3%的抄襲或引用是檢測不出來的,這種情況常見於大段文字中的小句或者小概念。舉個例子:假如檢測段落1(第一章)有10000 字,那麼引用A 文獻300字(10000 乘以3%=300)以內,是不會被檢測出來的。若引用B文獻超過300字,那麼B文獻分佈於第一章中的抄襲都會被紅字標註,不管位於第一章何處,即使打斷成句子,只要超過20字就會被標註。①實際上這裡也告訴同學們一個修改的方法,就是對段落抄襲千萬不要選一篇文章來引用,儘可能多的選擇多篇文獻,一篇擷取幾句,這樣是不會被檢測出來的。②關於一些同學問引用的為什麼也算抄襲,這裡主要是因為知網的閥值問題,高於3%的統一算抄襲,也就是說引用於抄襲的臨界就在3%之間。一旦你超標,即使你標註了引用也無濟於事。所以請同學們注意。我們舉例說明:某篇論文第一章有5000 字,那麼第一章中,我們就只能引用A文獻150 字以下,否則會被系統認為是抄襲。第二章4000 字,那麼我們只能引用A 文獻120字以下,否則會被系統認為是抄襲。第三章8000 字,第四章7000 字,分別為240 字以下和210 字以下,以此類推。綜上所述,引用超標的計算方式是按章計算,這與抄襲的計算方式是一樣的。

5、系統對一句話怎麼才算抄襲?
    一篇論文的抄襲怎麼才會被檢測出來?知網論文檢測的條件是20字單位以上的相似或抄襲都會被紅字標註,但是必須滿足4裡面的前提條件:即你所引用或抄襲的A 文獻文字總和在你的各個檢測段落(各章)中要達到3%。
引用:

6、抄襲的修改方式

    針對標紅文字的修改方式除了3中提到的外,還有改詞、換句、改變描述方式(變原句為倒裝句、被動句、主動句等)、打亂段落順序、刪除關鍵詞彙、關鍵句等。經過實踐證明,使用以上方法結合,可有效降低複製比,保證順利通過。

總體來說,我們需要在保證修改後句子通順的前提下,儘量和原句在字面上保持不同。

例1:例如下句:
    過熱故障中的過熱與變壓器正常執行下的發熱是有區別的,正常執行時的其發熱源來自於繞組和鐵芯,即銅損和鐵損,而變壓器過熱故障是由於受到有效熱應力而造成的絕緣加速劣化,它具有中等水平的能量密度。

幾乎被標紅,說明與相似文獻存在重合和高度相似,經過以上方式結合,本句可改為:

    過熱故障中出現的過熱容易與變壓器正常執行下的發熱相混淆,後者是因為其繞組和鐵芯會出現銅損和鐵損的現象,這是正常執行過程中的發熱,而變壓器過熱故障是受到有效熱應力造成的絕緣加速劣化,

① 這裡所指的300 字是一個大概值,並非臨界值。引用的數量越低,就越不容易被檢測出來。

② 更新以後的CNKI 學術不端檢測系統將這一閥值調整到了3%,以前是5%,意味著檢測系統對引用的要求更加嚴格,但運用我們後面提到的方法也不是很難。具有中等水平的能力密度。

這樣修改幾乎可以降低抄襲率一半。

例2:在看下面一個例句:

3.7.1.2 在透明水杯的清水中放入少量纖維進行攪動,便可以直觀地發現纖維呈立體懸浮狀亂向分散,且長時間放置都不會有太大變化,說明合成纖維的質量較好;質量差的纖維經攪動後可能分散,但時隔不久便會上浮為一絮狀層。質量差的纖維在混凝土的實際配製過程中多不易均勻分散。

本段完全被標紅,修改方式只有一種,就是打亂順序,重新組織。

3.7.1.2 將少量纖維放入盛裝清水的透明容器中,邊攪動邊觀察纖維變化情況,如果合成纖維質量較好,那麼就可以直觀地看到纖維呈立體懸浮狀分散,隨著時間的推移,位置也不會發生明顯的變化;若合成纖維質量較差,那麼攪動的過程中,纖維可能分散,並且容易上浮形成絮狀層。質量差的纖維在混凝土的實際配製過程中多不易均勻分散。

例3:下句:
對施工單位或業主提出的設計變更要求要進行統籌考慮,確定其必要性,同時將設計變更對施工工期和費用的影響進行全面分析,非改不可的要調整施工計劃,以儘可能減少對工程的不利影響。

修改為:

施工單位或業主一旦提出設計變更要求,要進行統籌考慮,考察變更的必要性,同時,將設計變更對施工工期、費用等方面可能造成的影響進行全面而科學的分析,遇到非改不可的變更要調整施工計劃,儘可能將其對工程的不利影響降到最小

百戰不殆:

一.如何應對高校論文相似度檢測

估計是最近學術抄襲的現象過於嚴重了,現在一大部分高校整了一個論文反抄襲檢測系統,用的是CNKI知網的論文庫,只要你的畢業論文存在抄襲現象,它就會給你檢測出來,嚴重影響了廣大學生畢業論文的順利通過,破壞了社會的和諧。

     要對付這個系統,首先要了解它的執行原理。通過分析我砸銀子得出的檢驗報告,可以瞭解到這個檢測系統,不是簡單的把你的文章和他論文庫進行對比,現在的學生也不傻,抄完文章,都是改句話,改個詞,加幾個字什麼的,單用word查詢似的對比方法,肯定查不出來。這個系統缺德帶冒煙的地方就在於它是把你的文章按一定字數分段,然後把每段裡面的漢字統計下來,跟論文庫裡的文章進行對比,只要相同的漢字達到一定的比率,就在你文章與庫裡文章連續重複較多的位置給你畫出紅線算抄襲了。根本不在乎你文字的順序,就比如說你把你抄的一個段落整個打散了,每句話分別放在不同的段落裡,也全都能給查出來。

     但這個系統也是有弱點的,首先它有一定的查詢範圍,也就是它的論文庫有限。去年這個系統能檢測到CNKI知網裡的抄襲內容,對從書上和網上抄的內容根本檢測不出來。不過今年變化了,根據最新的檢測報告,這缺德系統現在連書上的文章也可以檢測出來了,網上的東西也可以檢測的到。但是從外國網站dnowload來的英文文章在翻譯成漢語後,還是檢測不出來。

     所以對付這個系統,如果你的學科在自然科學領域,那就簡單了,直接去外國的網站找論文,然後自己或者找人翻譯過來,把作者名字換成自己,抄上就OK了。但是社科類學科,尤其是我這個專業的就倒了血黴了,萬惡的資本主義國家沒有研究這個的,朝鮮估計可能研究這個,但是棒子文我看不懂。這就需要一定的技巧了,在抄文章時,最好從不同的文章裡抄取(在檢測系統裡這叫多元抄取),然後記好自己每短話抄襲的文章,例如1段抄自A文章,2段抄自B文章,C段…….然後在論文整體抄襲完畢後,去學校(有的學校不給個人檢,比如長春某高校)或者網上花錢檢測一下(不要在乎錢,延期答辯帶來的損失要遠比這點錢多的多)。如果檢測系統準確率不錯的話,你大部分抄襲段落就會被檢測出來,但是要注意不是全部,由於上段提到的那個論文庫的問題,很可能你的某段從書上或者網上抄來的文章中的一段就沒有被檢測出來,那麼恭喜你,趕緊把那本書或者網上的那篇文章找出來,盡情的抄吧。

     而對於已經被檢測出來,畫了紅線的段落,如果受到論文寫作需要的制約,無法用其他安全的抄襲文章段落來進行合理更換的話,我們只能是自己改。笨方法就是逐字逐句的改,大面積的更換原句的原有漢字,儘可能降低漢字的重複比。例如這句話:”近幾年中央政府相繼出臺了一系列惠農政策,在減輕農民負擔、刺激糧食生產等方面效果明顯。”絕對不能簡單的更換幾個字,調整一下刺激糧食生產和減輕農民負擔的順序,那樣改還不如不改,勞時費力還起不到一點的效果。必須得類似這樣改成”近些年來,黨中央國務院連續頒佈了一系列扶農政策,對提高糧食產量、增加農民收入等方面卓有成效。”這麼改安全是安全,不過有個缺點,就是太耗費心力了,你要是不多看幾本書,還真改不出來,不過話說回來,書要是看的夠多,論文誰他媽還抄啊。

國外的論文反抄襲軟體早就應用了。國內的中文反抄襲軟體,08年年底也開發出來了,目前國內有一些高校和研究機構在試用。之所以試用,而不是全面推廣,是因為目前這個軟體尚不穩定,而且資料庫也需要補充。不過再過兩年,高校和研究機構檢查論文反抄襲,是大勢所趨了。
  

     論文需要檢測的tf,可以先檢測一下,得出雷同比例,以及紅色標誌的雷同內容,然後根據下面的原則進行修改,就可以通過了。

     修改原則:

     1,反抄襲軟體檢測到13個相同的字,就認為是雷同,所以連續相同的,不要超過13個字;

     2,儘量用同義詞替代,比如: 損壞=破壞;渠道=途徑;原理=基本思路;不可見=隱藏;優點尤其突出=優勢盡顯無疑

     3,改變句子的主動被動語態,比如:數字水印為多媒體資料檔案在認證、防偽、防篡改、保障資料安全和完整性等方面提供了有效的技術手段。=在多媒體制品的認證、防偽、防修改和傳送安全以及完整性保障方面,可以採用數字水印的檢測作為有力的檢測手段。

     下面是一個例子,按照這個程度的修改,保證能通過:

     修改前:目前,數字水印技術(Digital Watermarking)已成為國際資訊保安學術界研究的一個前沿方向,為多媒體的安全儲存和傳送開闢了一條全新的途徑。數字水印通過在原始資料中嵌入版權資訊,即水印來保證該資料資訊的所有權,這種被嵌入的水印可以是一段文字、標識、序列號、影象等各種數字訊號。而且這種水印通常是不可見的,它與原始資料緊密結合並且隱藏在其中,可以經歷一些不破壞原資料使用價值或商用價值的操作而能儲存下來。在需要時,能夠通過一定的技術檢測方法提取出水印,以此作為判斷媒體的版權歸屬和跟蹤起訴非法侵權的證據。數字水印為多媒體資料檔案在認證、防偽、防篡改、保障資料安全和完整性等方面提供了有效的技術手段。

     修改後:當前,國際資訊保安領域的一個熱點研究,就是數字水印技術。這種技術可以在多媒體的儲存和傳送中提供一種更安全的渠道。數字水印技術的原理是用水印來保證資料的所有權,即在儲存或傳送的原始資料中嵌入特定的版權資訊。這些被嵌入的資訊,也就是水印,可以是各種形式,比如標識,文字,影象,序列號等各種數字訊號。並且,這些數字訊號在表面是不可見的,並且與原始的資料以各種形式密切結合,當然這種結合不會損壞原始資料,所以資料在使用過程中絲毫不受影響。在使用過程中如果有必要檢測水印,則可以通過相關的手段提取出隱含其中的水印,用這種方法來判定原始資料的版權,可以作為法律上侵犯版權的證據。這項技術在某些領域應用前景特別廣發,尤其是多媒體資料、製品、檔案的認證、防偽、防止修改、保障傳送安全和完整性時,優點尤其突出。