1. 程式人生 > >《A Survey on Transfer Learning》中文版翻譯《遷移學習研究綜述》

《A Survey on Transfer Learning》中文版翻譯《遷移學習研究綜述》

首先感謝(http://blog.csdn.net/magic_leg/article/details/73957331)這篇部落格首次將《A Survey on Transfer Learning》這篇文章翻譯成中文版,給予我們很大的參考。

但上述作者翻譯的內容有很多不準確的詞語、省略了很多內容、工作略顯粗糙,因此本文將給出一篇完整近乎準確的中文版《A Survey on Transfer Learning》的翻譯。

《A Survey on Transfer Learning》這篇綜述性文章是一篇遷移學習入門者的必讀文章,非常具有權威性和引用價值。下面是中文翻譯。

遷移學習研究綜述

Sinno Jialin Pan and Qiang Yang,
Fellow, IEEE
Translator:Xu Yin
摘要:

在許多機器學習和資料探勘演算法中,一個重要的假設就是目前的訓練資料和將來的訓練資料,一定要在相同的特徵空間並且具有相同的分佈。然而,在許多現實的應用案例中,這個假設可能不會成立。比如,我們有時候在某個感興趣的領域有個分類任務,但是我們只有另一個感興趣領域的足夠訓練資料,並且後者的資料可能處於與之前領域不同的特徵空間或者遵循不同的資料分佈。這類情況下,如果知識的遷移做的成功,我們將會通過避免花費大量昂貴的標記樣本資料的代價,使得學習效能取得顯著的提升。近年來,為了解決這類問題,遷移學習作為一個新的學習框架出現在人們面前。這篇綜述主要聚焦於當前遷移學習對於分類、迴歸和聚類問題的梳理和回顧。在這篇綜述中,我們主要討論了其他的機器學習演算法,比如領域適應、多工學習、樣本選擇偏差以及協方差轉變等和遷移學習之間的關係。我們也探索了一些遷移學習在未來的潛在方法的研究。

關鍵詞:

遷移學習;綜述;機器學習;資料探勘

1 引言

資料探勘和機器學習已經在許多知識工程領域實現了巨大成功,比如分類、迴歸和聚類。然而,許多機器學習方法僅在一個共同的假設的前提下:訓練資料和測試資料必須從同一特種空間中獲得,並且需要具有相同的分佈。當分佈情況改變時,大多數的統計模型需要使用新收集的訓練樣本進行重建。在許多現實的應用中,重新收集所需要的訓練資料來對模型進行重建,是需要花費很大代價或者是不可能的。如果降低重新收集訓練資料的需求和代價,那將是非常不錯的。在這些情況下,在任務領域之間進行知識的遷移或者遷移學習,將會變得十分有必要。

許多知識工程領域的例子,都能夠從遷移學習中真正獲益。舉一個網頁檔案分類的例子。我們的目的是把給定的網頁檔案分類到幾個之前定義的目錄裡。作為一個例子,在網頁檔案分類中,可能是根據之前手工標註的樣本,與之關聯的分類資訊,而進行分類的大學網頁。對於一個新建網頁的分類任務,其中,資料特徵或資料分佈可能不同,因此就出現了已標註訓練樣本的缺失問題。因此,我們將不能直接把之前在大學網頁上的分類器用到新的網頁中進行分類。在這類情況下,如果我們能夠把分類知識遷移到新的領域中是非常有幫助的。

當資料很容易就過時的時候,對於遷移學習的需求將會大大提高。在這種情況下,一個時期所獲得的被標記的資料將不會服從另一個時期的分佈。例如室內wifi定位問題,它旨在基於之前wifi使用者的資料來查明使用者當前的位置。在大規模的環境中,為了建立位置模型來校正wifi資料,代價是非常昂貴的。因為使用者需要在每一個位置收集和標記大量的wifi訊號資料。然而,wifi的訊號強度可能是一個時間、裝置或者其他型別的動態因素函式。在一個時間或一臺裝置上訓練的模型可能導致另一個時間或裝置上位置估計的效能降低。為了減少再校正的代價,我們可能會把在一個時間段(源域)內建立的位置模型適配到另一個時間段(目標域),或者把在一臺裝置(源域)上訓練的位置模型適配到另一臺裝置(目標域)上。

對於第三個例子,關於情感分類的問題。我們的任務是自動將產品(例如相機品牌)上的評論分類為正面和負面意見。對於這些分類任務,我們需要首先收集大量的關於本產品和相關產品的評論。然後我們需要在與它們相關標記的評論上,訓練分類器。因此,關於不同產品牌的評論分佈將會變得十分不一樣。為了達到良好的分類效果,我們需要收集大量的帶標記的資料來對某一產品進行情感分類。然而,標記資料的過程可能會付出昂貴的代價。為了降低對不同的產品進行情感標記的註釋,我們將會訓練在某一個產品上的情感分類模型,並把它適配到其它產品上去。在這種情況下,遷移學習將會節省大量的標記成本。

在這篇文章中,我們給出了在機器學習和資料探勘領域,遷移學習在分類、迴歸和聚類方面的發展。同時,也有在機器學習方面的文獻中,大量的遷移學習對增強學習的工作。然而,在這篇文章中,我們更多的關注於在資料探勘及其相近的領域,關於遷移學習對分類、迴歸和聚類方面的問題。通過這篇綜述,我們希望對於資料探勘和機器學習的團體能夠提供一些有用的幫助。

接下來本文的組織結構如下:在接下來的四個環節,我們先給出了一個總體的全覽,並且定義了一些接下來用到的標記。然後,我們簡短概括一下遷移學習的發展歷程,同時給出遷移學習的統一定義,並將遷移學習分為三種不同的設定(在圖2和表2中給出)。我們對於每一種設定回顧了不同的方法,在表3中給出。之後,在第6節,我們回顧了一些當前關於“負遷移”這一話題的研究,即那些發生在對知識遷移的過程中,產生負面影響的時候。在第7節,我們介紹了遷移學習的一些成功的應用,並且列舉了一些已經發布的關於遷移學習資料集和工具包。最後在結論中,我們展望了遷移學習的發展前景。

2 概述

2.1 簡短的有關遷移學習的歷史

傳統的資料探勘和機器學習演算法通過使用之前收集到的帶標記的資料或者不帶標記的資料進行訓練,進而對將來的資料進行預測。在版監督分類中這樣標註這類問題,即帶標記的樣本太少,以至於只使用大量未標記的樣本資料和少量已標記的樣本資料不能建立良好的分類器。監督學習和半監督學習分別對於缺失資料集的不同已經有人進行研究過。例如周和吳研究過如何處理噪音類標記的問題。楊認為當增加測試時,可以使得代價敏感的學習作為未來的樣本。儘管如此,他們中的大多數假定的前提是帶標記或者是未標記的樣本都是服從相同分佈的。相反,遷移學習允許訓練和測試的域、任務以及分佈是不同的。在現實中我們可以發現很多遷移學習的例子。例如我們可能發現,學習如何辨認蘋果將會有助於辨認梨子。類似的,學會彈電子琴將會有助於學習鋼琴。對於遷移學習研究的驅動,是基於事實上,人類可以智慧地把先前學習到的知識應用到新的問題上進而快速或者更好的解決新問題。最初的關於遷移學習的研究是在NIPS-95研討會上,機器學習領域的一個研討話題“學會學習”,就是關注於保留和重用之前學到的知識這種永久的機器學習方法。

自從1995年開始,遷移學習就以不同的名字受到了越來越多人的關注:學會學習、終生學習、知識遷移、感應遷移、多工學習、知識整合、前後敏感學習、基於感應閾值的學習、元學習、增量或者累積學習。所有的這些,都十分接近讓遷移學習成為一個多工學習的一個框架這樣的學習技術,即使他們是不同的,也要儘量學習多項任務。多工學習的一個典型的方法是揭示是每個任務都受益的共同(潛在)特徵。

在2005年,美國國防部高階研究計劃局的資訊處理技術辦公室發表的代理公告,給出了遷移學習的新任務:把之前任務中學習到的知識和技能應用到新的任務中的能力。在這個定義中,遷移學習旨在從一個或者多個源任務中提取資訊,進而應用到目標任務上。與多工學習相反,遷移學習不是同時學習源目標和任務目標的內容,而是更多的關注與任務目標。在遷移學習中,源任務和目標任務不再是對稱的。


圖1展示了傳統的學習和遷移學習的學習過程之間的不同。我們可以看到,傳統的機器學習技術致力於從每個任務中抓取資訊,而遷移學習致力於當目標任務缺少高質量的訓練資料時,從之前任務向目標任務遷移知識。

如今,遷移學習出現在許多頂級期刊上,令人注意的資料探勘(比如ACM KDD,IEEE ICDM和PKDD),機器學習(比如ICML,ICDM和PKDD)和應用在資料探勘和機器學習(比如ACM SIGIR,WWW和ACL)上。在我們給出遷移學習不同的類別的時候,我們首先描述一下本文中用到的符號。

2.2 符號和定義

在本節中,我們介紹了本文中使用的一些符號和定義。首先,我們分別給出“域”和“任務的定義”。

在本綜述中,D域包含兩部分:一個特徵空間X和一個邊緣概率分佈P(X)。其中 X={x1,x2,...,xn}X。比如我們的學習任務是文字分類,每一個術語被用作一個二進位制特徵,然後X就是所有的術語向量的空間,xi是第i個與一些文字相關的術語向量。X是一個學習樣本。總的來說,如果兩個域不同,那麼它們會有不同的特徵空間或者服從不同的邊緣概率分佈。

給定一個具體的領域,D={X,P(X)},一任務個由兩部分組成:一個標籤空間Y和一個目標預測函式f()(由T={Y,f()}表示)。task不可被直觀觀測,但是可以通過訓練資料學習得來。task由pair{xi,yi}組成,且xiX,yiY。函式f(x)可用於預測對應標籤。從概率學角度看,f(x)也可被寫為P(y|x)。 
簡化起見,本文中我們只考慮一個源域DS一個目標域DT。更準確點,用                DS={(xS1,yS1)...,(xSn,ySn)},xSiXs,ySiYs來表示源域。以文件分類為例,DS是文件物件向量及對應的true或false標籤的集合。相似地有目標域記法DT,一般有0nTnS。 
現在我們給出遷移學習的統一定義:

Definition 1 (Transfer learning): 給定源域DS和學習任務

相關推薦

A Survey on Transfer Learning中文版翻譯遷移學習研究綜述

首先感謝(http://blog.csdn.net/magic_leg/article/details/73957331)這篇部落格首次將《A Survey on Transfer Learning》這篇文章翻譯成中文版,給予我們很大的參考。但上述作者翻譯的內容有很多不準確的

論文閱讀:A Survey on Transfer Learning

  本文主要內容為論文《A Survey on Transfer Learning》的閱讀筆記,內容和圖片主要參考 該論文 。其中部分內容引用與部落格《遷移學習綜述a survey on transfer learning的整理下載》,感謝博主xf__ma

Distant Domain Transfer Learning遠域遷移學習--通過人臉識別飛機!

論文地址: http://www.ntu.edu.sg/home/sinnopan/publications/[AAAI17]Distant Domain Transfer Learning.pdf 從標題就可以看出,這是一個想法很牛掰的方法,當然實際也很牛掰。現今很多遷移學習方法都是假

綜述論文翻譯A Review on Deep Learning Techniques Applied to Semantic Segmentation

應用於語義分割問題的深度學習技術綜述 摘要 計算機視覺與機器學習研究者對影象語義分割問題越來越感興趣。越來越多的應用場景需要精確且高效的分割技術,如自動駕駛、室內導航、甚至虛擬現實與增強現實等。這個需求與視覺相關的各個領域及應用場景下的深度學習技術的發展相符合,包括語義分割及場景理解等。這篇論文回

Reading notes 《A survey on question answering technology from an information retrival perspective》

語料庫 aud 解析 nal rspec -o log notes alua concise adj 簡潔的 audio fragment 音頻片段 revivial n 復興 condense v.壓縮; 精簡;(使)冷凝;(使)凝結; formulation n 公式

A Survey on the Security of Stateful SDN Data Planes

語言 共享 虛擬 fault conf enter 完整性 鏈路 定義 論文摘要: 本文為讀者提供新興的SDN帶狀態數據平面,集中關註SDN數據平面編程性帶來的隱患。 I部分 介紹 A.帶狀態SDN數據平面的 B.帶狀態數據平面帶來的安全隱患   引出帶狀態數據平面的安全隱

A Survey on Automatic Text Summarization

#A Survey on Automatic Text Summarization ##1.自動文字摘要的定義 Text summarization is compress the source text into a diminished version conserving it

讀書筆記 - A Survey on Sensor Networks from a Multi-Agent perspective

《A Survey on Sensor Networks from a Multi-Agent perspective》 感測器網路是未來幾十年最有前途的技術之一。最近出現的基於微機電系統(MEMS)的小型廉價感測器使這種網路在各種實際應用中的發展和擴充套件變得容易。 Multi

A Survey of Machine Learning Techniques Applied to Software Defined Networking (SDN): Research Issues and Challenges

文章名稱:A Survey of Machine Learning Techniques Applied to Software Defined Networking (SDN): Research Issues and Challenges 文章名稱:應用於SDN的機器學習技術綜述:研究問題與挑戰

A Survey on Cloud Gaming: Future of Computer Games(review)

Title A Survey on Cloud Gaming: Future of Computer Games Field cloud gaming Motivation  As a new way to deliver high-quality gaming e

A survey on techical threat intelligence in the age of sophisticated cyber attacks

名詞解釋: 威脅情報(threat intelligence):威脅情報是針對一個已經存在或正在顯露的威脅或危害資產的行為的,基於證據知識的,包含情境、機制、影響和應對建議的,用於幫助解決威脅或危害進行決策的知識威脅不太好理解,說白了就是提前知道黑客可能進攻的資訊,簡單的說,我們經常可以從CERT、安全服務

A Review on Deep Learning Techniques Applied to Semantic Segmentation 論文閱讀

為了以後的學習方便,把幾篇計算機視覺的論文放上來,僅為自己的學習方便。期間有參考了很多部落格和文獻,但是我寫的仍然很粗糙,存在很多的疑問。這篇文章是第一篇有關語義分割的總結,可能大學畢設會用到,暫時先簡單總結一下自己的所得。 大學快要畢業了,開始準備畢設,分割方向逃不了了。提示:排版對手機端

A Primer on Deep Learning

Deep learning has been all over the news lately. In a presentation I gave at Boston Data Festival 2013 and at a recent PyData Boston meetup I provided som

論文:Threat of Adversarial Attacks on Deep Learning in Computer Vision: A Survey翻譯工作

**關於對抗性攻擊對深度學習威脅的研究** Naveed Akhtar and Ajmal Mian ACKNOWLEDGEMENTS: The authors thank Nicholas Carlini (UC Berkeley) and Dimit

論文翻譯A Tutorial on Energy-Based Learning

文章地址LeCun經典論文 Abstract      基於能量的模型(EBM)通過將標量能量與變數的每個配置相關聯來捕獲變數之間的依賴關係。推論包括鉗制觀測變數的值,並找出使能量最小的其餘變數的配置。學習包括找到一個能量函式,其中變數的觀察結構的能量比不可觀測的能量要低

遷移學習(Transfer Learning)

style 多任務 部分 容易 完全 In bubuko 出現 很快 深度學習中在計算機視覺任務和自然語言處理任務中將預訓練的模型作為新模型的起點是一種常用的方法,通常這些預訓練的模型在開發神經網絡的時候已經消耗了巨大的時間資源和計算資源,遷移學習可以將已習得的強大技能遷移

[論文學習]Deep Learning Based Recommendation: A Survey

Liu J, Wu C. Deep Learning Based Recommendation: A Survey[C]//International Conference on Information Science and Applications. Springer, Sing

遷移學習簡介(transfer learning

遷移學習簡介(transfer learning) https://blog.csdn.net/qq_33414271/article/details/78756366   一、什麼是遷移學習? 遷移學習將一個場景中學到的知識遷移到另一個場景中 達叔也說將來遷移學習也會

Visual simultaneous localization and mapping: a survey論文翻譯

Fuentes-Pacheco J, Ruiz-Ascencio J, Rend, et al. Visual simultaneous localization and mapping: a survey[J]. Artificial Intelligence Review, 201

【論文閱讀筆記】Deep Learning based Recommender System: A Survey and New Perspectives

【論文閱讀筆記】Deep Learning based Recommender System: A Survey and New Perspectives 2017年12月04日 17:44:15 cskywit 閱讀數:1116更多 個人分類: 機器學習