1. 程式人生 > >論文筆記11:Development of a Music Recommendation System for Motivating Exercise

論文筆記11:Development of a Music Recommendation System for Motivating Exercise

參考論文:Development of a Music Recommendation System for Motivating Exercise

圖片出不來,請參考我同文知乎連線:https://zhuanlan.zhihu.com/p/40912861

Abstract

雖然定期體育鍛煉對健康的益處是很明顯的,但許多人鍛鍊的程度遠低於既定的指導方針。音樂已經被證明有一種激勵作用,可以鼓勵人們更努力地鍛鍊或持續更長的時間,但是決定哪些歌曲應該被提供給哪些鍛練者是一個未解決的問題。我們提出了一個結合使用者資訊的系統,以向用戶提供一組強大的初始推薦。然後使用強化學習,以確保隨後的建議更易被接受,因為每個建議都可能被接受或拒絕。使用所提議系統的測試物件對其提供的播放列表的評價高於先前基於先進強化學習的音樂推薦系統所提供的播放列表,並且在滿足他們的推薦之前也不需要拒絕儘可能多的歌曲,當基於個人簡檔接收推薦時以及基於通過對使用者進行分組而形成的聚合簡檔接收推薦時。

INTRODUCTION

運動對健康的益處已經被廣泛地建立起來了。經常鍛鍊的人已經降低了發展各種醫療條件的風險,包括肥胖、某些癌症、糖尿病、中風和冠心病。儘管許多人不喜歡運動,但音樂已經被證明有一種激勵作用,可以鼓勵人們更努力地鍛鍊或更長時間,從而幫助他們保持健康。然而,也有證據表明,並非所有的音樂都有同樣強烈的動機效果;雖然有些音樂對某些人來說是很有動力的,但其他音樂對鍛鍊習慣沒有明顯的影響。此外,由於個人偏好和文化背景,可能不會有普遍動機的音樂,不同的研究物件表明,如果音樂節奏快速、緩慢或混合,那麼音樂的動機就更有可能是激發性的。

研究表明,在確定一段音樂的動機性內容時,可能無法進行追蹤,但研究表明,通過整合他們的音樂喜好,可以為特定的使用者可靠地選擇激勵音樂。像強化學習這樣的演算法可以用來幫助確定這樣的偏好;然而,如果沒有對使用者的額外資訊,這樣的演算法也可以要求使用者對數百條軌道進行評估,以獲得足夠的資訊來提供質量結果。這可能會讓使用者感到疲勞,而且可能需要很長時間,使得這樣的系統不方便使用。因此,我們提出了一個系統,它包含了一個使用者分析步驟,它代表了使用者的音樂和運動偏好,使演算法能夠以實際的方式提供令人滿意的音樂。我們還擴充套件了使用者資訊,以表示組和個人,以便提議的系統可以為團體活動推薦音樂,比如物理治療(利用人體生理對物理刺激所作出的反應來達到治療目的,有聲音治療),這對所有參與者都是合適的。

LITERATURE REVIEW

除了通用的音樂推薦系統之外,研究人員還開發了幾個特定任務的音樂推薦系統。然而,運動的具體活動有一些方面需要特殊考慮,這在一般情況下是不需要的,比如開車。例如,使用者在鍛鍊時可能會以非常特定的速度或時間移動,而在試圖入睡、開車、閱讀或簡單地聽音樂時,他們不太可能這樣做。因此,設計為運動推薦音樂的系統必須考慮到嚴格的節奏限制等方面。

一些系統已經開發出來,專門為運動推薦音樂。TripleBeats為使用者提供了更快或更慢的音樂,這取決於系統確定使用者是否加速或減速。PersonalSoundtrack可以測量使用者的跑步速度,並推薦使用相同的節奏的音樂,而IM4Sports則採用了一個訓練階段,該階段可以根據使用者之前選擇的音樂來預測未來的推薦。然而,這些系統大多基於音樂的節奏提供建議(IM4Sports也包含了藝術家和流派的特色)。他們忽視了其他的特徵比如生理激勵這可能會影響一段音樂如何更有激發性

ALGORITHM

最初,建議的系統大約有384,500首可以推薦的歌曲。這些歌曲是從百萬歌曲資料集(MSD)的音軌中獲得的,並且還可以從http://7Digital.com上獲得預覽。然而,這些音訊大部分可能與任何特定的使用者都不匹配。因此

1、本文所提系統使用使用者資訊(UP)步驟,該系統使用問卷來建立使用者資訊。

從問卷中獲得的資訊與音樂特徵進行了比較,將最初的384,500首歌曲精簡為1000首歌曲,使用者更有可能喜歡這些歌曲,從而使推薦問題更加易於處理。

問卷還被用來將使用者分組到具有類似音樂品味的群體中;

然後建立聚合使用者資訊,以便找到可能被整個組接受的建議。

2、最後,強化學習(RL)用於細化UP推薦系統提供的初始結果。

A. User Profiling System

在訂閱系統時,使用者首先被定向到一個包含調查表的頁面,該頁面將用於確定他們的概要檔案。這些問題被設計成與文獻中經常提到的特徵相關聯,這些特徵對諸如節奏之類的音樂的刺激性有潛在的強烈影響。

使用者將他們喜愛的歌曲、藝術家和流派輸入文字框。研究表明,使用者更有可能出於一段音樂如果他們個人喜歡這首歌[5],這部分的問卷允許使用者列出這些資訊來幫助系統找到類似的音樂,他們也可能喜歡。然後,使用者將音樂的節奏偏好輸入,同時也可以選擇音樂的節奏。最後,構造出音樂的loud,energetic,positive,familiar程度,韻律的重要程度的五級量表。

B. Clustering Technique

在問卷被填滿之後,系統可以使用它們將使用者分組到類似音樂品味的群組中。對於叢集使用者的推薦適合很多人,這在各種情況下都很有用。例如,團體鍛鍊或以音樂為主題的團體治療課程,最好是使用所有小組成員都能接受的音樂。

在計算相似性之前,每個使用者根據其回答的調查問卷構造一個向量。向量的元素是使用者對於下面所列六個元素的評級值,即向量(loud,energetic,positive,familiar,rhythm),加上節奏偏好輸入(未提供則該元素為空) ,以及資料庫中每個藝術家,歌曲和流派條目的一系列二進位制值。三元值為藝術家,歌曲,和型別值,如果為“0”表示使用者沒有表示自己是否喜歡,對於使用者列為最喜歡的條目給出一個積極的權重,使用者沒有一個最喜歡的作家列表,但是MSD指數顯示存在“類似”藝術家使用者列表,則權重設定成一半。這樣,藝術家、歌曲和流派的權重都與其他特徵相同。

每一對向量之間的相似度是通過歐式距離計算,然後向量是叢集分成組通過k - means演算法(圖1)。最後,每個群組的資訊是通過平均和舍入使用者對該群組使用者列出的(響度,能量,快樂,節奏,流行度和節奏突出度)的評級值,然後彙總該組使用者建立的歌曲,藝術家和流派這個三元組資訊。

C. Initial Recommendations via UP

使用者資訊,無論是針對個人還是團體,根據公開資料集MSD的特徵,將最初的380000個音軌縮小到大約1000個音軌(這是為了讓提議的系統被其他人採用)。如下方法:

····如果資料庫中的任何歌曲都有使用者作為自己喜好而輸入的標題或藝術家的名字,那麼這些歌曲很大概率會被包括在內。資料庫中的每個藝術家都根據http://AllMusic.com的型別結構來對映到一種型別,而那些相似流派的藝術家的歌曲也更易被包含進來。

····如果一個使用者資訊包含了通過點選過程輸入的喜好節奏資訊,那麼在節奏值附近的音樂更有可能被保留。否則,5點值首先被轉換成5個等距的範圍,50-100BPM到150-200 BPM(beats per minute)。在適當範圍內的音樂更有可能被保留。

····這種使用者對音樂的熟悉程度可以與MSD的“hottness”功能相比較,在於“更熱”的音樂更可能對使用者來說是熟悉的

····對節奏突出的反應是根據MSD的“節奏感”特徵進行的,因為更強的節奏往往預示著強烈而清晰的節奏。

····在這個過濾過程中,不使用loudness、arousal和valance值。雖然這些元素中有一些MSD特徵,但我們沒有發現它們足夠可靠以達到我們的目的。

D. Reinforcement Learning System

在獲得1000個潛在推薦之後,隨機選擇第一個含10首音樂的推薦集供使用者評估。為使用者提供歌曲名稱、藝術家姓名、發行年份,以及從http://7Digital.com獲得的30秒音樂預覽。然後使用者聽音樂並決定他是否認為音樂適合運動。然後他可以接受或拒絕它。如果他接受了,那首歌就會儲存在他的播放列表中。但是,如果他拒絕了,就必須產生更多的建議來取代被拒絕的曲目。

對於RL演算法,我們遵循非貪婪的方法[9]。這種方法將問題建模為一個n-armed bandit(多臂老虎機)問題,該問題在多個迭代中優化結果,而不僅僅是一個迭代。使用者的偏好潛在特性通過接受或拒絕採用協同過濾來找到,然後從內部系統從1000首音樂子集中進行選擇,這是為了平衡exploring和exploit(利用舊偏好exploit,挖掘新偏好explore),以便在後續迭代中提供更好的建議。新的建議被傳遞給使用者,使用者可以像以前一樣接受或拒絕它們,並且向用戶推薦新的歌曲比已經聽過的音樂更容易接受,他們也可以從播放列表中刪除歌曲。這個過程一直持續到使用者接受了10首歌曲。

EXPERIMENT AND RESULTS

60名大學生志願者被分成3組,每組20名學生參加測試。這裡學生對自己所在的group不知情

第一組利用本文所提供的系統,其成員根據各自的問卷收到最初的一套音樂建議。

第二組利用本文所提供的系統,但是這個組的成員被分類成叢集,並根據他們的叢集彙總問卷得到他們最初的建議。我們根據經驗將簇的數目設為3。

第三組使用一個沒有UP系統的參考系統。

實際過程

1、所有的學生都填寫了一個使用者資料,然後在實驗室環境中使用音樂推薦系統,並由研究人員進行監控。

2、學生收到了最初的推薦

3、拒絕不合適的音樂,或接受音樂

4、如果拒絕音樂則會根據強化學習系統收到新的推薦。

5、學生們使用這個系統,直到他們完成了十首他們認為可以在練習中使用的歌曲的播放列表。

在這一點上,他們被要求進行每首歌曲的評估以及一個整體的播放列表的評估,採用五級量表方法,評估是否適合運動;他們還被要求指出他們是否會在真實的環境中使用這個系統來選擇音樂進行鍛鍊。整體實驗結果如表一:

如圖:

他們願意在未來使用每個系統推薦音樂運動表中資料第一行。結果表明,這兩個使用本文UP系統比沒有使用UP的參考系統表現更好。使用參考系統的學生中,足足有一半不願意再使用這套系統,而使用其他系統的學生中,有四分之三的人想再使用這套系統。t-test證實這些結果具有統計學意義(p < 0.05)。

對於個體(第一組)應用本系統在測試期間平均拒絕了大約27首歌曲,而未使用本文系統的使用者大約拒絕約34首,接受跟蹤之前獲得10 - 25%可接受的歌曲超過該系統。事實上,參考系統有更多的學生拒絕40首以上。

CONCLUSION AND FUTURE WORK

使用UP演算法的系統優於參考系統。學生們表示,他們更有可能使用新系統,而且他們得到了可接受的建議,而不必對許多不可接受的建議進行評估。我們還發現,使用該系統的組使用者產生了類似的結果,使用個性化的概要檔案,驗證系統等在組織環境中使用的類。在未來,我們將讓我們的受試者按照推薦的音樂進行鍛鍊,並監測他們的生理和心理反應。這將使我們更好地理解推薦音樂在運動中對人們的影響。我們還將把結果擴大到其他年齡組。我們正在安排與當地小學的學生在體育課使用我們的系統。