1. 程式人生 > >電影資料集總結:Netflix、MovieLens、LDOS-CoMoDa、AdomMovie

電影資料集總結:Netflix、MovieLens、LDOS-CoMoDa、AdomMovie

資料集:

1.Netflix

描述:包含Netflix48萬多個隨機選取的匿名使用者,對於17千多部電影的1兆多個電影評分

時間:1988.10~2005.11

內容:

包括training setmovie titlesprobe setqualifying set等檔案。

Trainning set包含4個特徵值:電影ID、使用者ID、評分(1~5)、日期;

Movie titles包含3個特徵值:電影ID、上映年份、電影標題;

Probe set用於測試,包含2個特徵值;電影ID、使用者ID

引用的論文:

[3]Factorization meets the neighborhood a multifaceted collaborative filtering model

2.MovieLens

描述:按大小分成3部分

100k943個使用者對於1682電影的100,000個評分;每個使用者至少評級20部電影;包含使用者的人口統計資訊(年齡,性別,職業,郵編)

時間:1997.9.19~1998.4.22

包含u.datau.infou.itemu.genreu.useru.occupation幾個檔案

U.data: 使用者id 、專案 id 、 評分、 時間戳

U.info: 使用者數量、專案數量、評分數量

U.item: 電影id、電影標題、上映日期、光碟上映日期、IMDb URL、流派

U.genre: 流派

U.user: 使用者id、年齡、性別、職位、郵編

1M 6,040個使用者對於3,900部電影的1,000,209個評分

時間:2000

包含ratings.datusers.datmovies.dat

Ratings.dat: 使用者id、電影id、評分(1~5)、時間標籤

Users.dat 性別、年齡、職位、郵編

Movies.dat: 電影id、標題、流派

100M71567個使用者對於10681部電影的10000054個評分

包含 movies.dat, ratings.dat 和 tags.dat.

Tags.dat:使用者id、電影id、標籤(tag)、時間戳

3.LDOS-CoMoDa

(1)基本情況


(2)統計情況:

使用者年齡段大多數集中在16

35歲之間;

大多數電影得到23個評分;

 


檔案每一行結構如下:

UserID,itemID,rating,age,sex,city,country,time,daytype,season,location,weather,social,endEmo,dominantEmo,mood,physical,desicion,interaction,director,

movieCountry,movieLanguage,movieYear,genre1,genre2,genre3,actor1,actor2,actor3,budget

每列的數值範圍:

LDOS - CoMoDa dataset_____________________

Data fields:versionDate: date of the dataset versionuserID (15 - 200, some missing)itemID (1 -4138, some missing)rating (1-5)user's ageuser's sex (1=male, 2= female)user's cityuser's countrytime (1-4)daytype (1-3)season (1-4)location (1-3) weather (1-5)social (1-7) endEmo(1-7)dominantEmo (1-7) mood (1-3) physical (1-2) decision (1-2) interaction (1-2)movie directormovie's countrymovie's languagemovie's yeargenre1genre2genre3actor1actor2actor3movie's budget 


 上下文屬性:_______________________

Context variables:time : Morning, Afternoon, Evening, Nightdaytype : Working day, Weekend, Holidayseason : Spring, Summer, Autumn, Winterlocation : Home, Public place, Friend's houseweather : Sunny / clear, Rainy, Stormy, Snowy, Cloudysocial : Alone, My partner, Friends, Colleagues, Parents, Public, My familyendEmo : Sad, Happy, Scared, Surprised, Angry, Disgusted, NeutraldominantEmo : Sad, Happy, Scared, Surprised, Angry, Disgusted, Neutral mood : Positive, Neutral, Negativephysical : Healthy, Ill decision : User decided which movie to watch, User was given a movieinteraction : first interaction with a movie, n-th interaction with a movie Context values in the database corespond to this order.(for example: daytype-> 1 = Working day, 2 = Weekend, 3 = Holiday

_______________________

Missing value:-1

4.AdomMovie