1. 程式人生 > >推薦領域數據集

推薦領域數據集

amp details public 社交網絡 gen iou sources resources lec

轉自:http://blog.csdn.net/dajunxing/article/details/51357132,感謝分享!

http://www.grouplens.org/taxonomy/term/14

Movielens Dataset:

其中Movielens-100k和movielens-1M有用戶對電影的打分,電影的title、genre、IMDB鏈接、用戶的gender、age、occupation、zip code。movielens-10M中還有用戶對電影使用的tag信息。

HetRec2011 Dataset:包括了movielens-2k、delicious-2k和last.fm-2k。

在movielens-2k中,電影的信息更加豐富了,有IMDB和Rotten Tomatoes的信息,具體還有電影對應的genre、director、actor、發行的國家、拍攝的地點、tag信息,當然還有打分信息。

在delicious-2k中,是用戶對bookmark(書簽)的tag信息。具體包括用戶之間的relation、書簽的title和url、用戶對書簽使用的tag。這個數據集適用於tag的推薦。

在last.fm-2k中,是用戶收聽音樂的信息。具體包括雙向的朋友關系、藝術家、用戶收聽藝術家信息(有weight)、用戶對藝術家的tag信息、藝術家tag信息。

Wikilens Dataset

BookCrossing Dataset: 用戶對書的打分信息,用戶城市、用戶年齡、書在Amazon的信息及url。

Jest Joker Dataset

Eachmovie Dataset

(下圖摘自論文Recommender System Survey)技術分享

Flixster Dataset: 用戶對電影的打分以及用戶的friendship信息。 http://www.sfu.ca/~sja25/datasets/

Epinions Dataset: 包括用戶trust關系、用戶對item的打分信息、評論信息。 http://www.trustlet.org/wiki/Epinions_datasets

Yelp Dataset: https://www.yelp.com/academic_dataset

Bibsonomy Dataset: 與delicious類似。http://www.kde.cs.uni-kassel.de/bibsonomy/dumps

Foursquare Dataset:Location-based 推薦。http://www.public.asu.edu/~hgao16/dataset.html

Epinions and Ciao Dataset:http://www.public.asu.edu/~jtang20/datasetcode/truststudy.htm

另外還有一些社交網絡分析的數據集

http://snap.stanford.edu/na09/resources.html

http://snap.stanford.edu/data/

以上轉自:http://www.cnblogs.com/startover/p/3261476.html

A Collection of Recommendation Data Sets & data sets crawled and used in our research work

Douban、Epinions (665K)、Epinions (510K)、Epinions (Extended)、Flixster、FilmTrust、Jester、MovieLens 1M、MovieLens 10M

http://www.librec.NET/datasets.html

推薦領域數據集