1. 程式人生 > >虛假新聞檢測資料集

虛假新聞檢測資料集

1.FakeNewsNet
下載連結:https://github.com/KaiDMML/FakeNewsNet
說明:該資料集包含新聞內容和正確標註真假新聞標籤的社會語境特徵。
使用論文:
(1)A Stylometric Inquiry into Hyperpartisan and Fake News
(2)Exploiting Tri-Relationship for Fake News Detection
2.BuzzFeedNews
連結:https://github.com/BuzzFeedNews/2016-10-facebookfact-check/tree/master/data
說明:該資料集包括完整的Facebook新聞釋出於接近2016年美國大選從9月19日到23日以及9月26日和27日。
3.LIAR(政治類別)
連結:

http://www.cs.ucsb.edu/~william/software.html
說明:該資料集是從PolitiFact收集,包括簡短陳述,例如新聞稿,電視
或電臺採訪,競選演講等,幷包含元資料。
使用論文:
(1)“Liar,LIar Pants on Fire”:A New Benchmark Dataset for Fake News Detection
(2)Multi-Source Multi-Class Fake News Detection
4.BS Detector
連結:https://github.com/bs-detector/bs-detector
說明:為新聞瀏覽器匯出的資料集,包含新聞內容和正確標註真假新聞標籤。5.CREDBANK
連結:
http://compsocial.github.io/CREDBANK-data/

說明:推特的大資料集,包含新聞內容和人工標註標籤。
資料集涉及的內容如下:
6.Twitter and Weibo DataSet
連結:https://github.com/majingCUHK/Rumor_RvNN
http://alt.qcri.org/˜wgao/data/rumdect.zip
說明:5000條言論帶著500w的轉發量
使用論文:
(1)CSI: A Hybrid Deep Model for Fake News Detection
(2)Detecting rumors from microblogs with recurrent neural network
(3)Early Detection of Fake News on Social Media Through Propagation Path Classification with Recurrent and Convolutional Networks
7.Twitter15 Twitter16
連結:
https://www.dropbox.com/s/7ewzdrbelpmrnxu/rumdetect2017.zip?dl=0

說明:謠言資料
使用論文:
Detect Rumors in Microblog Posts Using Propagation Structure via Kernel Learning
8.推特語料
連結:http://www.cs.jhu.edu/svitlana/
說明:具體時間事件所蒐集的資料集
使用論文:
Separating Facts from Fiction Linguistic Models to Classify Suspicious and Trusted News Posts on Twitter
9.圖資料
連結:https://drive.google.com/open?id=0B3e3qZpPtccsMFo5bk9Ib3VCc2c
說明:文字+影象
使用論文
TI-CNN: Convolutional Neural Networks for Fake News Detection
10.謠言資料集
連結:http://mia.kaist.ac.kr/publications/rumor.
說明:資料集包含三個維度:時間,結構和語言
使用論文:
Prominent features of rumor propagation in online social media