乎睿資料:馬蜂窩1800萬條評論造假 馬蜂窩告乎睿資料
乎睿資料捅了馬蜂窩:你們1800萬條評論造假 馬蜂窩告了乎睿資料:已清理涉嫌虛假點評賬號
每經記者 張韻 每經實習記者 趙雯琪 劉洋 每經編輯 陳俊傑
“旅行之前,先上馬蜂窩。”2018年世界盃期間一則廣告席捲網路,在北京馬蜂窩網路科技有限公司(以下簡稱馬蜂窩)收穫大波流量的3個月後,這個憑藉使用者原創內容(UGC)逐步壯大的線上旅遊平臺,被一個叫乎睿資料的團隊(深圳乎睿資料有限公司)揭開了疑似資料造假的一角。
10月21日晚間,自媒體“小聲比比”在已釋出《估值175億的馬蜂窩竟是一座殭屍和水軍構成的鬼城?》一文後,如約釋出了第二篇指馬蜂窩充斥殭屍和水軍的報告文章。隨著輿論發酵,馬蜂窩於22日上午釋出公開宣告表示,針對該文中歪曲事實的言論,和已被查證的有組織攻擊行為,馬蜂窩將採取法律手段維護自身權益。10月22日晚間,馬蜂窩起訴深圳乎睿資料有限公司、丁子奎名譽侵權案獲立案。
值得關注的是,馬蜂窩“資料造假”風波有了新進展。10月22日晚6點49分左右,馬蜂窩“資料造假”爆料人、自媒體“小聲比比”公眾號作者“梓泉”釋出朋友圈,貼上一封訴訟服務告知書,並配文稱“開戰今晚第三篇”。
2014年4月,馬蜂窩CEO陳罡曾經在 微博 公開炮轟去哪兒網通過虛假評論造假,稱去哪兒網的刷點評行為已經動搖到了行業誠信的根基。如今,馬蜂窩“被捅”,有何說法?
馬蜂窩陷“抄襲門”
10月21日,一篇由自媒體“小聲比比”釋出的《估值175億的馬蜂窩竟是一座殭屍和水軍構成的鬼城?》的文章在網路刷屏,作者梓泉根據乎睿資料團隊提供的資料報告在文中表示,馬蜂窩2100萬“真實點評”中有1800萬條是通過機器人從競爭對手平臺上抄襲而來。
文章一經發布,公眾號便收到了馬蜂窩“損害商業信譽”的ofollow,noindex">投訴 ,梓泉在次日的推文中稱,不僅如此,“在文章發出來8個小時以後提及的賬號從搜尋欄遮蔽,點評內容也在個人頁被刪除了。”
10月22日,乎睿資料團隊以郵件形式向《每日經濟新聞》記者傳送了一份關於馬蜂窩的25頁資料報告,該報告顯示馬蜂窩疑似存在評論搬運、遊記摻水、問答抄襲的現象。
乎睿資料團隊在報告中表示,經初步探索馬蜂窩UGC和使用者資料並與競品比照,結果發現,包括官方賬號在內的許多螞蜂窩使用者,人均抄襲了數百名大眾點評網使用者的評論以及大量來自 攜程 、藝龍、Agoda、Yelp等知名網站的使用者內容,甚至還屢次在官方有獎活動中拔得頭籌。
10月22日下午,《每日經濟新聞》記者通過“小聲比比”公眾號聯絡上該自媒體作者梓泉,其向記者透露,文章的素材來自於乎睿資料對馬蜂窩使用者點評等資料的分析報告。談及撰寫併發布馬蜂窩一文的原因,“梓泉”向記者透露,一開始是乎睿資料通過公眾號聯絡上他,“先確定興趣,然後籤保密協議,然後再看報告。”“梓泉”說。當日,馬蜂窩相關負責人則告訴《每日經濟新聞》記者,“目前正在走法律程式。”對此,“梓泉”表示,截至當時只看到馬蜂窩對公眾號兩篇文章的投訴 ,沒有公司聯絡到他本人。
10月22日晚間訊息,針對自媒體報道的馬蜂窩資料造假一事,馬蜂窩已向北京市朝陽區人民法院提起訴訟,稱乎睿資料侵犯名譽權,目前已獲立案。
馬蜂窩否認85%點評造假
上述報告顯示,乎睿資料團隊經過資料分析發現,馬蜂窩上有7454個抄襲賬號,合計從競品網站上抄襲搬運了572萬條餐飲點評與1221萬條酒店點評,佔到官網聲稱總點評數的85%。
乎睿資料團隊剔除“抄襲賬號”後,在餘下的所有賬號中選擇了15000個最活躍的賬號,發現使用者在答題、點評等行為時間上高度一致,且與其他同類型評論網站釋出時間差異較大,大多是工作時間(週一至週五10時至12時、14時至17時)更為活躍。
乎睿資料團隊還發現,一批在遊記攻略中植入廣告的商家通過抄襲、拼接等“做號”、“洗稿”手段批量炮製出含有廣告內容的遊記、問答、回覆,再由大量的小號、馬甲進行人工置頂,達到以低成本對平臺上億使用者打廣告的目的。
乎睿資料團隊“捅了”馬蜂窩,一時間輿論如潮。馬蜂窩於22日上午7點45分在微博釋出宣告稱,馬蜂窩的UGC內容資料中,遊記和攻略佔比78.91%,嗡嗡(旅行故事)佔比7.92%,問答佔比10.26%。這些資料背後是使用者真實的情感與回憶,也是馬蜂窩內容的真正價值。
馬蜂窩進一步表示,點評內容在馬蜂窩整體資料量中僅佔比2.91%,涉嫌虛假點評的賬號數量在整體使用者中的佔比更是微乎其微,馬蜂窩已對這部分賬號進行清理,其認為“自媒體文章所述的馬蜂窩使用者數量與事實和第三方機構資料都嚴重不符”。與此同時,一直以來,馬蜂窩嚴厲打擊遊記和問答中違規廣告的行為,平均每週處理26000條違規廣告資訊、查封15000個違規賬號。
對於報告資料探勘選用的工具與分析的科學性與準確性等問題,《每日經濟新聞》記者22日通過郵件向乎睿資料團隊提問,但截至發稿尚未收到回覆。
資料爬蟲業內屢見不鮮?
2018年10月21日,馬蜂窩旅遊網對全站遊記、攻略、嗡嗡(旅行故事)問答、點評等資料進行了核查,並對涉嫌虛假的資訊展開查處。
馬蜂窩在公開宣告中表示,餐飲點評不是馬蜂窩的內容核心,且部分點評來自於遊記、問答的內容的提取,自媒體將馬蜂窩使用者內容生產的活躍週期,與餐飲等本地生活服務類APP相對比,並解讀為馬蜂窩員工有組織地抄襲,存在明顯的誤導傾向。
實際上,就此事業內也有不同的觀點。
“馬蜂窩承認部分點評來自內容提取,讓UGC行業或多或少地暴露出原創內容端的不足、不同埠資源共用等問題。”業內人士分析認為,馬蜂窩被疑抄襲的內容存在一定的被“反爬”跡象,比如點評中出現翻譯提供方的字樣等恰恰說明這是行業比較常見的操作。
電子商務研究中心生活服務電商分析師陳禮騰認為,有些平臺從其他平臺抓資料的目的是為了製造流量很大的假象,既給使用者看、商家看,更是給投資人看。由於不涉及到資料庫門檻,在技術上沒有難度,任何一個爬蟲工程師就可以做到,也可以批量處理,通常是“機器抓取+人工編輯”。
“網際網路公司利用爬蟲技術,從其他平臺抓取資料的行為應該說較為常見。”陳禮騰表示。
此外,從事旅遊平臺管理的技術員小王告訴《每日經濟新聞》記者,討論行業共性問題時首先要清楚這次報告顯示的資料抓取和分析是否存在系統性偏差或者內定指標。他建議,可以同樣抓取相關平臺數據做行業對比分析才有說服力,除此之外應把平臺系統性造假和使用者自身一稿多投的問題區分開。“前者是蓄意欺騙,後者算是監管不嚴。”
爬蟲抓取、抄襲和造假在網際網路行業並不少見,陳禮騰表示,甚至已經成為很多平臺屢試不爽的一大“捷徑”,但對於像馬蜂窩這樣的企業而言,或許入駐馬蜂窩平臺的商家為吸引人氣和流量所為的可能性更大。
究其原因,業內人士認為,正是因為使用者原創內容愈發趨於商業化,在此情況下想要獲取帶有流量的原創內容的成本變得越來越高。“在使用者從確定旅遊目的地到購買旅遊產品的場景中,企業僅僅依賴UGC基礎上的廣告營收是遠遠不夠的,變現、盈利成為生存難題,而反過來這些客源也勢必會成為企業間爭奪的核心資源。”
平臺形象遭yuweiji
電子商務研究中心特約研究員、北京志霖律師事務所趙佔領律師指出,使用者點評版權存爭議的核心問題是存在法律“空白”,任何一家平臺未經允許擅自抓取其他平臺上使用者所釋出的資訊的行為如果屬實,就涉嫌不正當競爭。
陳禮騰進一步指出,如該事件屬實,消費者對於平臺的信任度將大打折扣,造成使用者流失,品牌形象、未來經營都將受到一定影響。
從旅遊社區起步的馬蜂窩誕生於2006年,在2011年10月及2013年4月,分別獲得A、B兩輪融資。2015年1月獲得高瓴資本等投資的8500萬美元C輪融資,同年釋出自由行戰略後探索出了一條從內容到資料再到交易的商業模式,目前已在2017年完成1.33億美元的D輪融資。
彼時,馬蜂窩CEO陳罡在D輪融資的內部信裡表示,每月有1億活躍使用者,其中85%來自移動應用程式,“三年後,螞蜂窩將成為中國最大的旅遊流量平臺”。馬蜂窩曾公開表示該網站的使用者每月釋出超過13.5萬篇旅遊文章,當時預計2017年個人旅遊產品的銷售額會超過90億元人民幣。
目前,無論馬蜂窩平臺背後的真實資料佔比多少,其核心價值勢必受到投資者的關注與考量。但從估值影響上看,陳禮騰認為,對於投資者言這些資料僅僅是一些參考指標,並非其核心內容,最終還是要看馬蜂窩的轉化率及盈利能力如何。如此看來,該事件對於馬蜂窩的投資人信任與核心估值是否會產生較大影響尚難定論。
馬蜂窩在此次的宣告中表示,2016年以前,馬蜂窩曾激勵使用者發表點評,點評資料出現快速增長。但隨著馬蜂窩全方位移動網際網路化及使用者量級的增長,以遊記、攻略為代表的長內容,以嗡嗡(旅行故事)、問答為代表的短內容產品成為運營重心,它們共同構成馬蜂窩的核心競爭力。
根據消費者權益保護法和新出臺的電商法等相關法律,陳禮騰說,若上述自媒體曝光資訊屬實,馬蜂窩的做法或已涉嫌違法;若只是平臺上商家所為,馬蜂窩作為平臺享有“避風港原則”規定的一定的免責權利,具體是否該承擔責任,則要看平臺有沒有盡到應盡的商家管理、平臺治理、資訊審查這方面的義務。