你每個月10GB流量,6GB都被廣告偷走了!
歡迎關注“創事記”的微信訂閱號:sinachuangshiji
文/光譜
來源:矽星人(ID:guixingren123)
在網上,你從未“孤獨”。有人正躲在陰暗的角落,記錄著你的一切行蹤…
矽星人的讀者朋友可能記得,我們寫過幾篇科技“打黑”類的文章,比如
ofollow,noindex">《深扒福布斯中國30under30精英“摻水”榜》
等等。
距離上一篇,已經過去了兩個月,大家是不是又想看了?
不多廢話,今天再給大家分享一個科技行業小黑幕。(正好今天12月4日是國際餅乾節,這個黑幕正好跟 cookie 有關……)
這件事相信已經存在很久了,但是我是昨天看一個國外的技術部落格時發現的:
為了實現全域性遮蔽廣告,波蘭籍資料分析專家米哈爾·庫亞克 (Michał Ćwiok) 在家裡裝了一個名叫 Pi-Hole 的開源軟體。
Pi-Hole 能安裝在樹莓派電腦上,變成一個 DNS 伺服器。簡單來說,它能把所有廣告路由到一個不存在的地方,也能遮蔽追蹤請求。結果就是,在網路下的所有裝置,無論是在網頁還是 app 裡,都再也看不到廣告,個性化推薦也越來越少。
簡單介紹以下追蹤 (tracking),就是網站會在使用者本地儲存一個 cookie 檔案,在裡面寫入一些關鍵的資訊,比如登入使用者名稱、購物車之類的,方便下次訪問時調取使用。同時,追蹤也可以用於繪製使用者畫像,進行廣告推薦。
庫亞克打開了 Windows 10 電腦,用系統自帶的 Edge 瀏覽器看了幾條帖子和幾條新聞,過程中訪問的都是波蘭當地知名的新聞門戶、電視臺網站,以及 Facebook (facebook.com) 之類的。
得到的結果,讓從事科技行業的他也感到有點詫異。
首先,在過去的20分鐘裡,Edge 瀏覽器一共發起了1232個請求,基本上每秒一個請求,而他一共只打開了十來個網頁……
紅色是被遮蔽掉的請求,發生的時間以及域名
這沒什麼,接下來才是真的奇葩:
在總共1232個請求當中,有798個是廣告和追蹤請求。
因為開著 Pi-Hole,這798個請求已經被遮蔽掉了,上網過程中沒有感受到任何異樣,網頁都能正常開啟,該有內容都能看到。
798/1232=0.647。也就是說,那麼在這20分鐘裡,廣告和追蹤佔據了他上網全部流量當中的大約64%。
最後他得到了一個細思極恐的結果:
作為一個擁有正常上網習慣的典型網民,上網過程中使用的流量,有大約64%,至少一大半的流量,都浪費在了廣告和追蹤上……
他把資料視覺化做成了一個透視表,更令人觸目驚心:
橫軸是時間段落,縱軸是每一分鐘內發出的請求總數,黃色是正常請求,藍色是被遮蔽掉的廣告追蹤類請求。
最恐怖的發生在分鐘47上:當時庫亞克打開了新聞門戶 wp.pl, 在那一分鐘裡,蜂擁而至的廣告和追蹤請求佔到了全部請求當中的95%。
如果你也從事科技行業,可能對這種廣告追蹤滿天飛的情況並不陌生。
可是對於普通網友來說,64%這個資料未免也太可怕了!
如果能去掉這一大半(對於使用者而言的)無用請求,大家的上網流量得省多少啊!
月初:
月底:
接下來問題來了。
這些看得見或者壓根看不見還沒有用的流量,到底都去了哪兒呢?
庫亞克把這次實驗的資料釋出在了自己的部落格上,有興趣的讀者朋友可以前往,看看更多資料::link: https://goo.gl/A7QgXc 末尾也有全部廣告追蹤請求的列表。
在部落格裡,庫亞克統計出了作為一個波蘭普通網民,最經常可能會遇到的廣告流量追蹤。下圖裡列出了前十名:
他發現在這20分鐘內的一共798個“無用”請求裡,將近130個去了 tracker.pracuj.pl,來自 pracuj.pl。這是一個求職網站,庫亞克在20分鐘內也登入過這個網站
——好在,雖然請求數確實多的可怕,也只是在使用者瀏覽該網站的時候才追蹤,這就是第一方追蹤或者站內追蹤。
如上圖表中排第二、第四、第五、第六、第七和第八的 URL,都是來自 Google。 如果把 Google 的追蹤都合起來,請求數量達到了189個,佔所有廣告請求裡的五分之一。
庫亞克在這段時間瀏覽其它網站,向 Google 的追蹤伺服器發起了175次請求,卻根本沒有訪問 Google 旗下的網站或者產品…… 這就是所謂的第三方追蹤,或者形象一點叫跨站追蹤 。
這一點,Facebook 詮釋的最好了:前面提到這段時間裡庫亞克上了 facebook.com,但你看錶中排第三的請求壓根不是 .com,而是去了 connect.facebook.net。
這是因為某些網站集成了 Facebook 的開放平臺,網民在這些網站上的操作行為,所表達的言論或者關注的東西,Facebook 全知道——現在你明白 Facebook 的錢怎麼賺了~
Facebook 的追蹤遍佈全網,瞭解你的如下資訊:瀏覽歷史、購物的店名、買到的東西、使用的手機,以及其他公開資訊。
庫亞克還發現了一件很匪夷所思的事情。
歐洲有個 GDPR,它的全稱是歐盟通用資料保護條例,前不久剛剛生效。它要求網站提供各種各樣的彈窗,在使用者可能進行某些暴露隱私的操作時,交代這樣做的後果,以及自己如何追蹤使用者,然後徵求使用者的許可。
一個 GDPR 彈窗可能的樣子,它可以讓使用者自己選擇在本地儲存哪種 cookie
但是庫亞克發現, 即便在 wp.pl 的彈窗裡拒絕了追蹤,最後瀏覽器還是發出了一大票追蹤請求……
一個可能的解釋是,這些網站裡集成了一些其他第三方的服務,比方說插入了 YouTube 的播放器,或者一條 Twitter、Facebook 上的帖文。
這樣即使使用者拒絕網站主追蹤自己,還是逃不過這些科技巨頭的魔爪……
幾乎任何網站都可以嵌入這類模組
我們每一個人都正在經歷這樣的事情:不僅僅是在波蘭,在中國,在美國,作為普通網友,在上網時都躲不開這些廣告和追蹤。
在中國,業界知名的廣告聯盟包括百度、阿里媽媽、騰訊、多盟、360、Inmobi 等,排名不分先後;在美國(以及大部分西方國家),Google、Twitter 和 Facebook 的追蹤都已經遍佈全網。
在有網際網路的任何地方,廣告追蹤都已經成為極其普遍的現象。隨便開啟一個網站,頁面裡面找不到一兩句跟各大追蹤平臺有關的程式碼幾乎不可能。
如果你對自己上網的流量進行一個監測。即便過程中不訪問BAT、G家、Facebook 和 Twitter 旗下的網站,估計會看到:去往上面這些廣告追蹤平臺的請求佔了絕大部分。
這也是為什麼,當你開啟一條新聞或者文章,裡面都是純文字或者很簡單的排版,圖片也沒幾張,卻能用掉好幾MB的流量——朋友,現在終於明白箇中原理了吧?
如果你也仿照庫亞克, 對這些看得見的廣告和看不見的追蹤進行遮蔽,很可能會驚訝地發現,居然省了這麼多流量;
因為省了流量,載入一個網頁的速度也變快了,你甚至會感覺到網速有所提升;
除了省流量提速,你還會發現,該看到的內容還是能看到。有沒有廣告和追蹤,其實完全不影響網站的正常使用……
Mozilla 基金會在今年四月釋出了一份《2018網際網路健康報告》,描述了當代普通網友和廣告追蹤之間的關係。
“我們檢查微信和電子郵件,然後在公交車上刷刷微博,把早上喝咖啡的照片釋出到 Instagram 並且加上咖啡店的 tag。午餐閒暇時,我們查一下朋友在 Facebook 上推薦電影的評價,順手刷以下之前關注的一雙鞋的價格。
實際上我們每次上網,都會留下活動痕跡。而在幕後,很多與我們所訪問網站、所使用服務完全無關的“第三方”公司,可以在我們上網時追蹤和記錄我們的活動,收集與我們有關的資料。
這也是為什麼到了晚上,我們開始在看到與那部電影有關的社交網路內容、鞋子的廣告以及推薦的咖啡。這並不是巧合,而是資料追蹤 (data-tracking) 正在努力工作,追蹤你在瀏覽器,在各種應用甚至是電子郵件裡的活動。”
這正是我們每天都經歷的事情。淘寶/亞馬遜/eBay 之類的電商網站推薦給我們的商品越來越對胃口,感覺上確實挺方便,但細想總是感覺毛骨悚然: 這些網站對你的瞭解,恐怕比你的親人愛人,甚至你自己都更多……
如果在一個絕對完美的世界裡,這倒還好。畢竟除了寬頻之外,上網這件事基本上是免費的。全球五大網際網路科技公司,有兩大(FB、Google)的主要營利方式就是廣告。不讓他們賺錢,這個網際網路還能用麼?
然而問題是,我們在過去幾年裡已經見過了雅虎、Quora 等資料洩漏,之前的 Cambridge Analytica 事件也證明了 Facebook 同樣不能免俗——即便是這樣的 世界頂級網際網路公司,他們收集的大量使用者資料,也是可以被竊取和濫用的。
不僅僅是這些公司,還有更多資料隱私販子,從各方購買和收集匿名的資料,然後用各種方式將匿名的資料實名化,湊成一份關於你的,相當詳實可靠的使用者畫像。
你的種族樣貌、收入消費水平、生活狀況和愛好等等,在這份畫像裡應有盡有。銀行和互金公司會利用它來評估你的信用,保險公司會利用它來提高你的保費。
這份使用者畫像真的太有用了,以至於華盛頓大學的研究者發現: 行業領先的移動廣告追蹤系統,已經足夠精確,它甚至可以被不法者用於高精度監控……
正在看文章的你,現在家裡有沒有智慧音箱?有沒有 Echo Show、Google Home Hub,Facebook Portal 這樣的所謂的智慧螢幕?
如果你正在使用這些東西的話,那麼只有一個壞訊息給你。你對智慧音箱說的語音指令,或者在智慧螢幕上打的視訊電話,無疑都會被網際網路公司追蹤……
以 Facebook 的智慧螢幕 Portal(上圖)為例,因為它使用的是 Facebook 即時通訊服務 Messenger 的底層服務,本質上和 Messenger 收集的資訊是一樣的。
Facebook 前不久也澄清,通過 Portal 收集到的資料,也會被彙集、整理、挖掘,最終用於呈現廣告和推薦。
接受現實吧:在過去我們用電腦,後來有了手機,又有了智慧音箱,未來還會有 VR 等更多與網際網路進行互動的方式—— 追蹤我們的隱私、生活方方面面的渠道,和被提取走的資訊量,只會越來越多。
以及,每個月的資料流量費越來越高……
說完了這件事,我還是感覺有點老生常談。
大約在2015年,蘋果對使用者資料隱私的“過度保護”在當時讓其他公司很不爽。當時 iOS 9 剛出來,內建的 Safari 瀏覽器裡集成了一個叫做 content blocker 的功能,開發者可以用它來開發 app,阻斷掉各種各樣的內容。
——蘋果已經很給其他公司面子了,因為 content blocker 最直觀的使用場景就是 ad blocker。
後來誕生了一票得到官方支援的去廣告 app,結果真的有用,很多網站載入速度從十幾秒降到了兩秒,而且載入完後也不再有聯網活動,意味著網頁底層的廣告追蹤無法工作,即省流量又省電。
然而用 iPhone 的、用 Android 手機並且有意識地各種聯網裝置上遮蔽了廣告的人,在全球來看仍然只佔個位數百分比。
生活在移動網際網路時代,一個人可以從未聽說過廣告追蹤,但不可能沒感受過它的效果。遺憾的是,關注廣告追蹤負面作用的人,真的少之又少。
實話說,我過去也沒有想象到情況居然這麼嚴重。 日常上網的流量,竟然一大半都花在了(說實話對於我來說真的沒意義的)廣告追蹤上面。
決定採用什麼商業模式,應該怎麼賺錢,是網際網路公司的工作,我們作為使用者,很大程度上是免費使用者,折射的決定權微乎其微。
但至少我們可以更加關注廣告追蹤這件事,大家可以探索一些技術的手段,瞭解自己日常生活中的廣告追蹤,到底佔了多少流量和網速。
GDPR 主要限制範圍在歐洲,其他國家和地區可能缺乏對網際網路隱私的強有力監管。所以,我們可以考慮使用 iOS content blocker、Pi-Hole,火狐之類的瀏覽器和一些優秀的、開源性質的去廣告外掛,來針對廣告追蹤,限制它的效果。
值得一提的是,Netflix 在宣傳《黑鏡》的時候做過一個很有意思的營銷策劃:它跟幾家科技新聞網站合作,普通使用者訪問網站時看到的是《黑鏡》廣告,而用了去廣告外掛的使用者會看到這樣幾行字:
“哈咯,去廣告使用者。
你看不到這條廣告,但廣告可以看到你。”
最後的最後,只要我們使用科技產品和網際網路服務,就意味著要接受它的使用者條款。
因此,很遺憾,在可見的未來,廣告追蹤將會伴隨我們很久。
前段時間, Netflix 上線了一部自制劇《Maniac》,由石頭姐 (Emma Stone) 和喬納·希爾 (Jonah Hill) 主演。對於被廣告和追蹤統治的未來,這部劇做了一個非常有趣的預測和呈現。
在劇中反烏托邦的紐約,消費水平極高,男主角連車票錢都付不起,只好選擇“廣告兄弟”(Ad Buddy):一個西裝革履的哥們兒會出現在身邊,一邊伴隨著自己去任何地方,一邊口播廣告。
這個設定也很準確地還原並且放大了廣告追蹤在真實世界裡的荒唐: 一個活人花費自己的時間和精力來播放大量的廣告,最後也只值一張車票或者一包口香糖;而現實中呢,一個廣告其實價格也就幾毛錢,卻能夠細緻入微,盤根究底。
這可不是我夢想中的未來……