1. 程式人生 > >周海漢:Alexa 深入研究

周海漢:Alexa 深入研究

2007-05-16

作者:周海漢

日期:2007.5.16

Email:[email protected]

blog1:http://blog.csdn.net/ablo_zhou

blog2:http://ablozhou.spaces.live.com

本文是根據自己為公司做的一個研究的PPT的 基礎上整理。這篇研究如果用於做企業培訓,一堂課價值1000美元。這裡免費公開,以減少後來 者的摸索。

Alexa作為世界網站排名的權威,是網站價值和網站廣告價值評估的重要依據。做網站如果不瞭解Alexa,那很大一部分是在瞎做。儘管Alexa排 名並不是完全準確,受到各種質疑,但至今為止,它的地位還是不可動搖。它的網頁資料庫,超過Google,是世界第一大資料庫。由它支撐的著名的wayback伺服器,收集了世界大部分有 影響網站的歷史版本。

http://www.alexa.com

Alexa歷史:

n       1996年4月成立於美國

n       分類導航和特定網站統計

n       1997年9月,釋出alexa toolbar 1.0

n       1998與Netscape整合,1百萬下載

n       1999 和IE整合,成為亞馬遜網站的全資子公司

n       2001年, wayback machine 收集網頁100 T

n       2002年,和Google合作提升搜尋功能, 收集 網頁 200T

n       2004年,採集世界45億個頁面

n       2005年9月,建立web搜尋平臺

Alexa 資料

n       世界獨立網站總數 1120萬 個

n       網頁數45億頁

n       世界最大網頁資料庫

Alexa 的功能

n       網站排名(Traffic Rank)

n       Reach統計

n       PV數統計

n       反向連結(link in)

n       相關網站

n       搜尋(不支援中文)

n       註冊收錄網站

n       工具條記錄訪問

n

網站排名(Traffic Rank)

世界網站流量排名(2007-4-27)

n       Rank Change Web SiteInfo

排名價格:

n       排名只排到十萬

n       購買Top 1萬,價錢1000$

n       購買Top 2萬5千排名,價錢2100$

n       購買Top 5萬,價錢4000$

n       購買Top 10萬排名的價格6500$

網站排名二次開發

n       Web service 方式

n       100 次URL請求價錢 $.25

流量排名統計原則

n       域名下的單獨頁面算在該網站流量

n       二級域名算在該網站流量

n       個人網站和blog 的 網站不算在網站流量

Reach 使用者數統計

n       Sina.com.cn 全球Internet使用者訪問百分比

n       Yesterday 1 wk.Avg. 3 mos. Avg. 3 mos. Change

n       3.475% 3.525% 3.387%  down 30%

Page View統計:

反向連結:

n       Sites link in

n       Link數可以作為評判網站受歡迎程度的依據

n       連結網站有Rank值

n       Related Links

n       通過該列表可以檢視受眾還對哪些網站感興趣

Alexa如何統計

n       每百萬工具條使用者訪問比例

n       每百萬PV中所佔比例

n       每獨立IP的pageView數

n       排名演算法

n       Alexa爬蟲做什麼

每百萬工具條訪問比例(sina)

每百萬PV中所佔比例(sina)

每獨立IP的pageView數(sina)

n       **Yesterday  1 wk. Avg.  3 mos. Avg. **10.1            9.9                   9.9

Alexa爬蟲做什麼

n       蒐集網站和網頁, 放到wayback machine庫中

n       不統計Reach和PV

Reach     (user數)

黑色為百度,綠色為QQ,藍 色為sina,軍綠為163, 深紅為sohu

Traffic Rank 流量:

黑色為百度,綠色為QQ,藍 色為sina,軍綠為163, 深紅為sohu

Daily Pageviews

黑色為百度,綠色為QQ,藍 色為sina,軍綠為163, 深紅為sohu

大入口網站使用者行為分析

黑色為163,綠色為sohu,藍色為sina,軍綠為百度,深紅為QQ

以周為單位,可以看出baidu,sina,qq等的受眾的不同。2007年4月21日,22日是週末,百度,QQ訪問 量明顯上升。而sina,sohu則明顯下降。163比較平穩。這有可能是因為百度的貼吧等受到年輕學生的歡迎,他們一般週末才能上網。QQ也是一樣,學生和年輕人為主體的使用者群只有週末才能集中上網。而sina,sohu則一般是上班族,在上班時 間上網看新聞。而週末一般都休息。163由於遊戲,新聞等內容,所以應該受眾群兩者兼而有之。

Alexa 工具條

n       Alexa工具條是訪問統計的依據

n       Alexa工具條訪問的網站會被alexa自 動收錄

n       Alexa工具條跟蹤使用者行為

n       Alexa工具條會被反病毒軟體禁止

n       Alexa工具條沒有中文版

Alexa 工具條訛傳

n       Alexa工具條只能裝IE?

IE,Netscape,firefox,mozilla都可以

n       Opera 不可以

n       Alexa工具條只可以安裝於windows?

n       還支援Linux,Mac

Alexa 工具條被掃毒軟體攔截

Alexa 工具條被掃毒軟體攔截,所以很多時候都不能正常工作。下面是norton 反病毒的抓圖。

工具條內容

n       搜尋

n       網站資訊

n       排名

n       連結網站

n       Email頁面

n       檢視頁面歷史

n       彈出視窗攔截

n       Amazon

Alexa 侷限性

Alexa 統計的侷限性:

n       取樣方法的問題

n       統計取樣資料的問題

n       新媒體形式不能統計

n       不同網站型別可比性差

Alexa 取樣方法的問題

n       每百萬裝有工具條者訪問比

n       裝工具條的人具有某些相同特質

n       (文化水平,興趣,職業,語言,瀏覽器,作業系統)

n       https安全網站不統計

n       流量小網站不準確,排名十萬以後的網站不能真實反映流量

統計取樣資料的問題

只以PV和Reach為基準,對於訪問者所耗時間,採用RSS等client和視訊等新技術網站不公平,不能準確反映一個網站的價值。

n       PV

n       Reach(IP,User)

n       (Time?)

n       (Clients?)

n       (new technology?)

新媒體形式不能統計

n       視訊網站

n       P2P網站

n       電子雜誌

n       網路遊戲

n       相簿,圖片

n       IM

n       長跟貼的論壇

不同網站型別可比性差

這就像拿綜合性大學和某些偏文或偏理的大學來一起排名,完全比較其所 擁有的資源,並不一定能得出很好的結果。按照教育部前些年的思路,為了建造“世界性的大學”,就要拼命合併。但合併的結果,並不讓我們的學術水平得到一個 質的提高。綜合門戶肯定瀏覽量大,什麼都有。但某些頻道並不具有某些專業網站和地方網站一樣的價值。

n       綜合門戶和垂直門戶

n       門戶和專業網站

相關網站

CIIS–中國網際網路指數系統

中國站長網

CIIS

由方興東搞的一個評價系統,據說和國家統計局合作的。

n       China Internet Index System,縮寫CIIS

n       部落格網方興東

n       網際網路實驗室

n       國家統計局

n       2006年10月上線

n       從原CISI改編, 2004年

CIIS 的 資料

CIIS沒有自己的資料採集系統,其排名主要採用Alexa的資料,所以不要奇怪和Alexa一模一樣。但它對alexa的 資料進行了分類分行業整理,並排名,中國人看起來比較習慣。

n       收錄15000多家中文網站

n       4個一級分類

n       43個二級分類

n       資料來源: alexa ,CNNIC等

n       綜合排行

n       專業排行

n       文學、門戶、汽車企業、電子商務、新聞資訊、IT資訊、財經 、健康

中國站長網

該網站整理了Alexa的 資料,中國人看起來比alexa原始資料還好一些。例如,它給出IP和PV絕對值的估算,就很方便中國人使用。而Alexa並不給出這一直接絕對資料。而是隻給出百分比。Alexa的肯定更科學,而站長網 卻更直觀。它的翻譯有些怪異,例如網站訪問比例,就是alexa的reach數,而頁面訪問比例,就是alexa的PV數,感覺怪怪的。

n       整理alexa資料

n       IP和PV絕對值估算

n       (約3億總活躍IP和約200億PV量)

n       網站訪問比例:reach

n       頁面訪問比例:PV

n       人均頁面瀏覽量

如非註明轉載, 均為原創. 本站遵循知識共享CC協議,轉載請註明來源