PageRank 演算法隨記
遞迴的意思是:假如現在要求C,指向C的入鏈只有B,那麼得先求B的重要度,B重要度的大小取決於指向B的入鏈以及這些入鏈的重要度。


“隨機”的解釋:從i這個頁面開始,它可能有di種選擇,而且他做每一種選擇的時候,選擇的概率是相同的,即他決定到下一個頁面是一個隨機的選擇(應該跳到那個頁面),我們把上面圖中的矩陣叫隨機鄰接矩陣。
矩陣方程

Σri=1在這裡表示限定條件,和流方程一樣,不加限定條件會有無窮多個解。所以這裡的限定條件是假定所有網頁的重要度求和等於1。

矩陣的行和r向量相乘的時候就是對流公式的表示。
矩陣方程例項

冪迭代方法

兩個向量的1範數,其實是對應位置的差值絕對值之和。
r向量是所有網頁的重要程度組成的向量。
冪迭代求解

總共是3個節點,初始化每個節點的重要度分別是1/3。
r=r'的意思是,最後求得r'的值趨於穩定,不再變化。
隨機遊動的解釋

如果有很多頁面指向頁面j的話,那麼它的重要度是很高的。
平穩分佈

存在性和唯一性

在節點少的圖中,如果新增一個節點的話,整個圖是需要重新算的。但是在億級節點的話,多一個節點少一個節點,對圖的影響不一定大。像百度和谷歌就不會頻繁的去計算。
按照流公式迭代不一定會收斂到我們想要的結果。
收不收斂?

a,b節點圖,如果用1,0去初始化的話,會發現他們一直再對調。
ABCD圖,所有的權重最後都歸到了C這一個點。

隨著矩陣運算的迭代,拿到的ABCD四個值都會非常非常趨於零。
PageRank問題


m這個點就是個陷阱問題,最終所有的權重都被吸到m這個點上。

終結者問題,最後的迭代結果是零零零,m這個點沒有任何出鏈。
解決辦法:隨機傳送

e代表全部的網頁,就是說瀏覽者會隨機的在全部網頁中開啟一個。
pagerank是一個針對圖的演算法,有名是因為,最早的時候谷歌用它做了一個所謂比較公正的網路排序,但後來人們對他做了各種優化,爭取通過他的規則,把自己的網頁提高比較靠前的位置,也通過優化來使結果更加的穩定。
pagerank可以幫你在有關聯的圖中找到最重要的節點。