監(jiān)理公司管理系統(tǒng) | 工程企業(yè)管理系統(tǒng) | OA系統(tǒng) | ERP系統(tǒng) | 造價(jià)咨詢管理系統(tǒng) | 工程設(shè)計(jì)管理系統(tǒng) | 甲方項(xiàng)目管理系統(tǒng) | 簽約案例 | 客戶案例 | 在線試用
X 關(guān)閉
張家界網(wǎng)站建設(shè)公司

當(dāng)前位置:工程項(xiàng)目OA系統(tǒng) > 泛普各地 > 湖南OA系統(tǒng) > 張家界OA > 張家界網(wǎng)站建設(shè)公司

PR算法的猜想:基于數(shù)量假設(shè)和質(zhì)量假設(shè)的猜想

申請(qǐng)免費(fèi)試用、咨詢電話:400-8352-114

所有的算法都會(huì)有個(gè)假設(shè)前提,所有假設(shè)都是基于用戶行為的分析。而算法就是把這些分析公式化。

PR算法主要基于數(shù)量假設(shè)和質(zhì)量假設(shè)兩個(gè)方面考慮的。

數(shù)量假設(shè):該頁(yè)面收到越多的入鏈(其他網(wǎng)頁(yè)對(duì)該頁(yè)面的鏈接稱為入鏈),則表示該網(wǎng)頁(yè)越重要。也就是一個(gè)好的頁(yè)面肯定會(huì)獲得很多其他頁(yè)面的推薦。

質(zhì)量假設(shè):指向該頁(yè)面的入鏈的質(zhì)量不同,質(zhì)量高的網(wǎng)頁(yè)會(huì)通過鏈接傳遞更多的權(quán)重,越是質(zhì)量高的網(wǎng)頁(yè)指向該頁(yè)面,則表示該頁(yè)面越重要。也就是一個(gè)好的網(wǎng)頁(yè)肯定也會(huì)獲得其他好的網(wǎng)頁(yè)的認(rèn)同。

通過以上兩個(gè)假設(shè),PR算法剛開始會(huì)挑選一批網(wǎng)頁(yè)作為種子網(wǎng)頁(yè)并賦予較高的PR,通過迭代遞歸算法計(jì)算來更新每個(gè)頁(yè)面節(jié)點(diǎn)的PR得分,直到得分穩(wěn)定為止,即為當(dāng)前頁(yè)面PR得分。

PR計(jì)算出來的結(jié)果是對(duì)網(wǎng)頁(yè)重要性的評(píng)估,作為網(wǎng)頁(yè)排名其中的一個(gè)因素。但PR是一個(gè)全局性的算法,和具體查詢無關(guān),即和相關(guān)性無關(guān)的。PR高不能說明該網(wǎng)頁(yè)相關(guān)。假如搜索引擎只用PR這一算法進(jìn)行排序的話,那無論你輸入任何的查詢?cè)~,輸出的結(jié)果都是一樣的,誰PR高就誰排前面。

過度追求PR的結(jié)果往往得不償失,PR重要嗎?PR不重要嗎?看果園去!

對(duì)于PR來說,一個(gè)高不是高,大家高才是真的高!

PR的計(jì)算很簡(jiǎn)單,假如A網(wǎng)頁(yè)有兩個(gè)出鏈分別連接到B網(wǎng)頁(yè)和C網(wǎng)頁(yè)。假如A網(wǎng)頁(yè)的PR值是1,那么以概率平均分配的原則,B和C網(wǎng)頁(yè)都會(huì)平均得到0.5值的傳遞。這種計(jì)算方法是建立在隨機(jī)游走模型上的,隨機(jī)游走模型是指假設(shè)這個(gè)網(wǎng)頁(yè)有三個(gè)出鏈,用戶點(diǎn)擊每個(gè)出鏈的概率是一樣的,所以傳遞的PR值也是一樣的。

由于網(wǎng)頁(yè)之間是互相連接的,所以PR不能一直循環(huán)傳遞下去,否則最后所有網(wǎng)頁(yè)的PR值都會(huì)無窮大。所以PR算法引入了衰減因子的概念,即是中轉(zhuǎn)的次數(shù)越多離種子網(wǎng)頁(yè)越遠(yuǎn),傳遞的PR值越少,直到傳遞值為0得分穩(wěn)定為止。才計(jì)算最后PR得分,加入排序結(jié)果的計(jì)算中。

另外,有些網(wǎng)頁(yè)只有入鏈沒有出鏈,那么會(huì)導(dǎo)致積蓄的PR值越來越高,而不能傳遞出去。這樣會(huì)違背PR的設(shè)計(jì)初衷,影響公平性。這種結(jié)構(gòu)被稱為鏈接陷阱。

遠(yuǎn)程跳轉(zhuǎn)是解決鏈接陷阱的通用方式,就是PR的傳遞并不局限于出鏈的傳遞,也可以以一定的概率向任意一個(gè)頁(yè)面?zhèn)鬟fPR。

PR算法作為谷歌標(biāo)志性算法,早已普遍運(yùn)用到反作弊當(dāng)中,即以挑選出一批作弊網(wǎng)頁(yè)作為種子網(wǎng)頁(yè)(挑選信任網(wǎng)頁(yè)也亦然),給予一定的作弊分值(或信任分值),跟PR算法一樣進(jìn)行傳遞,設(shè)定一個(gè)懲罰閥值,達(dá)到則為作弊網(wǎng)頁(yè)。

這種反作弊是基于假設(shè):

一、如果一個(gè)網(wǎng)頁(yè)將其鏈接指向作弊網(wǎng)頁(yè),則這個(gè)網(wǎng)頁(yè)很可能也是作弊網(wǎng)頁(yè)。

二、如果一個(gè)網(wǎng)頁(yè)被作弊網(wǎng)頁(yè)指向,則不能說明這個(gè)網(wǎng)頁(yè)是作弊的。

當(dāng)然這只是最原始的反作弊思路。研究搜索引擎算法不應(yīng)該只盯著公式看,要看這個(gè)算法解決了什么問題,是基于什么樣的假設(shè),這種假設(shè)是不是符合用戶行為。了解了算法的來龍去脈,才能更好的知道搜索引擎解決問題的方法。這樣才是學(xué)習(xí)SEO的王道!

了解規(guī)則是為了更好的運(yùn)用規(guī)則,避免違反規(guī)則受到懲罰。

作為一個(gè)文科生,我給大家最后的忠告是:珍惜生命,遠(yuǎn)離公式?。?!

發(fā)布:2007-03-31 14:21    編輯:泛普軟件 · xiaona    [打印此頁(yè)]    [關(guān)閉]
相關(guān)欄目:
相關(guān)文章:
張家界OA
聯(lián)系方式

成都公司:成都市成華區(qū)建設(shè)南路160號(hào)1層9號(hào)

重慶公司:重慶市江北區(qū)紅旗河溝華創(chuàng)商務(wù)大廈18樓

咨詢:400-8352-114

加微信,免費(fèi)獲取試用系統(tǒng)

QQ在線咨詢

泛普張家界網(wǎng)站建設(shè)公司其他應(yīng)用

張家界軟件開發(fā)公司 張家界門禁系統(tǒng) 張家界物業(yè)管理軟件 張家界倉(cāng)庫(kù)管理軟件 張家界餐飲管理軟件 張家界網(wǎng)站建設(shè)公司