DEDECMS網(wǎng)站防采集的兩種辦法和SEO的策略

Mei0.com提示：復(fù)制站點與DeDecms防采集的方法.

去年年底，某客戶找我?guī)兔χ谱髁艘粋€企業(yè)網(wǎng)站，考慮到網(wǎng)站日后要進行搜索引擎推廣，因此，網(wǎng)站在SEO上必須具備搜索引擎友好性，權(quán)衡左右，最終我選擇了DeDeCMS，這樣可以在URL、PageTitle、TextBlock、LinkBlock、AutoSitemap、RelatedArticle幾方面及早進行SEO布局。于是，在欄目規(guī)劃、布局設(shè)計、模板制作階段，我便將各種SEO元素充分融入整個制作階段，期望站點上線后，搜索排名權(quán)重可以快速積累。特別是在模板代碼撰寫方面，有效的控制鏈接輸出與導(dǎo)入，盡可能提高內(nèi)鏈接的相關(guān)性以及關(guān)鍵詞匹配的位置，并去除了無用的網(wǎng)頁噪音信息，使每類頁面主題都特別突出。

果不其然，網(wǎng)站正式發(fā)布后，網(wǎng)站收錄比例很快達到70%，絕大多數(shù)產(chǎn)品終端頁被收錄，部分資訊頁面被收錄，更重要的是：行業(yè)關(guān)鍵詞排名與產(chǎn)品關(guān)鍵詞排名進步飛速；整個網(wǎng)站在SEO運轉(zhuǎn)中呈良性發(fā)展趨勢?？蛻糸_始接手網(wǎng)站并正常更新站點內(nèi)容，按照設(shè)定的計劃，一切本應(yīng)該順利進展。

然而就在近期，網(wǎng)站SEO表現(xiàn)開始下滑，首當(dāng)其沖的是網(wǎng)頁收錄數(shù)量，在百度統(tǒng)計后臺顯示的頁面索引量與搜索框中site命令返回結(jié)果數(shù)差別明顯，site命令顯示只有2個頁面被收錄，均是首頁，帶www與不帶www的兩個版本的首頁。除此之外，當(dāng)資訊被正常更新后，百度很快索引了，短時間內(nèi)通過site命令可以返回結(jié)果，但時間不長即又發(fā)現(xiàn)收錄失效。綜合上述情況，我認為網(wǎng)站已經(jīng)被百度降權(quán)了。

為了找到問題所在，我研究了各個方面的影響因素，結(jié)果發(fā)現(xiàn)：

（1）除了正常更新網(wǎng)站內(nèi)容外，企業(yè)方也在積極運作外鏈，建設(shè)外鏈本來是好事，但卻用錯了方式，參與了資源站的鏈輪；

（2）網(wǎng)上驚現(xiàn)模板相同、內(nèi)容相同、品牌不同的仿制站，而且仿制站在百度收錄也是只有首頁，與客戶網(wǎng)站“驚人的相似”。

1、關(guān)于鏈輪問題，還好我及時發(fā)現(xiàn)并制止了這種行為，由于只有幾篇產(chǎn)品頁參與了鏈輪，時間不長，應(yīng)該不至于影響如此之大，何況還是自身資源站點。

2、關(guān)于復(fù)制站點，已經(jīng)很少見了，大部分人都會有意識的形成站點內(nèi)容或者組織形式上的差異化；而客戶網(wǎng)站出現(xiàn)這樣的SEO癥狀，恐怕關(guān)鍵就在于仿制站點，當(dāng)在我看到仿制站的一刻我徹底無語了，除了企業(yè)品牌名稱不同，網(wǎng)站其他東西我都太清楚了；我很想吐槽，可回頭一想現(xiàn)在的互聯(lián)網(wǎng)不就流行各處抄襲的風(fēng)氣嗎，也許習(xí)慣了就好，可我TM實在不能忍受的是，模板100%仿制就算了，數(shù)據(jù)原封不動的采集過去也罷了，拜托，你TMD敢不把99%雷同的站點整體發(fā)布出來嗎！你TMD搞SEO不知道相似站點??！你TMD仿站還能把我寫的自動更新網(wǎng)站地圖文件sitemap.php也能仿制過去！做SEO的傷不起啊。

吐槽歸吐槽，問題還是需要解決的，采用了幾下的辦法：

1、調(diào)整模板數(shù)據(jù)調(diào)用規(guī)則與新內(nèi)容塊布置

新內(nèi)容塊產(chǎn)生將頁面主題關(guān)鍵詞更分散一些，同時調(diào)整數(shù)據(jù)調(diào)用規(guī)則，讓仿制站點的數(shù)據(jù)與自身頁面數(shù)據(jù)產(chǎn)生差異性，降低復(fù)制網(wǎng)站SEO問題的負面影響。

2、找到防止內(nèi)容采集的辦法

DeDeCMS自身有防采集混淆字符串的功能，但這種防采集的辦法對SEO很不利，你總不想讓搜索蜘蛛看到網(wǎng)頁中有不少隱藏文本吧，而且這些文本會影響蜘蛛對信息塊主題的判斷，影響關(guān)鍵詞排名，其實，DeDeCMS沒有根本性的防采集的方法，道高一尺魔高一丈啊，只要你的信息通過頁面的方式發(fā)布出來，總能找到采集的方法；綜合網(wǎng)上收集的信息，我采納了兩種辦法，只能放置最初級的采集：

（1）辦法一：復(fù)制網(wǎng)頁正文內(nèi)容時自動添加版權(quán)信息

JavaScript代碼

<scriptlanguage="javascript"type="text/javascript">

<!--

function(){

setTimeout(function(){

vartext=clipboardData.getData("text");

if(text){

texttext=text+"rn（這里是你的文章版權(quán)信息，去掉括號）："+location.href;

clipboardData.setData("text",text);

}

},100)

}

-->

</script>

將以上代碼放置在文章頁模板中正文結(jié)束后面即可。我測試了下該方法，只針對IE瀏覽器有效，而Firefox、遨游、GoogleChrome均無效。

（2）辦法二：使頁面代碼具有唯一性

一般別人采集的時候都是要獲取內(nèi)容開始的代碼和結(jié)束的代碼，而且要唯一性的，所以填的開始代碼大多是：<divclass="title">。這樣，我們在這個class后面加上文章的ID值，改成這樣<divclass="title"id="{dede:field.id/}">，這里{dede:field.id/}在dedecms中是獲取當(dāng)前文章的ID值，那么生成的每一篇文章的ID值都不一樣，這里的開始代碼也就都不一樣了，這樣別人就采集不到了，采一次只能采一篇。

我們制作模板的時候在在body標(biāo)記附近的<divclass="abc">修改成<divclass="{dede:field.id/}abc">，注意是空格+{dede:field.id/}，這樣div的class還是沒有變，但產(chǎn)生了<divclass="abc文檔ID">，這段代碼在每篇文章的內(nèi)文頁均是唯一性的，或者在html標(biāo)記里插入id={dede:field.id/}，比如：<divid={dede:field.id/}>與<bodyid={dede:field.id/}>，這里{dede:field.id/}在dedecms中是獲取當(dāng)前文章的ID值，這樣別人就采集不到了，采一次只能采一篇。當(dāng)然，別人可以使用過濾規(guī)則來去掉，但是假如我在所有的class里插入文檔ID，或者插入id=文檔ID這樣的。那他就只能采集整個頁面，然后再過濾，使采集變得更加復(fù)雜。

缺點：如果插入{dede:field.id/}不夠多的話別人可以用過濾規(guī)則過濾掉。但是對于一些站群采集軟件來說，這一招足以防止他們采集了！

3、升級DeDeCMS至最新版

DeDeCMS舊版有漏洞，很容易被黑，要么就是嵌入各種廣告代碼，要么就是被無端增加超級多的隱藏鏈接，所以，務(wù)必要升級到最新版。

發(fā)布：2007-03-31 14:12 編輯：泛普軟件 · xiaona [打印此頁] [關(guān)閉]

相關(guān)欄目：

相關(guān)文章：

上一篇：開啟社會化營銷篇章:建立2012年社會化媒體策略

下一篇：社交游戲廣告模式:四種游戲內(nèi)廣告功能

DEDECMS網(wǎng)站防采集的兩種辦法和SEO的策略

泛普株洲網(wǎng)站建設(shè)公司其他應(yīng)用