SEO網(wǎng)址定律:規(guī)范的網(wǎng)址書寫方式,有利于提高網(wǎng)站主頁權(quán)重。
1、出現(xiàn)不規(guī)范網(wǎng)址的原因
搜索引擎會自動挑選最合適的URL做為一個網(wǎng)站的網(wǎng)址。眾所周知,我們打開IE在地址欄里輸入網(wǎng)址,根據(jù)各人用戶體驗(yàn)的習(xí)慣不同,輸入的方式也不同。這就是會出現(xiàn)不規(guī)范的網(wǎng)址的原因。如:
l
l
l
l
l (較少使用)
以上這五種常見的輸入網(wǎng)址的方式,明眼能看出來其實(shí)是指向同一個頁面:主頁。
從技術(shù)上來說,在計算機(jī)處理時,每一個字符對應(yīng)一個編碼(詳見計算機(jī)科學(xué)導(dǎo)論類書籍);而搜索引擎是把以上網(wǎng)址當(dāng)成不同的地址來看待,雖然最終返回的都是主頁。
現(xiàn)在簡要分析一下以上網(wǎng)址的技術(shù)問題:
有沒有帶www,有什么不同?在DNS中,www是你要解析的主機(jī)名。在做域名解析時,會要你為域名:domain.com填寫一個主機(jī)名,我們一般填:www 。當(dāng)然,也可以填 bbs或者其它的諸如abcde等等。如果填,那么,主機(jī)返回的頁面就不一樣。對搜索引擎來說,這是兩個不同的站點(diǎn),兩個不同的頁面。兩個都要計算PR值。
具例:和在搜索引擎看來就是兩個不同的站點(diǎn)。其中,的PR值為8,而的PR值等于6。但從人為上判斷,這其實(shí)是同一個站點(diǎn)。
另一個問題,帶與不帶index.html,對用戶感覺沒什么區(qū)別。但對蜘蛛說就感到比較暈:哪一個才是主頁?蜘蛛到底該返回哪個頁面?這種方法對蜘蛛不友好。
https是加密網(wǎng)址,可以理解為http的安全版,端口:443,采用SSL協(xié)議,詳見《TCP/IP協(xié)議》有關(guān)書籍。如果和http同時存在也會被認(rèn)為是不同的頁面,搜索引擎會分別計算,從而降低了頁面的權(quán)重。如:的PR值等于6,而的PR值為:n/a。
以上的不同的域名寫法,造成的PR值的不同
所以,一個網(wǎng)址在推廣時,網(wǎng)址的規(guī)范寫法很重要。這直接影響到域名的權(quán)重。而不帶www的域名,對搜索引擎很不友好。畢竟蜘蛛是程序,在不規(guī)范的網(wǎng)址中要挑一個出來做為規(guī)范的網(wǎng)址,不僅浪費(fèi)主頁的權(quán)重,而且還浪費(fèi)蜘蛛的時間和網(wǎng)絡(luò)帶寬。要知道,蜘蛛一生氣,后果很嚴(yán)重。
2、避免不規(guī)范網(wǎng)址降低網(wǎng)站首頁權(quán)重
據(jù)估計,現(xiàn)在網(wǎng)絡(luò)上的網(wǎng)址,不規(guī)范的寫法近30%。在浪費(fèi)資源,浪費(fèi)帶寬的同時,有可能搜索引擎選出的規(guī)范網(wǎng)址并不是站長想要的。對站長來說,多個不規(guī)范的URL鏈接的存在不但不利于排名,更是分散了主頁的權(quán)重。不規(guī)范的影響了網(wǎng)站的收錄不是好事,必須避免。
避免不規(guī)范網(wǎng)址,不管是新站還是老站,都是要長期跟進(jìn)的一項工作。要有恒心才能見到效果。新站從一開始就注意到這點(diǎn)的話,一兩年后,效果還是很明顯的。具體如下:
l 新站在發(fā)展友鏈時,盡可能地要求對方規(guī)范書寫網(wǎng)址,統(tǒng)一寫法。而老站,應(yīng)盡可能地修復(fù)不規(guī)范的友鏈。
l 內(nèi)鏈中,首先自已要規(guī)范書寫網(wǎng)址,文章發(fā)布時,也要規(guī)范書寫網(wǎng)址。
l 谷歌管理工具中,將不帶3w的網(wǎng)址以及其它不規(guī)范的寫法定向?yàn)閹?w的規(guī)范網(wǎng)址。
l 使用canonical標(biāo)簽。下節(jié)討論。
l 制作sitemap文件,在sitemap文件里全部使用規(guī)范網(wǎng)址,以利蜘蛛爬行。
l 一些CMS中添加了許多文章,里面如有大量內(nèi)鏈不規(guī)范,可在robots文件中禁止蜘蛛爬行,在修復(fù)后,再允許蜘蛛爬行。
l 無論網(wǎng)站是否有靜態(tài)化的功能,在開發(fā)和對系統(tǒng)設(shè)置時要做到系統(tǒng)只產(chǎn)生規(guī)范網(wǎng)址。
l 設(shè)置.htaccess文件,用301重定向把其他URL重定向到規(guī)范網(wǎng)址。
以上提到的方法可混合使用,具體情況靈活處理。網(wǎng)址規(guī)范化是讓站長和蜘蛛非常困擾的一個課題。需要站長長期堅持才能見效。
3、canonical標(biāo)簽與301重定向
在2009年,Google,雅虎,微軟共同發(fā)布了一個新的標(biāo)簽:canonical tag,用于解決網(wǎng)址規(guī)范化問題。canonical標(biāo)簽有什么用?
1. 網(wǎng)址規(guī)范。
2. 傳遞、繼承頁面權(quán)重。
3. 重復(fù)頁面精確重定向,利于蜘蛛收錄。
注意,canonical標(biāo)簽只對同一域名下的網(wǎng)址有效,如果跨站,建議用301重定向。這就是canonical標(biāo)簽與301重定向的區(qū)別所在。
如下面所示網(wǎng)址的頁面是相同的
那么我們可以在head meta部分加入如下代碼:
這樣是告訴搜索引擎:后兩個頁面的內(nèi)容是重復(fù)內(nèi)容,是同一個頁面,就是告知搜索引擎把相關(guān)的搜索信號都傳遞到第一個網(wǎng)址。
這樣一樣所有含有這個標(biāo)簽的網(wǎng)頁,不管它的URL是什么,搜索引擎最終都會只收錄 canonical標(biāo)簽指定的那個頁面,所有的權(quán)重也會在指定的這個頁面上繼承。這樣,所有原本分散的權(quán)重都會集中傳遞在指定的這個頁面上。
另外,使用canonical標(biāo)簽要注意以下幾點(diǎn):
1. 這個標(biāo)簽只是對搜索引擎起到參考和建議的作用,并不是像robots文件那樣是個命令,就算是做了canonical標(biāo)簽,也不百分百保證是搜索引擎認(rèn)可的規(guī)范網(wǎng)址,搜索引擎會智能地綜合參考其他的因素進(jìn)行判斷。
2. 在canonical標(biāo)簽中,最好使用絕對地址,雖然可以使用相對地址。
3. 針對國內(nèi)用戶的網(wǎng)站特別注意,百度不支持這個標(biāo)簽。
4. canonical標(biāo)簽指定的網(wǎng)址可以是不存在的頁面內(nèi)容,如404頁面。如果閑得沒事干的話可以這么做。
5. 建議canonical標(biāo)簽在同一域名下使用。是否跨站,爭議太大。
什么是301轉(zhuǎn)向?301轉(zhuǎn)向也叫301網(wǎng)址重定向,是用戶或者搜索引擎在向服務(wù)器發(fā)出請求指令時,服務(wù)器返回HTTP頭的一個信息(一個代碼,如:301、404等),用來告訴用戶或蜘蛛:原來的網(wǎng)址現(xiàn)在不用了,永遠(yuǎn)轉(zhuǎn)向新啟用的新網(wǎng)址。
301轉(zhuǎn)向,能使新域名繼承老域名的權(quán)重。
cmfu是起點(diǎn)的老域名,而qidian是新域名。
老域名cmfu.com用301轉(zhuǎn)向新域名,權(quán)重也轉(zhuǎn)向新域名。而老域名則被永遠(yuǎn)認(rèn)為被轉(zhuǎn)到qidian.com這個新域名上了。
做301域名轉(zhuǎn)向,可以用.htaccess文件,JS代碼(如國內(nèi)某知名電信服務(wù)運(yùn)營商,大家可以查看其JS代碼),ASP代碼、PHP代碼。
現(xiàn)具例如下:
Redirect 301 /path/from/ file.html
上面的代碼加到.htaccess文件中,主要是告訴搜索引擎,以后所有到/path/from/ file.html的請求,都轉(zhuǎn)到上。301狀態(tài)碼,就是告訴蜘蛛,原來的頁面被永遠(yuǎn)轉(zhuǎn)走了。
前面我們提到,將所有不規(guī)范的不帶3w的網(wǎng)址轉(zhuǎn)到規(guī)范的網(wǎng)址上。這時就要打開.htaccess文件進(jìn)行修改。我們打開一個網(wǎng)站的.htaccess文件,中文是我添加的注釋:
##
##如果要使用復(fù)定向模塊,這個選項必須是On
# if you want to use mod_rewrite, set this 'On'
RewriteEngine On
# the path to your site installation
RewriteBase /
# Maintenance Section - Uncomment the lines below according to your need
# Write below your client IP address (e.g.: 127.0.0.1)
# if you need to keep your web access during maintenance
#RewriteCond %{REMOTE_ADDR} !^127.0.0.1$
# Choose your way of closing the access to PMF:
# a. you can simply forbid access (HTTP 403 Error)
#RewriteRule ^(.*)$ underMaintenance.htm [F,L]
# b. return the user an explanation
#RewriteRule ^(.*)$ underMaintenance.htm [L]
##將所有不帶3w的網(wǎng)址,轉(zhuǎn)為帶3w的規(guī)范網(wǎng)址。重定向代碼須要寫在所有的代碼前面。
# url canonicalization
RewriteCond %{http_host} ^abcde.com [NC]
RewriteRule ^(.*)$ [L,R=301]
##404錯誤頁面
# 404 page
ErrorDocument 404 /404.html
使用301注意一點(diǎn):HTML靜態(tài)頁面不支持。接下來看看在PHP中如何做301重定向代碼:
Header(“HTTP/1.1 301 Moved Permanently”);
Header(“Location:;);
將上面的兩行代碼加到PHP代碼中即可。
301重定向,還有以下用途:
l 多個域名如.cn,.net,.org,.cc等全部轉(zhuǎn)向主域名.com。
l Domaina123b123c123d123e123.com可以轉(zhuǎn)來短域名:doabcde.com
l 網(wǎng)站改版、URL命名系統(tǒng)改變。
l 動態(tài)化的URL轉(zhuǎn)靜態(tài)化的URL。
以上介紹了不規(guī)范網(wǎng)址產(chǎn)生的原因、處理方法,隨著搜索引擎算法的更變,SEO的方法也不斷更新。不擔(dān)保所做的操作百分百有效。本文僅供SEO技術(shù)上交流使用。作者碼字截圖很辛苦,轉(zhuǎn)載請保留作者及鏈接,萬分謝意!
SEO專題推薦:
關(guān)鍵詞優(yōu)化專題:網(wǎng)站關(guān)鍵詞優(yōu)化沒效果?來這里學(xué)習(xí)最實(shí)用的關(guān)鍵詞優(yōu)化技巧!
內(nèi)鏈優(yōu)化專題:最能提升網(wǎng)站權(quán)重的內(nèi)鏈部署優(yōu)化技巧與方法
外鏈建設(shè)專題:高質(zhì)量自然外鏈怎么做?讀完這些你將質(zhì)的飛躍
網(wǎng)站降權(quán)專題:2015年最有用的網(wǎng)站降權(quán)、被K、被黑、被攻擊的解決方法
用戶體驗(yàn)專題:學(xué)習(xí)完這些,作為站長的你可以秒懂如何做網(wǎng)站用戶體驗(yàn)
行業(yè)網(wǎng)站專題:優(yōu)化行業(yè)網(wǎng)站的“葵花寶典”看完后無優(yōu)化壓力
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!