復(fù)制內(nèi)容也可以稱為重復(fù)內(nèi)容。復(fù)制內(nèi)容指的是兩個或多個URL內(nèi)容相同,或非常相似。復(fù)制內(nèi)容既可能發(fā)生在同一個網(wǎng)站內(nèi),也可能發(fā)生在不同網(wǎng)站上。
1、產(chǎn)生復(fù)制內(nèi)容的原因
下面這些原因可能造成復(fù)制內(nèi)容。曾慶平SEO前面討論的網(wǎng)址規(guī)范化問題會產(chǎn)生復(fù)制內(nèi)容。
代理商和零售商從產(chǎn)品生產(chǎn)商那里轉(zhuǎn)載產(chǎn)品信息。這倒沒什么不對,一般生產(chǎn)商也都同意,沒有版權(quán)問題。但是絕大部分代理商、零售商、批發(fā)商都是直接copy而不做任何改動,大家用的都是一模一樣的產(chǎn)品說明,所以這些電子商務(wù)網(wǎng)站上充斥著大量復(fù)制內(nèi)容。
打印版本。很多網(wǎng)站除了正常供瀏覽的頁面外,還提供更適于打印的頁面版本,如果沒有用適當(dāng)方式禁止抓取,這些打印版本網(wǎng)頁就會變成復(fù)制內(nèi)容。
網(wǎng)站結(jié)構(gòu)造成的各種頁面版本。如產(chǎn)品列表按價格、評論、上架時間等排序頁面,博客的分類存檔、時間存檔等。
網(wǎng)頁內(nèi)容由RSS生成。有很多網(wǎng)站,尤其是新聞類網(wǎng)站,用其他網(wǎng)站的 RSS feed 生成網(wǎng)站內(nèi)容,這些內(nèi)容在原始出處和很多其他類似網(wǎng)站上都已經(jīng)出現(xiàn)過很多次了。
使用Session ID。搜索引擎蜘蛛在不同時間訪問網(wǎng)頁的時候,被給予了不同的Session ID,實際上網(wǎng)頁內(nèi)容是一樣的。由于Session 1D參數(shù)不同,就被當(dāng)成了不同的網(wǎng)頁。
網(wǎng)頁實質(zhì)內(nèi)容太少。每個網(wǎng)頁上都不可避免地有通用部分,比如:導(dǎo)航條、版權(quán)聲明、廣告等。如果網(wǎng)頁的正文部分太短,內(nèi)容數(shù)量還抵不上通用部分,就有可能被認(rèn)為是復(fù)制內(nèi)容頁面。
轉(zhuǎn)載及抄襲。有時是其他人抄襲了你的網(wǎng)站內(nèi)容,有時是善意的轉(zhuǎn)載,有時是作者自己在不同網(wǎng)站發(fā)布文章,這些都會造成復(fù)制內(nèi)容。
鏡象網(wǎng)站。鏡象網(wǎng)站曾經(jīng)很流行,當(dāng)一個網(wǎng)站太忙太慢的時候,用戶可以通過替代鏡象來看內(nèi)容或下載,這也有造成復(fù)制內(nèi)容的風(fēng)險。
產(chǎn)品或服務(wù)類型之間的區(qū)別比較小。比如有的網(wǎng)站把自己的服務(wù)按地區(qū)進(jìn)行分類,但實際上提供給每個地區(qū)的產(chǎn)品或服務(wù)都是一樣的。這些按地區(qū)分類的頁面只是把地名改了改,其他服務(wù)內(nèi)容說明全都一樣。 URL任意加字符還是返回200狀態(tài)碼。有的網(wǎng)站由于技術(shù)原因,用戶在URL后加上任意字符或參數(shù),服務(wù)器還能正常返回200狀態(tài)碼,并返回沒加上任意字符時一樣的重復(fù)內(nèi)容頁面。
檢查頁面是否有復(fù)制版本相對簡單。拿出頁面正文中的一句話,加上雙引號,在搜索引擎中搜索一下,從結(jié)果中就能看到是否有多個頁面包含這句話。一般來說,隨機挑選的一個句子,完整出現(xiàn)在另一篇無關(guān)文章中的可能性很低。
2、復(fù)制內(nèi)容的害處
很多SEO對復(fù)制內(nèi)容有個誤解,認(rèn)為網(wǎng)站上有復(fù)制內(nèi)容,搜索引擎就會懲罰。其實搜索引擎并不會因為網(wǎng)站有少量復(fù)制內(nèi)容而懲罰或降權(quán)。搜索引擎做的只是從多個頁面中盡量挑選出真正的原創(chuàng)版本給予應(yīng)有的排名,其他復(fù)制版本不在搜索結(jié)果中返回或排在比較靠后的位置。
不過既然交給搜索引擎去判斷,就有可能判斷失誤,把本來是原創(chuàng)的頁面當(dāng)做轉(zhuǎn)載或抄襲的復(fù)制內(nèi)容,因而排名不好。這對原創(chuàng)頁面來說確實就像是懲罰,不過不是因為復(fù)制內(nèi)容本身,而是因為搜索引擎判斷原創(chuàng)失敗。
同站出現(xiàn)復(fù)制內(nèi)容看似沒有那么嚴(yán)重,不管搜索引擎判斷哪個版本是原創(chuàng),都是自己網(wǎng)站上的頁面。問題是,搜索引擎認(rèn)為的最合適的URL與SEO站長自己認(rèn)為的最合適的URL有可能不一樣,SEO站長優(yōu)化和做鏈接時把精力放在頁面A,搜索引擎卻認(rèn)為頁面B最好(A與B內(nèi)容一樣),SEO站長花在頁面A上的精力就浪費了很多。
同一個網(wǎng)站內(nèi)的復(fù)制內(nèi)容會分散權(quán)重。既然頁面在網(wǎng)站上出現(xiàn),就必然有鏈接連向這些頁面。如果一篇獨特內(nèi)容只出現(xiàn)在一個網(wǎng)址,網(wǎng)站上的鏈接就能集中到這一個網(wǎng)址,使其排名能力提高。鏈接分散到多個網(wǎng)址,會使得每一個網(wǎng)址排名能力都不突出。外部鏈接也同樣,很可能分散到不同URL。
同站復(fù)制也造成收錄過多沒有意義的頁面,在域名權(quán)重不高的情況下,可能擠占了其他獨特內(nèi)容的收錄機會。如果網(wǎng)站上存在大量復(fù)制內(nèi)容,可能使搜索引擎對網(wǎng)站質(zhì)量產(chǎn)生懷疑,導(dǎo)致被懲罰。
3、消除復(fù)制內(nèi)容
網(wǎng)址規(guī)范化問題造成的復(fù)制內(nèi)容,前面已經(jīng)討論過。最好的解決辦法是,確保一篇文章只對應(yīng)一個URL,不要出現(xiàn)多個版本,網(wǎng)站所有內(nèi)部鏈接統(tǒng)一連到這個URL。某些時候需要使用301重定向。
不是由于網(wǎng)址規(guī)范化造成的同站內(nèi)復(fù)制內(nèi)容,解決的最好方法是選取一個版本允許收錄,其他版本禁止搜索引擎抓取或收錄。
既可以使用robots文件禁止抓取,也可以使用noindex meta robots 標(biāo)簽禁止索引。連向不希望收錄的復(fù)制內(nèi)容的鏈接使用nofollow標(biāo)簽,JavaScript等阻止蜘蛛爬行。
另一個解決復(fù)制內(nèi)容的方法是使用 canonical 標(biāo)簽。canonical 標(biāo)簽既可以應(yīng)用在網(wǎng)址規(guī)范化引起的復(fù)制內(nèi)容上,也可以用在其他情況下。
比如網(wǎng)站上同一個款式的鞋子可能分為不同型號,型號之間唯一的區(qū)別只是顏色。這些型號生成多個網(wǎng)址,產(chǎn)品說明也幾乎完全一樣,只是說明顏色的地方不一樣。
這時就可以使用canonical 標(biāo)簽,用戶不會被轉(zhuǎn)向,還是看到不同頁面,但搜索引擎會把權(quán)重集中到其中一個型號上,從而避免復(fù)制內(nèi)容。
帶有Session ID 的頁面也可以使用canonical 標(biāo)簽,比如頁面:http://www.yongfengseo.com/page-a.html 放上代碼:
這樣,后面無論生成什么 Session ID:
http://www.yongfengseo.com/page-a.html?sessionid=123456
http://www.yongfengseo.com/page-a.html?sessionid=456789
上面的URL都會被搜索引擎把權(quán)重集中到:http://www.yongfengseo.com/page-a.html
不同網(wǎng)站之間復(fù)制內(nèi)容解決起來就比較麻煩,因為其他網(wǎng)站上的內(nèi)容是無法控制的。能夠做的只有兩點。一是在頁面中加入版權(quán)聲明,要求轉(zhuǎn)載的網(wǎng)站保留版權(quán)聲明及指向原出處的鏈接。
有些聚合網(wǎng)站會抓取feed自動生成內(nèi)容,所以在feed中也要加入版權(quán)聲明和鏈接。
一般來說,原創(chuàng)版本的外部鏈接會比轉(zhuǎn)載多一些,就算在中文互聯(lián)網(wǎng)這個對版權(quán)極不重視的環(huán)境下,也還會有一些站長轉(zhuǎn)載時保留原出處鏈接。對搜索引擎來說,指向原出處的鏈接是判斷原創(chuàng)的最重要信號。
另一點就是堅持原創(chuàng),假以時日必定能夠增加網(wǎng)站權(quán)重,使網(wǎng)站上內(nèi)容被判斷為原創(chuàng)的機會增加。如果有其他網(wǎng)站大量抄襲,造成原創(chuàng)內(nèi)容不能獲得排名,也可以考慮聯(lián)系對方,要求加上版權(quán)鏈接或刪除抄襲內(nèi)容,或者向?qū)Ψ街鳈C、域名提供商投訴,向搜索引擎投訴等。
本文來自微信公眾號:平哥SEO優(yōu)化(qingpingseo)
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!