百度搜索引擎為了整頓互聯(lián)網(wǎng)的信息內(nèi)容,大尺度推出“百度原創(chuàng)星火計(jì)劃”,為了此計(jì)劃能高力度執(zhí)行,建立了相應(yīng)的專題頁,更是邀請高質(zhì)量的站點(diǎn)加入星火計(jì)劃。我們現(xiàn)在面對(duì)的正是一個(gè)充斥著“重復(fù)內(nèi)容”、“大量垃圾內(nèi)容”的時(shí)代,星火計(jì)劃中搜索引擎又是如何識(shí)別重復(fù)內(nèi)容的?
搜索引擎為給用戶提供高質(zhì)量的內(nèi)容,在用戶搜索相關(guān)內(nèi)容時(shí),會(huì)通過一些過濾機(jī)制過濾掉重復(fù)的內(nèi)容,而不是展示出大量重復(fù)相同的結(jié)果,如果網(wǎng)站存在大量重復(fù)內(nèi)容,在搜索引擎過濾過程中可能會(huì)給網(wǎng)站帶來影響。
搜索引擎來站點(diǎn)抓取內(nèi)容之前,已經(jīng)有爬行頁面預(yù)計(jì),如果網(wǎng)站存在大量的重復(fù)頁面,蜘蛛會(huì)對(duì)這些頁面進(jìn)行一一檢索,雖然在返回的結(jié)果被過濾,但是卻浪費(fèi)了蜘蛛對(duì)站點(diǎn)頁面抓取的預(yù)算,減少了蜘蛛抓取其他高質(zhì)量頁面的機(jī)會(huì),重復(fù)頁面一樣的也會(huì)分散網(wǎng)站的整體權(quán)重,這樣并導(dǎo)致蜘蛛中能獲取到的有意義的頁面減少。
站長無法判斷搜索蜘蛛會(huì)抓取重復(fù)頁面中那個(gè)版本,搜索引擎自己也無法清除說明,用戶不同的搜索,蜘蛛返回的頁面可能是不同的,存在的重復(fù)頁面可能也有不同的偏向,用戶搜索時(shí)返回的頁面是否是你最喜歡返回的頁面,是否能給你帶來最高的流量轉(zhuǎn)化率?這些都是不得而知的,要想減少重復(fù)頁面的權(quán)重分散,可以在robots文件中屏蔽收錄,或者添加canonical標(biāo)簽轉(zhuǎn)移權(quán)重。
像上面分析到的情況,重復(fù)內(nèi)容會(huì)影響蜘蛛的抓取。同時(shí),搜素引擎為了互聯(lián)網(wǎng)生態(tài)公平健康發(fā)展及優(yōu)質(zhì)原創(chuàng)網(wǎng)站的集體利益,減少原創(chuàng)價(jià)值被采集站所得,會(huì)對(duì)重復(fù)、裝載、垃圾信息站點(diǎn)進(jìn)行懲罰。搜素引擎提出這樣的申明,它又是怎么去識(shí)別重復(fù)內(nèi)容的呢?
重復(fù)內(nèi)容可以發(fā)生在不同的站點(diǎn),也可以發(fā)生在同一個(gè)網(wǎng)站上,非優(yōu)化的SEO優(yōu)化CMS系統(tǒng),導(dǎo)致網(wǎng)站存在多個(gè)URL地址可訪問同一個(gè)頁面,這樣的情況也是重復(fù)內(nèi)容,蜘蛛遇到這樣的情況時(shí)會(huì)判斷哪個(gè)頁面才是重要的頁面,會(huì)先從robots文件中檢測,是否有禁止抓取的地址,如果有則停止對(duì)重復(fù)頁面地址的抓取,如果沒有就會(huì)繼續(xù)抓取內(nèi)容,在抓取時(shí)于遇到meta標(biāo)簽,注明noindex這些頁面并不是為蜘蛛準(zhǔn)備的,這種情況蜘蛛也同樣不會(huì)繼續(xù)抓取重復(fù),減少蜘蛛的抓取難度,即使是重復(fù)的內(nèi)容,蜘蛛也只會(huì)抓取有價(jià)值的那個(gè)版本。
百度的星火計(jì)劃邀請站長參與原創(chuàng)站點(diǎn),如果您的網(wǎng)站是本網(wǎng)站首創(chuàng),非抄襲模仿的、內(nèi)容和形式都具有獨(dú)特個(gè)性的資源;且具有社會(huì)共識(shí)價(jià)值的資源,符合國家相關(guān)規(guī)定;不在第二次裝載及偽原創(chuàng)之內(nèi);您并可提交您的站點(diǎn)到百度原創(chuàng)星火計(jì)劃站點(diǎn)。這種方法可減少因?yàn)檎军c(diǎn)權(quán)重不高,網(wǎng)站內(nèi)容在被高權(quán)重網(wǎng)站轉(zhuǎn)載后,蜘蛛會(huì)認(rèn)為轉(zhuǎn)載的站點(diǎn)是原創(chuàng)的內(nèi)容,你的站反而是轉(zhuǎn)載采集站點(diǎn)。
搜索引擎到底如何判斷網(wǎng)站內(nèi)容是否原創(chuàng),重復(fù)內(nèi)容頁面中到底哪個(gè)頁面才是原創(chuàng)頁面,這是任何一個(gè)搜索引擎都未曾公布的算法。但婁底人才網(wǎng)()從百度官方的數(shù)據(jù)了解到,具有“原創(chuàng)”標(biāo)簽的網(wǎng)站,原創(chuàng)星火計(jì)劃上線前后的同期流量對(duì)比顯示,原創(chuàng)url流量增長明顯。同時(shí),原創(chuàng)星火計(jì)劃上線后一段時(shí)間內(nèi)原創(chuàng)url流量增長明顯并逐漸趨于平穩(wěn),可見如果網(wǎng)站能加入百度原創(chuàng)計(jì)劃,網(wǎng)站在流量提升方面還是有很大幫助的。
申請創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!