當(dāng)前位置:首頁 >  站長 >  搜索優(yōu)化 >  正文

百度原創(chuàng)星火計(jì)劃 搜索引擎如何識(shí)別重復(fù)內(nèi)容

 2013-07-09 15:33  來源: 婁底人才網(wǎng)   我來投稿 撤稿糾錯(cuò)

  域名預(yù)訂/競價(jià),好“米”不錯(cuò)過

百度搜索引擎為了整頓互聯(lián)網(wǎng)的信息內(nèi)容,大尺度推出“百度原創(chuàng)星火計(jì)劃”,為了此計(jì)劃能高力度執(zhí)行,建立了相應(yīng)的專題頁,更是邀請高質(zhì)量的站點(diǎn)加入星火計(jì)劃。我們現(xiàn)在面對(duì)的正是一個(gè)充斥著“重復(fù)內(nèi)容”、“大量垃圾內(nèi)容”的時(shí)代,星火計(jì)劃中搜索引擎又是如何識(shí)別重復(fù)內(nèi)容的?

搜索引擎為給用戶提供高質(zhì)量的內(nèi)容,在用戶搜索相關(guān)內(nèi)容時(shí),會(huì)通過一些過濾機(jī)制過濾掉重復(fù)的內(nèi)容,而不是展示出大量重復(fù)相同的結(jié)果,如果網(wǎng)站存在大量重復(fù)內(nèi)容,在搜索引擎過濾過程中可能會(huì)給網(wǎng)站帶來影響。

搜索引擎來站點(diǎn)抓取內(nèi)容之前,已經(jīng)有爬行頁面預(yù)計(jì),如果網(wǎng)站存在大量的重復(fù)頁面,蜘蛛會(huì)對(duì)這些頁面進(jìn)行一一檢索,雖然在返回的結(jié)果被過濾,但是卻浪費(fèi)了蜘蛛對(duì)站點(diǎn)頁面抓取的預(yù)算,減少了蜘蛛抓取其他高質(zhì)量頁面的機(jī)會(huì),重復(fù)頁面一樣的也會(huì)分散網(wǎng)站的整體權(quán)重,這樣并導(dǎo)致蜘蛛中能獲取到的有意義的頁面減少。

站長無法判斷搜索蜘蛛會(huì)抓取重復(fù)頁面中那個(gè)版本,搜索引擎自己也無法清除說明,用戶不同的搜索,蜘蛛返回的頁面可能是不同的,存在的重復(fù)頁面可能也有不同的偏向,用戶搜索時(shí)返回的頁面是否是你最喜歡返回的頁面,是否能給你帶來最高的流量轉(zhuǎn)化率?這些都是不得而知的,要想減少重復(fù)頁面的權(quán)重分散,可以在robots文件中屏蔽收錄,或者添加canonical標(biāo)簽轉(zhuǎn)移權(quán)重。

像上面分析到的情況,重復(fù)內(nèi)容會(huì)影響蜘蛛的抓取。同時(shí),搜素引擎為了互聯(lián)網(wǎng)生態(tài)公平健康發(fā)展及優(yōu)質(zhì)原創(chuàng)網(wǎng)站的集體利益,減少原創(chuàng)價(jià)值被采集站所得,會(huì)對(duì)重復(fù)、裝載、垃圾信息站點(diǎn)進(jìn)行懲罰。搜素引擎提出這樣的申明,它又是怎么去識(shí)別重復(fù)內(nèi)容的呢?

重復(fù)內(nèi)容可以發(fā)生在不同的站點(diǎn),也可以發(fā)生在同一個(gè)網(wǎng)站上,非優(yōu)化的SEO優(yōu)化CMS系統(tǒng),導(dǎo)致網(wǎng)站存在多個(gè)URL地址可訪問同一個(gè)頁面,這樣的情況也是重復(fù)內(nèi)容,蜘蛛遇到這樣的情況時(shí)會(huì)判斷哪個(gè)頁面才是重要的頁面,會(huì)先從robots文件中檢測,是否有禁止抓取的地址,如果有則停止對(duì)重復(fù)頁面地址的抓取,如果沒有就會(huì)繼續(xù)抓取內(nèi)容,在抓取時(shí)于遇到meta標(biāo)簽,注明noindex這些頁面并不是為蜘蛛準(zhǔn)備的,這種情況蜘蛛也同樣不會(huì)繼續(xù)抓取重復(fù),減少蜘蛛的抓取難度,即使是重復(fù)的內(nèi)容,蜘蛛也只會(huì)抓取有價(jià)值的那個(gè)版本。

百度的星火計(jì)劃邀請站長參與原創(chuàng)站點(diǎn),如果您的網(wǎng)站是本網(wǎng)站首創(chuàng),非抄襲模仿的、內(nèi)容和形式都具有獨(dú)特個(gè)性的資源;且具有社會(huì)共識(shí)價(jià)值的資源,符合國家相關(guān)規(guī)定;不在第二次裝載及偽原創(chuàng)之內(nèi);您并可提交您的站點(diǎn)到百度原創(chuàng)星火計(jì)劃站點(diǎn)。這種方法可減少因?yàn)檎军c(diǎn)權(quán)重不高,網(wǎng)站內(nèi)容在被高權(quán)重網(wǎng)站轉(zhuǎn)載后,蜘蛛會(huì)認(rèn)為轉(zhuǎn)載的站點(diǎn)是原創(chuàng)的內(nèi)容,你的站反而是轉(zhuǎn)載采集站點(diǎn)。

搜索引擎到底如何判斷網(wǎng)站內(nèi)容是否原創(chuàng),重復(fù)內(nèi)容頁面中到底哪個(gè)頁面才是原創(chuàng)頁面,這是任何一個(gè)搜索引擎都未曾公布的算法。但婁底人才網(wǎng)()從百度官方的數(shù)據(jù)了解到,具有“原創(chuàng)”標(biāo)簽的網(wǎng)站,原創(chuàng)星火計(jì)劃上線前后的同期流量對(duì)比顯示,原創(chuàng)url流量增長明顯。同時(shí),原創(chuàng)星火計(jì)劃上線后一段時(shí)間內(nèi)原創(chuàng)url流量增長明顯并逐漸趨于平穩(wěn),可見如果網(wǎng)站能加入百度原創(chuàng)計(jì)劃,網(wǎng)站在流量提升方面還是有很大幫助的。

申請創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!

相關(guān)文章

  • 百度原創(chuàng)保護(hù)功能正式關(guān)閉

    百度原創(chuàng)保護(hù)功能上線的那一刻,我沒有抱任何幻想,百度原創(chuàng)保護(hù)功能下線的那一刻,我不曾有失落的心情,面對(duì)百度,面對(duì)SEO,早已淡然,與其糾結(jié),不如放下。我們需要做的不是怎么迎合百度,而是怎么滿足用戶,提升用戶體驗(yàn)。

    標(biāo)簽:
    百度原創(chuàng)
  • 百度原創(chuàng)標(biāo)識(shí)新階段網(wǎng)站內(nèi)容如何做

    百度之前一直呼吁站長應(yīng)該重視,文章質(zhì)量度特別是原創(chuàng)文章。從百度之前推出的星火計(jì)劃開始,一直到現(xiàn)在都在提醒站長對(duì)于網(wǎng)站內(nèi)容建設(shè)問題。不在僅僅是抄襲和轉(zhuǎn)載別人文章,應(yīng)該從用戶本身出發(fā)來做內(nèi)容。最近一兩月,很多站長都在反饋網(wǎng)站降權(quán),排名全無情況出現(xiàn)。小編在查看朋友網(wǎng)站出現(xiàn)排名下降的文章,發(fā)現(xiàn)很多站長內(nèi)容都

  • 談?wù)劙俣仍瓌?chuàng)算法的致命失誤

    起這么一個(gè)標(biāo)題,不是為了做標(biāo)題榜,而是從自己作為一個(gè)小站長的角度來思考,百度目前的原創(chuàng)算法是存在致命缺陷的。先從我的經(jīng)歷聊起最近在檢查自己所做的兩個(gè)網(wǎng)站時(shí)發(fā)現(xiàn)了這樣的事。這兩個(gè)網(wǎng)站都是自己原創(chuàng)內(nèi)容的網(wǎng)站,弄了好幾個(gè)編輯寫內(nèi)容。網(wǎng)站無論從用戶體驗(yàn)還是從內(nèi)容原創(chuàng)角度,都不差。但近一年了流量一直是半死不活

  • 百度是如何保護(hù)原創(chuàng)的?談百度原創(chuàng)那點(diǎn)事

    原創(chuàng)一直是大問題,往大了說,互聯(lián)網(wǎng)生態(tài)環(huán)境日趨惡劣,采集偽原創(chuàng)低質(zhì)量內(nèi)容泛濫,嚴(yán)重?cái)D占了優(yōu)質(zhì)原創(chuàng)資源的生存空間。導(dǎo)致互聯(lián)網(wǎng)資源整體質(zhì)量大幅下降,網(wǎng)民受損、優(yōu)質(zhì)站長受損、搜索引擎亦受損。往小了說,很多站長一直在進(jìn)行原創(chuàng)建設(shè),而得不到應(yīng)有的保護(hù)。如何加大對(duì)站點(diǎn)原創(chuàng)的保護(hù)以及如何衡量原創(chuàng)是否能滿足用戶需求

    標(biāo)簽:
    百度原創(chuàng)
  • 百度原創(chuàng)算法——必死!

    作為新生,我也問過一些前輩“菜鳥怎么做seo”他們會(huì)說:多原創(chuàng),多外鏈?zhǔn)珍涀匀痪陀辛耍辛藱?quán)重有了pr漸漸的排名就會(huì)上去了。但是原創(chuàng)真的有用么?答案絕對(duì)是肯定的!但是你寫的原創(chuàng)有效果么?答案是模糊的!原因有如下幾點(diǎn):

    標(biāo)簽:
    百度原創(chuàng)

熱門排行

信息推薦