很多企業(yè)和SEO在查看網(wǎng)站收錄的時(shí)候,總是會(huì)發(fā)現(xiàn)一些“異??煺?rdquo;,但是卻找不到解決方案,今天賀貴江對于這個(gè)問題做出一個(gè)純技術(shù)貼的回答,喜歡的轉(zhuǎn)發(fā)收藏關(guān)注我。
一、快照不更新
快照多久不更新算是異常?1-3天的更新都是正常的,所以這個(gè)時(shí)間內(nèi),無需擔(dān)心什么,不要因?yàn)橐粌商觳桓戮蜕匣?。而一周不更新快照則表明網(wǎng)站近期存在一定隱患,這個(gè)時(shí)候往往是搜索引擎對站點(diǎn)的觀察期。10天以上不更新,這個(gè)時(shí)候就要小心了,網(wǎng)站很容易降權(quán)。
臨時(shí)解決辦法:
尋找首頁快照,找到網(wǎng)站快照進(jìn)行投訴,投訴完畢后,等待機(jī)器自動(dòng)對快照進(jìn)行更新,如果第二天沒有更新,反復(fù)3次投訴,100%得到快照的更新。
根本解決辦法:到百度資源平臺(tái)看一下,官方近期是否有哪些算法的上線,網(wǎng)站是否觸及了,網(wǎng)站近期的服務(wù)器怎么樣是否穩(wěn)定,這個(gè)很重要。最后則是:站點(diǎn)近期是否做了較多的頁面更改,這些更改很可能不利于搜索引擎優(yōu)化。
二、快照抓取不全
有很多排名不理想的網(wǎng)站,首頁都有一個(gè)共同點(diǎn)“快照抓取不全”,甚至快照中“空空如也”什么都沒有的情況。
上圖是一個(gè)最新的示例,那么產(chǎn)生的原因是什么呢?
第一,頁面大小超過3MB,尤其是達(dá)到5MB很容易出現(xiàn)蜘蛛抓取不全的問題;
第二,存在大量的超長URL鏈接:
一張圖片的URL長度(截圖只展示了部分),這樣的鏈接相信確實(shí)是百里挑一的,直接就把蜘蛛給嚇跑了!
第三,大量的文本CSS或腳本:
示例站文本CSS文件在頭部中持續(xù)了“5000行”,技術(shù)為什么不寫到CSS文件中再進(jìn)行調(diào)用呢?真的是讓人莫名其妙。
所以說,如果你的網(wǎng)頁快照抓取不全面了,這一塊一定要檢查一下,能寫到CSS或者js中的數(shù)據(jù),一定不要直接將其放到HTML中直接進(jìn)行文本展示。
第四,整體載入太慢:
一個(gè)網(wǎng)站打開速度可能2秒,但是這個(gè)時(shí)候卻沒有完全加載完畢,我們很多時(shí)候會(huì)看到瀏覽器左下角一直顯示正在載入,這種情況同樣會(huì)造成蜘蛛抓取快照不完整的情況。賀貴江這里建議的是,大家通過鍵盤F12來查看一下,并使用F5按鍵強(qiáng)制刷新頁面:
網(wǎng)站真的可以在3S之內(nèi)把信息全部加載完畢嗎?如果沒有加載完畢,就要通過時(shí)間線來看一下,究竟是哪些東西影響到加載了,這個(gè)時(shí)候針對性的處理會(huì)更合適!
第五,首字節(jié)時(shí)間
首字節(jié)時(shí)間是什么鬼?"從發(fā)送請求到WEB服務(wù)器的時(shí)間+WEB服務(wù)器處理請求并生成響應(yīng)花費(fèi)的時(shí)間+WEB服務(wù)器生成響應(yīng)到瀏覽器花費(fèi)的時(shí)間"
有些網(wǎng)站下載速度分明很快,但是卻總是會(huì)卡幾秒然后頁面才能打開,這樣就導(dǎo)致了蜘蛛不抓取快照,或者抓取不完整的情況,這就是所謂的“首字節(jié)時(shí)間”太長造成的問題了。
那么造成這個(gè)問題的原因是什么呢?綜合來看:簡單的講一下,這個(gè)問題與“程序|DNS|服務(wù)器”三者有關(guān),具體很復(fù)雜,解決方式:A,網(wǎng)站使用CDN;B,避免使用虛擬主機(jī),建議使用云服務(wù)器。C;服務(wù)器分配到的CPU進(jìn)行升級(jí)。
第六,帶寬和峰值
前端時(shí)間診斷一個(gè)客戶網(wǎng)站,發(fā)現(xiàn)在大量的頁面中都出現(xiàn)了快照抓取不全面的問題,最終查看原因發(fā)現(xiàn)是:帶寬不足導(dǎo)致的問題。
我們來簡單舉個(gè)例子,例如頁面大小為100KB,10個(gè)人同時(shí)訪問,下載量就是1000K/128K/S=7.8125 這樣這10個(gè)人同時(shí)完全打開頁面時(shí)間為7.8秒左右,如果頁面大小是3MB呢?
所以你的網(wǎng)站帶寬足夠支撐你的網(wǎng)站嗎?當(dāng)然了現(xiàn)在很多時(shí)候我們可以在服務(wù)器的管理中看到流量記錄,但是如果“峰值”,這樣肯定是不行的,帶寬經(jīng)常出現(xiàn)峰值,那么搜索引擎快照這里也更容易出現(xiàn)抓取異常!
三、快照內(nèi)容有誤
咦,為什么URL鏈接和快照內(nèi)容不一樣呢?最近有不少站長來咨詢SEO問我說:PC端的快照,為什么打開后是移動(dòng)端的內(nèi)容呢?很奇怪吧。
其實(shí)這個(gè)問題的主要原因是因?yàn)椋?ldquo;跳轉(zhuǎn)”造成的,不少站點(diǎn)全站設(shè)置了“在移動(dòng)端訪問PC自動(dòng)跳轉(zhuǎn)到移動(dòng),在PC端訪問移動(dòng)自動(dòng)跳轉(zhuǎn)到PC端。”這個(gè)形式。而這恰恰是形成快照異常的根本!
針對于這個(gè)問題的解決方式:把內(nèi)頁的跳轉(zhuǎn)取消掉就可以了,保留首頁跳轉(zhuǎn)就OK了!就這么簡單。其實(shí),網(wǎng)站真的沒必要做全站跳轉(zhuǎn)!
A5創(chuàng)業(yè)網(wǎng)SEO總監(jiān)/賀貴江,業(yè)務(wù)合作:https://www.admin5.cn/seo/zhenduan/ 我的微信公眾號(hào)2567173,更多搜索引擎內(nèi)容分享!
申請創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!