一直以來太多人在設(shè)置404頁面上都認(rèn)為再簡單不過了,但實(shí)際上有太多的公司沒有合理、正確的設(shè)置404頁面。那設(shè)置404頁面到底都有哪些規(guī)則呢?下面趙彥剛和你一起討論下。
先補(bǔ)充說明一下什么是404頁面?在瀏覽器對網(wǎng)頁進(jìn)行訪問時(shí),當(dāng)網(wǎng)頁發(fā)生相應(yīng)錯(cuò)誤或不存在時(shí),會提示404狀態(tài)碼,頁面會出現(xiàn)“Not Found”錯(cuò)誤信息的提示。那提示信息的也是一個(gè)頁面,既稱為404頁面。
首先是否需要設(shè)置404頁面,需要先確定哪一類頁面返回的是404狀態(tài)碼,這點(diǎn)我們可以通過chinaz的http狀態(tài)碼查詢工具進(jìn)行查詢(查詢地址:http://tool.chinaz.com/pagestatus/),如下圖:
那對應(yīng)返回的頁面,就是我們需要進(jìn)行設(shè)置的。當(dāng)我們沒有對該頁面進(jìn)行設(shè)置的時(shí)候,服務(wù)器正常返回的頁面如下圖(之一):
那這不是正常返回404頁面了嗎?狀態(tài)碼也是404,為啥還要設(shè)置呢?怎么設(shè)置才算正確的呢?
第一:當(dāng)用戶訪問了錯(cuò)誤的頁面,會返回如上圖的404頁面,但沒有任何返回我們原網(wǎng)站的鏈接,會導(dǎo)致用戶的流失;第二:狀態(tài)碼設(shè)置不正確也會導(dǎo)致搜索引擎誤認(rèn)為該頁面是可以正常訪問的,會導(dǎo)致搜索引擎爬蟲抓取到大量的空頁面或者重復(fù)頁面。
如下是幾種經(jīng)常容易出錯(cuò)的例子:
一、不存在的頁面返回了200的結(jié)果:
如下圖,我的檢查結(jié)果,看圖中的這個(gè)URL就知道這個(gè)URL是不存在的。但查詢狀態(tài)碼還是返回200,這樣會導(dǎo)致爬蟲大量抓取這種頁面,并造成太多的無效頁面,甚至是垃圾、重復(fù)頁面。對網(wǎng)站的影響是很大的。
二、跳轉(zhuǎn)的404頁面
正常的404頁面返回結(jié)果是這樣的:當(dāng)你訪問了錯(cuò)誤頁面,URL是不會發(fā)生變化的,而網(wǎng)頁會直接出現(xiàn)我們設(shè)置好的404頁面。如下圖的流程。
訪問正常的URL地址:http://www.hqwx.com/record/?type=lesson&course_id=375。我們把后面的375改成37512312321232131。然后進(jìn)行訪問發(fā)現(xiàn)如下結(jié)果:
發(fā)現(xiàn)我們設(shè)置好的404頁面確實(shí)是出來了,但url發(fā)生了跳轉(zhuǎn)。那我們看下這個(gè)跳轉(zhuǎn)的url是什么狀態(tài)碼。
返回狀態(tài)嗎不是404,那爬蟲豈不是就理解錯(cuò)了!302是個(gè)臨時(shí)跳轉(zhuǎn)狀態(tài)碼。
三、未正確設(shè)置404頁面的情況
如上圖,訪問的URL沒變,但404頁面是這樣的。用戶看到了 可能會不明白是什么意思,同時(shí),沒有返回網(wǎng)站的鏈接地址。也會導(dǎo)致用戶的流失。但爬蟲是沒問題的。
如上,是設(shè)置404頁面一些網(wǎng)站經(jīng)常忽略的問題。希望你知道了這個(gè)問題后,對自己網(wǎng)站進(jìn)行排查。并進(jìn)行正確的設(shè)置。如果對本文中存在問題,請?jiān)谙路皆u論區(qū)進(jìn)行評論回復(fù)。我們第一時(shí)間幫你解答。
也可以關(guān)注我的知識星球“優(yōu)啟學(xué)院”,來向我提問:https://t.zsxq.com/fIqJIAA
申請創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!