域名預(yù)訂/競(jìng)價(jià),好“米”不錯(cuò)過
關(guān)鍵詞是SEO的核心概念之一,SEO實(shí)踐中很多工作都圍繞關(guān)鍵詞開展。本文嘗試從搜索技術(shù)原理和網(wǎng)站優(yōu)化實(shí)踐結(jié)合,總結(jié)內(nèi)容頁關(guān)鍵詞布局在SEO中的具體落地方法。
一、搜索引擎技術(shù)原理簡(jiǎn)述
搜索引擎最核心的底層技術(shù)基礎(chǔ)是將用戶查詢?cè)~切分成自然語言中有意義的詞組,然后從索引庫找到包含這些詞組中全部或部分關(guān)鍵詞的內(nèi)容,返回結(jié)果。
正常人的搜索思路是帶著關(guān)鍵詞,去查找內(nèi)容中是否包含該關(guān)鍵詞。假設(shè)要從序號(hào)1-10的10個(gè)網(wǎng)頁查找包含“關(guān)鍵詞布局”的網(wǎng)頁,分別去這10個(gè)網(wǎng)頁中全文搜索是否包含“關(guān)鍵詞布局”這個(gè)詞,然后返回包含該詞的網(wǎng)頁的序號(hào)。但如果是從百萬、千萬個(gè)網(wǎng)頁中查找呢,速度就很慢了,于是就發(fā)明了倒排索引的概念。(以下圖中數(shù)據(jù)皆非實(shí)際數(shù)據(jù),僅作示意)
如上圖示,為一個(gè)最簡(jiǎn)單的倒排索引模型(DocID是搜索引擎為所抓取網(wǎng)頁分配的唯一編號(hào))。搜索引擎爬蟲每次抓取一個(gè)網(wǎng)頁的時(shí)候,就把網(wǎng)頁切分成若干個(gè)詞組,將這些詞一一與倒排索引表比對(duì):如果倒排索引表的“關(guān)鍵詞”一列有這個(gè)詞,就在其對(duì)應(yīng)的倒排列表中增加當(dāng)前網(wǎng)頁的編號(hào)DocID;如果沒有,就增加一行(涉及到新詞識(shí)別,此處不展開),給這個(gè)關(guān)鍵詞分配一個(gè)ID,再寫入當(dāng)前網(wǎng)頁的編號(hào)。這樣,當(dāng)我們查詢“關(guān)鍵詞1”的時(shí)候,很快就能知道相關(guān)的網(wǎng)頁有(1,2,3,5)。復(fù)雜一些的查詢?cè)~假設(shè)被切分成“關(guān)鍵詞1”、“關(guān)鍵詞3”、“關(guān)鍵詞6”這3個(gè)詞,也能快速查詢到相關(guān)網(wǎng)頁有(1,2,3,5,6,7,9)。
僅僅這樣,還不足以對(duì)搜索結(jié)果進(jìn)行排序。非作弊的情況下,一個(gè)網(wǎng)頁出現(xiàn)某關(guān)鍵詞次數(shù)越多,該關(guān)鍵詞越能代表此網(wǎng)頁的特征,前提是要過濾停用詞(停用詞就是幾乎每個(gè)網(wǎng)頁中都有很多,但不能表達(dá)任何具體意義的詞,比如:“的”、“是”、“了”等等)。如果我們能在倒排索引表里面加入關(guān)鍵詞在網(wǎng)頁中出現(xiàn)的頻率信息(簡(jiǎn)稱:詞頻--TF),就能對(duì)網(wǎng)頁進(jìn)行排序了。如下圖所示:當(dāng)我們的查詢?cè)~被分詞為“關(guān)鍵詞1”、“關(guān)鍵詞2”時(shí),就能將相關(guān)網(wǎng)頁排序?yàn)?3,5,1,2)。
假設(shè)現(xiàn)在有兩個(gè)網(wǎng)頁1、網(wǎng)頁2,在倒排索引中的信息如下圖:
我們搜索“關(guān)鍵詞怎么布局”,搜索詞被分詞為“關(guān)鍵詞”、“怎么”、“布局”,其中網(wǎng)頁1中“關(guān)鍵詞”、“怎么”、“布局”分別出現(xiàn)2、2、2次,共6次;網(wǎng)頁2中“怎么”、“布局”共出現(xiàn)7次,按照前面的邏輯,最終的搜索結(jié)果排序?yàn)?2,1),這顯然不是理想的排序結(jié)果,網(wǎng)頁2的主題明顯是講“圍棋怎么布局”的。此時(shí)需要引入IDF(逆文檔頻率指數(shù))來解決這個(gè)問題。
如果一個(gè)網(wǎng)頁集合中包含某個(gè)關(guān)鍵詞的網(wǎng)頁越少,則該關(guān)鍵詞具有越好的網(wǎng)頁區(qū)分能力,故IDF越大,即具有更高的權(quán)重。假設(shè)上圖中的“關(guān)鍵詞”、“怎么”、“布局”、“圍棋”的IDF分別為2.5、0.3、0.8、3,每個(gè)詞的TF乘以IDF后求和,得到網(wǎng)頁1、2的相關(guān)性分別為:7.2、4.6,所以搜索“關(guān)鍵詞怎么布局”的排序結(jié)果為(1,2),就比較符合實(shí)際了。
關(guān)鍵詞的位置信息也是一個(gè)重點(diǎn),一般認(rèn)為標(biāo)題中出現(xiàn)關(guān)鍵詞比正文部分出現(xiàn)相同的關(guān)鍵詞,更能體現(xiàn)一個(gè)網(wǎng)頁的主題特征,H標(biāo)簽的重要性即在于此。搜索引擎還能夠根據(jù)代碼布局和噪音比例(如停用詞出現(xiàn)頻率)來判斷哪里是導(dǎo)航、哪里是正文、哪里是側(cè)邊欄等等。在倒排索引列表中會(huì)把這些位置信息都標(biāo)注進(jìn)去,參與排序決策。
除此之外,還有一些其他的常用技術(shù)方法,如:雙詞索引/短語索引,“關(guān)鍵詞怎么布局”不一定就是切分為三個(gè)短詞,還可能切分成“關(guān)鍵詞布局”、“詞怎么”、“怎么布局”等等;關(guān)聯(lián)詞合并搜索,“關(guān)鍵詞”的關(guān)聯(lián)詞“關(guān)鍵字”,“怎么”的關(guān)聯(lián)詞“如何”等。
當(dāng)然,實(shí)際中現(xiàn)代大型搜索引擎的倒排索引模型會(huì)復(fù)雜很多,再融入其他諸多因素(一個(gè)重點(diǎn)是超鏈分析)參與排序算法,限于篇幅和作者水平有限,不繼續(xù)展開了。
二、關(guān)鍵詞如何布局
1、標(biāo)題中一定要有關(guān)鍵詞,但不一定要完整的疑問句
鑒于搜索引擎會(huì)把查詢?cè)~切分為N多的單詞、雙詞、短語,并在查詢時(shí)加入關(guān)聯(lián)詞合并查詢,所以標(biāo)題中的關(guān)鍵詞不一定是完完整整的一個(gè)疑問句,一個(gè)典型是“做XXXX哪家公司好”。標(biāo)題中不一定需要這個(gè)完整的詞,即使標(biāo)題中包含了這個(gè)完整的短句,也不能匹配其他完整短句,一個(gè)優(yōu)質(zhì)的網(wǎng)頁往往能匹配成百上千的長尾關(guān)鍵詞,顯然一個(gè)標(biāo)題不可能全部包含。標(biāo)題的另一大作用是吸引點(diǎn)擊,點(diǎn)擊率也是影響排名的一個(gè)因素,但其中的“XXXX”、“好”、“公司”這些核心詞一定要出現(xiàn)。
2、正文自然、均勻的分布一些核心詞和切分詞
搜索引擎發(fā)展初期,很多技術(shù)人員利用TF*IDF算法權(quán)重較高的漏洞,大量堆砌關(guān)鍵詞,從而快速獲得較好的搜索排名。后來搜素引擎從算法層面修復(fù)漏洞打擊作弊,就出現(xiàn)了網(wǎng)絡(luò)上流行的“理想關(guān)鍵詞密度3%~8%”的觀點(diǎn)。首先,這個(gè)密度不是計(jì)算完整查詢?cè)~的,而是切分后的詞全部計(jì)算,并且實(shí)踐中,你會(huì)發(fā)現(xiàn)有關(guān)鍵詞密度稍微低于3%的,也有關(guān)鍵詞密度高出8%很多的網(wǎng)頁能夠獲得不錯(cuò)的排名。
如果你是搜索引擎的工程師,會(huì)怎么做?我想我會(huì)結(jié)合全網(wǎng)的歷史訪問數(shù)據(jù)(如百度統(tǒng)計(jì)、手機(jī)百度等都能獲取較全面的訪問數(shù)據(jù))和關(guān)鍵詞密度信息劃定一個(gè)合理范圍和警戒范圍,超出警戒范圍的給予沉默處理,在警戒范圍區(qū)間的結(jié)合該站點(diǎn)歷史數(shù)據(jù)和第一階段的小流量排名的訪問數(shù)據(jù)反饋,決定是打壓還是維持或給予更高的排名。
相比于關(guān)鍵詞密度,我們更應(yīng)該注重的是語言的通順流暢(一味地強(qiáng)插關(guān)鍵詞顯得啰嗦和別扭)和內(nèi)容的質(zhì)量深度。畢竟,搜索引擎的排序因素多達(dá)成百上千個(gè),也不能顧此失彼。
3、正文下方相關(guān)內(nèi)容和側(cè)邊欄推薦適當(dāng)布局關(guān)鍵詞
雖說搜索引擎能夠通過代碼和噪音比例判斷這些不是正文部分,從而降低一些此處關(guān)鍵詞的權(quán)重,但從百度快照緩存來看,還是有一點(diǎn)作用的。
正文下方和側(cè)邊欄的相關(guān)內(nèi)容和推薦內(nèi)容多是從橫向和縱向兩個(gè)角度選取內(nèi)容。比如本文,主題是關(guān)于“關(guān)鍵詞布局”,那橫向推送一些“網(wǎng)站結(jié)構(gòu)布局”、“關(guān)鍵詞挖掘技巧”等站內(nèi)優(yōu)化方面的內(nèi)容,大概率是有很多訪客感興趣的;縱向推送一些“教你怎么建設(shè)高質(zhì)量的外鏈”、“如何提高著落頁的轉(zhuǎn)化率”等內(nèi)容,也是訪客可能暫時(shí)抑制的隱性需求。增加了關(guān)鍵詞布局的同時(shí),還能提高PV,降低跳出,提升用戶體驗(yàn),何樂而不為。
作者:建站監(jiān)理網(wǎng)
來源:盧松松博客,歡迎在線投稿
友情提示:A5官方SEO服務(wù),為您提供權(quán)威網(wǎng)站優(yōu)化解決方案,快速解決網(wǎng)站流量異常,排名異常,網(wǎng)站排名無法突破瓶頸等服務(wù):http://www.admin5.cn/seo/zhenduan/
申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!