概要:主要圍繞著SEO優(yōu)化重點理解百度谷歌搜索引擎索引流程理論分解,索引是搜索引擎里面很重要重點一部分,希望廣大愛好者們時時關(guān)注我更新文章,因為我是按步驟來理解SEO優(yōu)化淺到深,如前面沒關(guān)注就直接看這部分可能理解起來有點難度.不過前面很理解這部分我相信也好理解.理解因人而異。希望大家能理解讀懂SEO優(yōu)化所有內(nèi)容部分。重復說下搜索引擎有四大部分:1、抓取,2、過濾,3、索引 ,4、查詢,今天講解到索引部分有以下幾點內(nèi)容:注意:索引(主要關(guān)于“相關(guān)性”的一個概念了,所謂的“預處理”)
一、提取文字內(nèi)容:搜索引擎是對文字處理比較強,其次圖片、視頻等其他處理比較弱,理解:我們在站內(nèi)和站外更新文章時候一定要以文字為主,沒辦法情況下才發(fā)其他內(nèi)容.
二、停止詞:什么叫停止詞我們可以理解成講話停頓出現(xiàn)的那個詞就叫停止詞,如你在哪里啊,你在干嘛呀,我的SEO優(yōu)化, 等等,“啊”“呀”“的” “等”出現(xiàn)網(wǎng)頁和互聯(lián)網(wǎng)網(wǎng)頁中最多次數(shù)不會被索引(寫軟文注意事項)
三、消躁:這兩個詞我們可以先有現(xiàn)實生活中理解他,消:消失,消除,躁:躁動因急躁而行動,躁汗心煩急躁,導致汗出,躁狂浮躁輕狂, 我們就知道搜索引擎索在提取你網(wǎng)頁時先提取標題在提取文章內(nèi)容給予比較高分數(shù),而網(wǎng)頁文章以外內(nèi)容會給予比較低分數(shù),如你想把關(guān)鍵詞排名好分數(shù)高盡量出現(xiàn)在文章頁里面,(站內(nèi)和站外注意事項)
四、中文分詞:里面有切詞,正向匹配,逆向匹配,雙向最大匹配,詞庫:切詞就是詞與詞之間把他分開來讀,因搜索引擎只讀一個詞,在切詞分開時搜索引擎有他切法,就是把詞與詞之間相關(guān)性用正向匹配在用逆向匹配以及雙向最大匹配得出來你文章內(nèi)容相關(guān)性和可讀性.稍微解釋下:正向匹配:就是順著詞的組詞在組詞組詞成語,逆向匹配:也是一樣組詞在組詞組詞成語.雙向最大匹配:有些詞可正配也可逆配,詞庫:就是百度谷歌有他自己詞典,來分析你網(wǎng)站網(wǎng)頁文章中相關(guān)性(站內(nèi)和站外文章相關(guān)性)
五、提取關(guān)鍵詞信息:理解:搜索引擎提取所有互聯(lián)網(wǎng)中網(wǎng)頁關(guān)鍵詞相關(guān)文章來進行對比,如網(wǎng)站網(wǎng)頁信任度高分數(shù)高投票人多關(guān)鍵詞合理安排又相關(guān)性強從而會把你頁面排在比較靠前排名。
六、去重:理解:網(wǎng)頁中重復在重復,搜索引擎檢測你網(wǎng)頁文章中太對不自然關(guān)鍵詞
七、倒排索引(介紹正排與倒排):正排(以網(wǎng)頁文件為主,以關(guān)鍵詞為集合暫時儲存數(shù)據(jù)庫,倒排(以關(guān)鍵詞為主,以網(wǎng)頁文件為集合)數(shù)據(jù)庫為準
八、鏈接計算(分值與相關(guān)性)外鏈/內(nèi)鏈:網(wǎng)站網(wǎng)頁盡可能跟文章內(nèi)容有一定相關(guān)性 搜索引擎檢計算出鏈接文章相關(guān)性強而得到較高分值。
九、頁面過濾:就是搜索引擎會把所有互聯(lián)網(wǎng)中網(wǎng)頁文章內(nèi)容進行對比如你網(wǎng)站網(wǎng)頁內(nèi)容是抄襲有可能會過濾掉不索引到數(shù)據(jù)庫中,而那些信任度高
十、頁面指紋(空間相量概念)搜索引擎提取網(wǎng)頁文章進行MD5加密處理對比判斷文章原創(chuàng)(信任度高網(wǎng)站網(wǎng)頁會覺得你原創(chuàng)度高),百度谷歌判斷文章原創(chuàng)不原創(chuàng)是用方向詞的方向相量和大小力量進行分析得出結(jié)果.可以理解成 方向網(wǎng)頁與網(wǎng)頁進行對比看誰相似度高,大小力量是計算文章的內(nèi)容相差大和相關(guān)性越強越原創(chuàng).
以上是我個人見解和理解分析出來原理知識分享給廣大SEO優(yōu)化人員和程序員技術(shù)交流,更多技術(shù)技巧請到我博客進行互相交流地址:,轉(zhuǎn)載請保留地址,寫一篇文章不易,希望大家支持原創(chuàng),后續(xù)我更加堅持每天寫幾篇SEO優(yōu)化技術(shù)技巧文章分享.
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!