第一:百度搜索SEO出現(xiàn)的相關(guān)搜索:
以SEO為核心的相關(guān)詞-什么是SEO,如何進(jìn)行SEO
以SEO語義相關(guān)的相關(guān)詞-網(wǎng)絡(luò)推廣
第二:搜狗搜索SEO出現(xiàn)的相關(guān)搜索:
以SEO為核心的相關(guān)詞- seo是什么 seo教程seo查詢
以SEO語義相關(guān)的相關(guān)詞-搜索引擎優(yōu)化
第三:360搜索知乎出現(xiàn)的相關(guān)搜索
以知乎為核心的知乎網(wǎng),知乎日報(bào)
以知乎同類性質(zhì),語義相關(guān)的果殼網(wǎng),天涯論壇
還有一就是產(chǎn)品,品牌,公司相關(guān),比如搜飲料出現(xiàn)康師傅
相關(guān)搜索含義:用戶在搜索框搜索關(guān)鍵詞的時(shí)候,在搜索結(jié)果頁的最下方呈現(xiàn)出與搜索詞精準(zhǔn)匹配,詞組匹配,廣泛匹配,相同拼音的相關(guān)詞。遵循拼音,詞組,意義相關(guān)性算法。
相關(guān)搜索目的:增加用戶搜索體驗(yàn)感,最大限度的解決用戶的搜索需求。當(dāng)用戶查詢詞不當(dāng),查詢結(jié)果不佳,不知道還有什么更精彩豐富內(nèi)容,那么相關(guān)搜索就可以解決這些用戶痛點(diǎn),為用戶啟發(fā)性質(zhì)作用,幫助用戶發(fā)現(xiàn)和他更多他意圖相關(guān)的詞。
下拉框是一種搜索提示,是用戶搜索關(guān)鍵詞沒有點(diǎn)擊搜索的時(shí)候出現(xiàn)的提示,根據(jù)關(guān)鍵詞前綴匹配
相關(guān)搜索是一種推薦引擎,是用戶搜索關(guān)鍵詞點(diǎn)擊搜索之后的推薦,根據(jù)關(guān)鍵詞語義,拼音,詞組匹配
第一:為了最正確的搜索結(jié)果。
第二:是為了擴(kuò)展搜索,找到更多的東西。
刷搜索引擎相關(guān)搜索的目的:
第一:就是讓我們網(wǎng)站已經(jīng)有了排名的品牌詞,網(wǎng)站名稱,網(wǎng)站關(guān)鍵詞出現(xiàn)在更多關(guān)鍵詞的相關(guān)搜索中,讓更多的用戶點(diǎn)擊相關(guān)搜索達(dá)到網(wǎng)站,提高網(wǎng)站權(quán)重,網(wǎng)站流量。
第二:當(dāng)搜某個(gè)核心關(guān)鍵詞,在相關(guān)搜索中出現(xiàn)你的產(chǎn)品,品牌,名稱的推薦,那么會給用戶帶來視覺沖擊,信任建立,知名度,競爭力。
第三:起到引導(dǎo)作用,比如搜索飲料相關(guān)搜索出現(xiàn)康師傅,那么用戶很可能會點(diǎn)擊康師傅。
刷百度相關(guān)搜索原理:
第一:搜索詞熱搜指數(shù),熱搜度,當(dāng)一個(gè)詞的熱度達(dá)到一定搜索流量的時(shí)候,只要搜索該詞的拼音,相關(guān)詞就會出現(xiàn)該關(guān)鍵詞。
第二:與搜索詞相關(guān)度,相關(guān)搜索詞語義,拼音,詞組肯定和搜索詞匹配。
第三:搜索引擎網(wǎng)站流量,就算沒有人搜索這個(gè)次,但是改詞在百度的權(quán)重非常高,同樣能夠出現(xiàn)在相關(guān)搜索詞中。
第四:下拉框和相關(guān)搜索的影響度很高。
第五:實(shí)時(shí)熱點(diǎn),例子,搜索知乎的時(shí)候,出現(xiàn)了林志穎,這個(gè)語義并不關(guān)聯(lián),但是林志穎的人氣很高,導(dǎo)致搜索了知乎的人可能跟著搜索過林志穎,這是用戶行為決定的搜索相關(guān)詞也是其中一個(gè)算法原理。
刷相關(guān)搜索的實(shí)現(xiàn)方法:
第一:比如SEO,我們可以先搜索SEO,然后接著再去搜索SEO教程,那么每天以幾倍的方式增加,當(dāng)達(dá)到一定搜索量的時(shí)候,那么SEO的相關(guān)詞搜索就會出現(xiàn)SEO教程了。
打開百度首頁//www.baidu.com/輸入黑卡紙出來的地址為:
//www.baidu.com/s?wd=%BA%DA%BF%A8%D6%BD&rsv_bp=0&inputT=32343
這串代碼中:%BA%DA%BF%A8%D6%BD是代表黑卡紙的代碼
inputT=32343這個(gè)是代表搜索結(jié)果出來的運(yùn)算時(shí)間(每臺電腦這個(gè)數(shù)據(jù)都不一樣的)
再出來的頁面中輸入你要的品牌,比如荔禾黑卡,輸入完畢后,點(diǎn)百度一下。
出來的地址為://www.baidu.com/s?bs=%BA%DA%BF%A8%D6%BD&f=8&rsv_bp=1&wd=%BA%DA%BF%A8%D6%BD%C0%F3%BA%CC%BA%DA%BF%A8&inputT=54390
這串代碼中:
%BA%DA%BF%A8%D6%BD
這里不變,因?yàn)檫@個(gè)是之前我們搜索的黑卡紙,百度就在這里開始記錄下黑卡紙和現(xiàn)在的黑卡紙荔禾黑卡這兩個(gè)詞是相關(guān)的。
f=8這個(gè)數(shù)值是會變動的。范圍為:
0-9.數(shù)值越高,代表著這個(gè)相關(guān)搜索的詞越容易做上去。
%BA%DA%BF%A8%D6%BD%C0%F3%BA%CC%BA%DA%BF%A8是代表黑卡紙荔禾黑卡的代碼
inputT=54390是代表這個(gè)是代表搜索結(jié)果出來的運(yùn)算時(shí)間
第二:雇傭水軍,或者買肉雞真實(shí)去人為制造相關(guān)搜索量。
第三:去購買網(wǎng)站的彈窗廣告,用戶沒點(diǎn)一次就是搜索一次。
第四:誘導(dǎo),通過在論壇或其他流量大的頁面,放上相關(guān)詞和搜索詞的訪問地址后誘導(dǎo)用戶不斷點(diǎn)擊。
第五:購買軟件來刷搜索引擎相關(guān)搜索。
注意:
第一:相關(guān)搜索詞必須有一定的搜索量
第二:相關(guān)搜索詞確實(shí)和搜索關(guān)鍵詞是相關(guān)性質(zhì)的詞
怎么刪除百度相關(guān)搜索:
第一:百度網(wǎng)頁投訴中心投訴
第二:把正面的信息刷上去壓制負(fù)面相關(guān)搜索,并把正面信息做好相應(yīng)的著陸文章頁面。
相關(guān)搜索算法思想:
相關(guān)搜索系統(tǒng)的輸入為用戶的搜索詞,而輸出是一堆與這個(gè)詞相關(guān)的其他詞。
搜索詞的出現(xiàn)得益于搜索引擎的詞典,可以計(jì)算出語義相關(guān)的詞,但是這樣的詞典中語義相關(guān)的詞還是不足與滿足用戶,所以在次基礎(chǔ)上加入用戶行為(搜索記錄,點(diǎn)擊記錄)來拓展更多相關(guān)詞庫。
通過用戶數(shù)據(jù)引發(fā)的思考:
第一:后繼詞,當(dāng)用戶搜索一個(gè)詞比如SEO,,發(fā)現(xiàn)在搜索結(jié)果列表中沒有你需要的內(nèi)容,那么就繼續(xù)用戶其他的詞來尋找,比如搜索SEO教程,那么SEO教程就成了SEO的后繼詞了,所以這種屬于用戶幫搜索引擎找語義相關(guān)詞。
第二:如果一個(gè)關(guān)鍵詞搜索詞結(jié)果,跟另外一個(gè),甚至幾個(gè)關(guān)鍵詞搜索出來的結(jié)果很多交集,那么這些關(guān)鍵詞很可能也是語義相關(guān)的詞,如果這些搜索結(jié)果的交集被點(diǎn)擊并滿足了,那就確定相關(guān)了。
比如:搜索關(guān)鍵詞A,B,同樣找到了結(jié)果中的HTML1頁面都滿足了這個(gè)搜索詞的需求,那么A,B是有一定相關(guān)性的。
相關(guān)搜索算法實(shí)現(xiàn)原理:
用戶后繼詞原理:
把用戶在5分鐘之內(nèi)在搜索引擎中搜索詞定義為一次搜索行為,那么就形成了搜索日志,搜索日志如下:
cookie:用戶cookieid keys:[A1,A2.....] [B1,B2.....] [C1,C2.....]
接著按用戶進(jìn)行分類,時(shí)間間隔5分鐘進(jìn)行數(shù)據(jù)清理,[x1,x2.....]一個(gè)數(shù)組表示一次搜索行為,每個(gè)數(shù)組的第一位就是當(dāng)次搜索行為的第一個(gè)搜索詞。
cookie:用戶cookieid keys:[A1,A2.....] [B1,B2.....] [C1,C2.....]
對于單個(gè)用戶來說搜索后繼詞的確定性是不夠的,比如搜索科比,但是一看到旁邊有人我就立刻改變搜索培訓(xùn),那么這兩個(gè)詞是沒有相關(guān)性質(zhì)的。那么就加入統(tǒng)計(jì)規(guī)則去掉一些雜質(zhì),比如某個(gè)詞B只有出現(xiàn)在5個(gè)用戶的相同的搜索詞A的后繼詞中才算一個(gè)A的后繼詞,還有其他的一些規(guī)則,這么下來,日志就變成了。
key:A succeed:A1,A2,A3.....
用戶協(xié)同過濾原理:
當(dāng)搜索用戶日志足夠多的情況,可以把擁有相同搜索記錄的用戶聚合起來,通過協(xié)同過濾算法,獲取更多的相關(guān)性的詞。通過下面協(xié)同過濾算法同樣可以把加索爾推薦給NBA了。
A用戶:籃球 后繼詞 男籃 女籃
B用戶:NBA 后繼詞 男籃 科比
C用戶:男籃比賽 后繼詞 男籃 加索爾
從搜索詞算法實(shí)現(xiàn):
如果一個(gè)關(guān)鍵詞搜索詞結(jié)果,跟另外一個(gè),甚至幾個(gè)關(guān)鍵詞搜索出來的結(jié)果很多交集,那么這些關(guān)鍵詞很可能也是語義相關(guān)的詞。
從搜索日志來看例子:
key:搜索詞 time:搜索時(shí)間 cookie:用戶cookieid result:a,b,c,d,e(前5個(gè)搜索結(jié)果)
這次,我們只用key和result兩項(xiàng),稍微處理下來以后就變成了
key:搜索詞A result:a,b,c,d,e(前5個(gè)搜索結(jié)果)
key:搜索詞B result:a,f,c,g,m(前5個(gè)搜索結(jié)果)
如果我們把每一行數(shù)據(jù)的result想象成一篇文檔,result里面的每個(gè)結(jié)果集想象成一個(gè)詞語,那么這其實(shí)就是求兩個(gè)文檔之間的相似性了,從頭到尾過一遍就可以找到每一行數(shù)據(jù)和它最相似的數(shù)據(jù)了,而每一行可以用當(dāng)行的搜索詞表示,這么一算下來數(shù)據(jù)就變成這樣子了,后面的括號里面是兩個(gè)詞的相似度,如果想知道文本的相似性如何計(jì)算,可以參考我之前的文章,本文最后有鏈接。
key:搜索詞Asucceed:搜索詞B(0.8)搜索詞C(0.6).....
key:搜索詞Bsucceed:搜索詞A(0.8)搜索詞E(0.7).....
有了上面這個(gè)數(shù)據(jù),拍一個(gè)閾值(比如0.7)卡一下,就得到最后的相關(guān)搜索的結(jié)果了。
這個(gè)計(jì)算相似性的方法的計(jì)算量比較大,而且閾值沒有卡好的話容易出現(xiàn)不相關(guān)的結(jié)果,在實(shí)際工程應(yīng)用中使用得不多,下面這個(gè)方法使用得更多點(diǎn),相當(dāng)于這個(gè)的加強(qiáng)版。
從用戶搜索結(jié)果集考慮
如果某個(gè)搜索結(jié)果(比如一個(gè)網(wǎng)頁或者一個(gè)商品)出現(xiàn)在了不同的搜索詞的結(jié)果集中,那么這些個(gè)搜索詞很可能是相關(guān)的,如果這個(gè)搜索結(jié)果在不同的搜索詞下都被點(diǎn)擊了,那么這些個(gè)詞的相關(guān)性就更高了。
點(diǎn)擊的加成是很強(qiáng)大的,而且在數(shù)據(jù)量巨大的情況下,我們可以只考慮點(diǎn)擊的情況,還是拉出搜索日志,不過這次是搜索點(diǎn)擊日志了,拉出來處理一下就變成下面這個(gè)樣子,每行就是某個(gè)搜索詞下點(diǎn)擊的商品
key:搜索詞Aclick:結(jié)果A結(jié)果B結(jié)果C
這個(gè)樣子和上面第二種方法最后出來的樣子基本一樣,不過這次是點(diǎn)擊數(shù)據(jù),相關(guān)性可比直接的搜索結(jié)果要好很多了,因?yàn)樗阉鹘Y(jié)果取決于你的搜索算法,而這種點(diǎn)擊數(shù)據(jù)是來自用戶的,人的可靠性可高了不少,所以說這個(gè)是上一個(gè)的加強(qiáng)版。
我們可以按照上一個(gè)的方法按文本相似性的方法進(jìn)行處理,但是計(jì)算量也比較大,如果再仔細(xì)看看這個(gè)數(shù)據(jù)的樣子,如果我們把相關(guān)搜索系統(tǒng)想象成豆瓣,搜索詞看成豆瓣的用戶,搜索結(jié)果集看成是豆瓣的電影,那么相關(guān)搜索就變成了一個(gè)豆瓣的猜你感興趣的人,也變成了一個(gè)協(xié)同過濾的推薦系統(tǒng)了(協(xié)同過濾算法可以參考文章最后的鏈接),上一節(jié)的協(xié)同過濾算法的數(shù)據(jù)是詞和后繼詞,這里是詞和點(diǎn)擊結(jié)果,雖然數(shù)據(jù)集不同,但是可以用一樣的算法,所以,搜索和推薦技術(shù)其實(shí)是密不可分的,既然這樣,完全可以用協(xié)同過濾算法進(jìn)行推薦了。
協(xié)同過濾的算法,簡單版本整體不會超過200行,很容易實(shí)現(xiàn)的。
通過這樣的方式,容易推出意思相近的詞,同樣也容易推出看似完全不相關(guān)但仔細(xì)想想還是靠譜的詞,就像下面這樣,他們雖然不見得近義詞,但是很可能會點(diǎn)擊到同一個(gè)結(jié)果上。
分形:分形理論|分形圖像|分形數(shù)學(xué)
機(jī)器學(xué)習(xí):吳恩達(dá)|數(shù)據(jù)挖掘|機(jī)器學(xué)習(xí)周志華
林心如:霍建華|任重|何潤東.......
機(jī)器學(xué)習(xí)
既然上面提到了一下機(jī)器學(xué)習(xí),其實(shí)還有更高端一點(diǎn)的算法,就是用機(jī)器學(xué)習(xí)了,呵呵。我們?nèi)绻焉厦娴慕Y(jié)果key:搜索詞Aclick:結(jié)果A結(jié)果B結(jié)果C處理一下,變成下面的樣子,表示每個(gè)結(jié)果集對應(yīng)的搜索詞。
結(jié)果A:搜索詞A搜索詞B搜索詞C....
結(jié)果B:搜索詞B搜索詞A搜索詞D.....
變成上面這個(gè)樣子難度不大吧,就是做個(gè)倒排就行了,好了,我們把一行看成一篇文檔,每個(gè)搜索詞看成一個(gè)詞,不就是求各個(gè)詞的相似性嘛,祭出神器Word2Vec,直接計(jì)算每個(gè)搜索詞的詞向量,然后計(jì)算各個(gè)詞向量之間的相似性,就可以算出每個(gè)詞應(yīng)該推薦的詞了。
在這里,我們使用了當(dāng)前最火的機(jī)器學(xué)習(xí)哦,如果用word2vec的庫來實(shí)現(xiàn)的話,代碼同樣不超過20行,呵呵,word2vec我之前的文章也有說過,可以看看底部的鏈接
模型MIX
上面說了四種模型,如果使用呢?呵呵,相關(guān)搜索不是有很多詞嘛,很簡單拉,每個(gè)模型分幾個(gè)詞,看看哪個(gè)模型效果好,哪個(gè)模型出來的詞用戶點(diǎn)得多再調(diào)整唄,我們看看京東,搜索資治通鑒的時(shí)候他們的相關(guān)搜索如下。
我估計(jì)啊資治通鑒中華書局,資治通鑒柏楊這種就是第一種模型推出來的,就是后繼詞部分推薦出來的,而史記,二十四史這類應(yīng)該就是通過協(xié)同過濾推薦出來的,至于是哪種協(xié)同過濾就不好推測了。
二,刷搜索刷下拉框和百度分享原理
刷搜索刷下拉框原理
搜索引擎下拉框:當(dāng)用戶在搜索框中輸入一個(gè)詞的時(shí)候,搜索引擎搜索框會智能匹配出與搜索詞相關(guān)的,并且達(dá)到一定搜索量的后繼詞。通常有10個(gè)以內(nèi)的后繼詞推薦出現(xiàn)。
百度搜索下拉框:又叫百度聯(lián)想?yún)^(qū),百度推薦詞,百度下拉菜單。
搜索引擎下拉框原理:
搜索引擎會從自有詞典和用戶行為產(chǎn)生的巨大搜索詞中,生成搜索引擎推薦詞庫,當(dāng)用戶搜索的關(guān)鍵詞在推薦詞庫中有匹配詞的時(shí)候,就會動態(tài)的生成后繼詞的推薦菜單,并且按搜索量從高到低依次排序,最大數(shù)量為十條。
刷搜索引擎下拉框注意幾個(gè)關(guān)鍵點(diǎn):MAC地址,IP地址,瀏覽器COOKIES,搜索行為多樣性,做到從設(shè)備,軟件,到用戶的模仿
真實(shí)用戶的搜索行為。
關(guān)鍵詞和后繼詞搜索量十分大的時(shí)候,基本沒有辦法完成成本很高,所以只有刷本身流量比較少的關(guān)鍵詞。
刷百度分享原理
百度分享的官方定義和作用:
第一:引入社會化流量,用戶將網(wǎng)站內(nèi)容分享到第三方網(wǎng)站,第三方網(wǎng)站的用戶點(diǎn)擊專有的分享鏈接,從第三方網(wǎng)站帶來社會化流量。
第二:提升網(wǎng)頁抓取速度,使用了百度分享的網(wǎng)頁可以更快地被百度爬蟲發(fā)現(xiàn),從而幫助網(wǎng)站的內(nèi)容更快地被百度抓取。
第三:展示網(wǎng)頁分享量,使用了百度分享的網(wǎng)頁被用戶分享后,可以使該網(wǎng)頁被分享的次數(shù)展示在百度的搜索結(jié)果頁中,輔助用戶判斷網(wǎng)頁質(zhì)量,提高點(diǎn)擊率。
刷百度分享的方法:
第一:加入互刷群,這樣就可以保證分享IP的廣泛性。
第二:提高分享的真實(shí)性,需要從搜索引擎搜索相應(yīng)關(guān)鍵詞進(jìn)入網(wǎng)站,停留時(shí)間,瀏覽量要自然,每個(gè)訪客的獨(dú)特性,然后再分享。
第三:注意分享之后的回流,也就是說當(dāng)你收藏分享之后,最好在從分享頁面經(jīng)常回來瀏覽網(wǎng)站。
第四:注意分享的頻率,要穩(wěn)定,程序漸漸的增加。
第五:用軟件刷分享。
申請創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!