TF-IDF算法是搜索引擎排序過程中一種詞頻和逆文檔頻率統(tǒng)計(jì)算法,而且在樂天SEO培訓(xùn)網(wǎng)也運(yùn)用了這種算法,這也可以說是本人對TF-IDF算法在SEO優(yōu)化中的實(shí)戰(zhàn)應(yīng)用。網(wǎng)上雖然有很多關(guān)于文章對TF-IDF算法解讀,但是都晦澀難懂。
什么是TF-IDF算法?
TF是詞頻(Term Frequency),指在一個詞語在文章中出現(xiàn)的次數(shù)。IDF是逆文本頻率(Inverse Document Frequency),是指總文件數(shù)目除以包含該詞語之文件的數(shù)目。TF-IDF是一種統(tǒng)計(jì)算法,用土話說就是一個詞語在一篇文章中出現(xiàn)次數(shù)越多, 同時在所有文檔中出現(xiàn)次數(shù)越少, 越有辨識度,該關(guān)鍵詞越能夠代表該文章。
TF-IDF在實(shí)戰(zhàn)SEO過程中有用嗎?
可以確定的說是有效的,比如開頭本人就說了這個網(wǎng)站在實(shí)際SEO優(yōu)化過程中運(yùn)用到了TF-IDF算法。目前搜索引擎算法的相關(guān)性還是以TF-IDF為基礎(chǔ)的,雖然現(xiàn)在又有TF-IWF算法,會更復(fù)雜一些,但是搜索引擎算法相關(guān)性的甚而算法還是TF-IDF,只是改進(jìn)算法會復(fù)雜得多。
TF-IDF算法的優(yōu)點(diǎn)是簡單,相對容易理解。TF-IDF算法的缺點(diǎn)也很明顯,就是算法的精度不高。TF-IDF在計(jì)算文件與查詢詞相關(guān)性時,詞頻越高,相關(guān)性越高,越常見的詞,對相關(guān)性貢獻(xiàn)越小。所以在做SEO優(yōu)化時要考慮TF-IDF,但也不能太過在意,正常寫作大多都會符合內(nèi)容相關(guān)性要求了。
最后要說的是,雖然我的網(wǎng)站使用TF-IDF算法暫時排名是在首頁,但是過一段時間排名就很難說了,一方面這些SEO詞是很多SEOer的追求競爭較大,另一方面有很多SEO大佬在做這個詞,我這個網(wǎng)站從建站之后就沒管過,所以排名會被慢慢壓制下去。
本人在這里胡侃一番,建議大家可以利于TF-IDF算法去進(jìn)行大量的長尾關(guān)鍵詞優(yōu)化和擴(kuò)展,如果研究透了這個算法,在SEO實(shí)戰(zhàn)過程中再配合數(shù)據(jù)分析和實(shí)驗(yàn)測試,你會發(fā)現(xiàn)更多奧秘!
文章轉(zhuǎn)自公眾號:SEO實(shí)戰(zhàn)營(ID:ilottecn),原文地址:https://mp.weixin.qq.com/s/kJ-WRF7C28semJVzGa7prA
申請創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!