中文分詞的準確與否決定著排名是否相關。就像是查詢搜索引擎優化這個詞,就像是下圖這樣,從快照圖片可以看出這個詞被當成了一個詞。
而谷歌瀏覽器會認為搜索、引擎、優化這是三個詞。這時候,我們需要知道的是,百度的是合理的,因為這是一個完整的意思,可是谷歌在分詞的時候更會偏向于細碎。
就像是好比動名網絡,谷歌上面會將動、名、網絡這三個詞分開,這是由于谷歌的詞典沒有收錄這個詞。
這樣子的不同讓關鍵詞在不一樣的瀏覽器上面展現的不一樣,是其中的一個因素。在百度上面,這些詞能夠一起出現排名會好一點,谷歌就不太看重整體,不太要求這個。而將這三個詞分開在內容中,在谷歌瀏覽器上面還是會有一個好的排名。
所以分詞是根據詞庫的多少、分詞的準確程度與根據這種算法的利弊,并不是分局頁面的,因此作為seoer的工作是極少的。能做的唯一一步是在頁面中通過某種方式對搜索引擎進行一些提示,哪些字需要成為一個詞匯對待,在會有多種意思的時候,就像是標題、h1標簽或者是加黑的詞。
要是文章中講的是和服,那么就可以把這兩個字單獨的加黑。要是是寫的大豆和小麥,那么可以將小麥兩個字加黑。這樣子,搜索引擎在進行分析的時候,可以將加黑的字理解成一個詞。
將停止詞刪除
不管是中國還是外國的語言,在頁面的內容中都會有很多經常出現,可是沒有內容和實際意義的字。就像是助詞:的等,或者是感嘆:那,介詞:然而。這種詞就是停止詞。這是由于這種詞沒有實際的意義。像:a,of等英文詞也是。
在進行索引的時候,會將它們刪除,這樣讓主體的內容更加的明了,讓計算減少。
減少噪聲
在大部分的頁面中,很多的東西都是對總體的主體沒有作用的,就像是字體的版權維護、導航條和廣告。就像是博客中的導航條,每一篇中都會出現分類、瀏覽歷史等等,可是這個文章的主要內容是和這些沒有聯系的。所以這些的內容都是噪聲,會將網站的主要內容沖淡。
必須將他們進行減除,在進行排名的時候忽略掉這些內容。這需要將超文本標記語言標簽對網頁進行分區,找到頁頭、導航、主題、頁尾等。在很多的網站頁面中,經常出現的內容一般是噪聲。消噪后,留下了網頁的主要內容。
相關熱搜詞: