搜索引擎面對的用戶大部分是通過鍵入關(guān)鍵詞返回一個列表頁面,這個結(jié)構(gòu)頁面是大量的搜索索引庫而建立起來的。當然這里這個頁面是指自然搜索結(jié)果。那么搜索引擎是如何完成排名這以環(huán)節(jié)的呢?
一、對匹配網(wǎng)頁排名
為匹配的網(wǎng)頁排序,其實就是搜索引擎對匹配的網(wǎng)頁進行篩選,挑選的過程,然后按照一定的順序整理出結(jié)構(gòu)的行為。當然搜索引擎都會給每個網(wǎng)頁一個值,即權(quán)重(
SEO-er們自我定義),通過判斷該網(wǎng)頁對搜索引擎和用戶體驗的價值進行排序排名。提高排名的因素多種多樣,目前基本上是參考HITS算法,TrustRank信任指數(shù)算法、PR值等等。
二、匹配搜索請求
當搜索引擎接收到搜索請求詳細分析之后,便會匹配URL(當然重點是標題和摘要片段),匹配的URL成千上萬個,怎樣才能有序顯示出來了,這就需要搜索引擎按URL的匹配程度排序。
三、對提交的搜索請求分析
搜索用戶在搜索引擎上鍵入關(guān)鍵詞,提交搜索請求,一步一步找到匹配的網(wǎng)頁顯示出來。當我們鍵入關(guān)鍵詞提交(按下回車)給搜索引擎時,搜索引擎便會對這次搜索請求進行詳細分析。
1、中文分詞
中文分詞是各大搜索引擎中重要的環(huán)節(jié),中文分詞能夠更加明確掌握搜索請求的重點所在,時期更好地頁面展示給搜索用戶。
百度中文分詞常見的以下三種:
a、基于字符串匹配
在基于字符串匹配中正向更大
匹配法、逆向更大
匹配法、更
少切分這三種又比較常見。
正向更大
匹配法:利用關(guān)鍵詞查詢的時候,在百度排名
位的是以標題和搜索的長尾詞相符合,說明在網(wǎng)站條件相當?shù)那闆r下,先顯示標題匹配的網(wǎng)頁。
逆向更大
匹配法:剛剛是正向更大
匹配法相反的規(guī)則,即從右往左反向進行拆分和組合。
更
少切分:更
小切分就是將一個個詞組切分為更
細化,甚者會一個字出現(xiàn)。
b、理解分詞方法
理解分詞方法:搜索引擎模擬人的思維,對其語句的理解進行分詞技術(shù)。通過對存儲的詞語和語句的整合,進行分詞理解。其基本思想就是在分詞的同時進行句法、語義分析,利用句法信息和語義信息來處理歧義現(xiàn)象。它通常包括三個部分:分詞子系統(tǒng)、句法語義子系統(tǒng)、總控部分。在總控部分的協(xié)調(diào)下,分詞子系統(tǒng)可以獲得有關(guān)詞、句子等的句法和語義信息來對分詞歧義進行判斷,即它模擬了人對句子的理解過程。
c、統(tǒng)計分詞方法
相鄰的字同時出現(xiàn)的次數(shù)越多,中文分詞就會可能把出現(xiàn)相鄰的字當成你一個詞。我們常常不是使用粗體,女包批發(fā)黑體這些嗎?原因還在于這對于搜索引擎理解同樣有利。
2、去掉停止詞
搜索用戶在鍵入關(guān)鍵詞時,或多或少會出現(xiàn)不少停止詞,像“的”“嗎”,這樣才能更大
限度的顯示更
相關(guān),更
能夠滿足用戶體驗的結(jié)果頁面。
3、處理符號
搜索引擎還是很看重標點符號的,因此我們
SEO-er在編輯文章的時候,應(yīng)當注意標點符號的合理使用,尤其是在文章標題上。
seo指南:SEO代表搜索引擎優(yōu)化,簡單來說就是利用搜索引擎的算法規(guī)則,讓我們的網(wǎng)站進入百度排名前幾頁的一種營銷手段。 營銷人員使用一系列seo策略,嘗試將自然流量吸引到其網(wǎng)站并提高搜索排名。seo方法通常涉及頁面內(nèi)和頁面外優(yōu)化
版權(quán)聲明:本站部分文章,由 鄭州路普科技整理發(fā)表(信息來自互聯(lián)網(wǎng),不代表本站觀點),如有冒犯請聯(lián)系我們