您好,登錄后才能下訂單哦!
這篇文章給大家分享的是有關搜索引擎檢索的順序是怎樣的的內容。小編覺得挺實用的,因此分享給大家做個參考,一起跟隨小編過來看看吧。
搜索引擎檢索的順序:1、從互聯網上抓取網頁;2、建立索引數據庫;3、在索引數據庫中搜索排序;4、對搜索結果進行處理和排序。
搜索引擎檢索的順序:
搜索引擎是指根據一定的策略,運用特定的計算機程序搜集互聯網上的信息,在對信息進行組織和處理后,為用戶提供檢索服務的系統。搜索引擎并不是真正的互聯網,它搜索的實際上是預先整理好的網頁索引數據庫。真正意義上的搜索引擎,通常指的是收集了互聯網上幾千萬到幾十億個網頁并對我那個也中的每一個詞(即關鍵詞)進行索引。建立索引數據庫的全文搜索引擎。現在的搜索引擎已普遍使用超鏈分析技術,除了分析索引網頁本身的內容,還分析索引所有指向該網頁的鏈接的URL、Anchor、Text,甚至鏈接周圍的文字。所以,有時候,即使某個網頁A中并沒有出現某個詞,比如
“信息檢索”,但如果有網頁B用鏈接“信息檢索”指向這個網頁A,那么用戶搜索“信息檢索”時也能找到網頁A。而且,如果有越多的網頁的“信息檢索”鏈接指向網頁A,那么網頁A在用戶搜索“信息檢索”時也會被認為更相關,排序也會越靠前。
搜索引擎的原理,可以分為四步:從互聯網上抓取網頁、建立索引數據庫、在索引數據庫中搜索排序、對搜索結果進行處理和排序。
(1)、從互聯網上抓取網頁:利用能夠從互聯網上自動收集網頁的蜘蛛系統程序,自動訪問互聯網,并沿著任何網頁中所有URL爬到其他網頁,重復這個過程,并把爬過的所有網頁收集回來。
(2)、建立索引數據庫:由分析索引系統程序對收集回來的網頁進行分析,提取相關網頁信息(包括網頁所在URL、編碼類型、頁面內容包含的關鍵詞、關鍵詞位置、生成時間、大小、與其他網頁的鏈接關系等),并根據一定的相關度算法進行大量的復雜計算,得到每一個網頁針對頁面內容中及超鏈中每一個關鍵詞的相關度(或重要性),然后利用這些相關信息建立網頁索引數據庫。
(3)、在索引數據庫中搜索排序:當用戶輸入關鍵詞后,由搜索系統程序從網頁索引數據庫中找到符合該關鍵詞的所有相關網頁。因為所用相關網頁針對該關鍵詞的相關度早已計算好,所以只需按照現成的相關數值排序,相關度越高,排名越靠前。最后由頁面生成系統將搜索結果的鏈接地址和頁面內容摘要等內容組織起來返回給用戶。
(4)、對搜索結果進行處理排序:所有相關網頁針對該關鍵詞的相關信息在索引庫中都有記錄,只需綜合相關信息和網頁級別形成相關數值度,然后進行排序,相關度越高,排名越靠前。最后由頁面生成系統將搜索結果的鏈接地址和頁面內容摘要等內容組織起來返回給用戶。
感謝各位的閱讀!關于“搜索引擎檢索的順序是怎樣的”這篇文章就分享到這里了,希望以上內容可以對大家有一定的幫助,讓大家可以學到更多知識,如果覺得文章不錯,可以把它分享出去讓更多的人看到吧!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。