您好,登錄后才能下訂單哦!
這篇文章主要為大家展示了“SQLite3如何實現數據庫全文搜索”,內容簡而易懂,條理清晰,希望能夠幫助大家解決疑惑,下面讓小編帶領大家一起研究并學習一下“SQLite3如何實現數據庫全文搜索”這篇文章吧。
對于應用軟件開發人員來說,要解決這個問題有許多的方案可以選擇。如,利用 MySQL 和 PostgreSQL 或者 Sphinx 和 Lucene 這樣的獨立軟件進行本地執行。然而,這些要么用起來棘手,要么就過度了。
幸運的是,Google 為 SQLite 貢獻了一些資源以實現幫助。在版本 3.3.8 中第一次實現全文檢索。此版本提供的功能可以創建一個依賴于外部延伸的虛擬表:在這里,全文搜索運算法則可用于任何虛擬表內的文本列。在PHP 5.3.0中,對應的支持只被默認的 PDO 和 SQLite3 激活。較早版本的PHP可以使用 PECL 的 SQLite3 擴展庫。
并安裝 SQLite 最新版本
# wget http://www.sqlite.org/sqlite-amalgamation-3.6.22.tar.gz
# tar -zxvf sqlite-amalgamation-3.6.22.tar.gz
# cd sqlite-3.6.22/
# CFLAGS="-DSQLITE_ENABLE_FTS3=1" ./configure
# make
# make install
完成
查看版本
# sqlite3 --version
創建一個搜索索引通常情況如下:
把文本分解成記號。
轉換為小寫字母。
確定根詞。
建立索引。
在默認情況下,SQLite 提供了兩個基本的分詞器,Simple 和 Porter。它們可以控制字的分開方式。Simple 根據空格和標點符號將文本分解成不同的記號。Porter是專為英文使用而設計,它可以將大量的文字擴展化解為基礎形式。例如,condolidate,consolidated,和 consolidating 這一類詞語都會被轉變成consolid。
遺憾的是,SQLite目前還沒有取消停用詞。所以常用詞,例如,the,of和to仍位于索引內。這會極大地擴充索引的范疇并減緩搜索速度。最簡單的解決辦法是,在按下確認檢索之前手動除去停用詞。
下面,向您展示一些代碼,教你如何創建自己的第一個全文索引。 SQLite之所以做到這些,是因為它通過使用FTS3擴展建立一個虛擬表。只有文本列位于這個虛擬表以內時,才可以被搜索,并且最后一列用來識別使用的分詞器類型。
CREATE VIRTUAL TABLE example
USING FTS3(title TEXT, TOKENIZE SIMPLE)
創建表后,您可以使用 SELECT, INSERT,UPDATE 和 DELETE 語句查詢此表。此處要附加說明的是:沒有進一步的索引可以建立在表格上,所以簡單的查詢將導致對全表的掃描。
一旦你鍵入一些數據,你就可以試試。
本文中其余的例子,我會使用出自英文版維基百科的所有標題。
我的有 5,453,838 行,相比較于沒有索引時的 146MB,若使用全文索引,其大小是 233MB。
檢索
搜索索引由匹配操作完成。查詢可以包含多個方面,在這種情況下,只有文字行包含所有條件時才返回。還有支持“OR”的查詢,但該查詢排除了條件,精確的詞組匹配以及前綴檢索。
SELECT rowid, title FROM example WHERE title MATCH tea bag
SELECT rowid, title FROM example WHERE title MATCH tea OR bag
SELECT rowid, title FROM example WHERE title MATCH tea -bag
SELECT rowid, title FROM example WHERE title MATCH "tea bag"
SELECT rowid, title FROM example WHERE title MATCH tea*
請注意:OR區分大小寫,并且在一次查詢中只允許一個MATCH操作。
創建片段
為了向匹配的搜索結果提供語境,可以使用 snippet() 功能。這一功能將突出顯示搜索結果中任何文字列的關鍵詞。
SELECT title, snippet(example)
FROM example
WHERE <span sty
以上是“SQLite3如何實現數據庫全文搜索”這篇文章的所有內容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內容對大家有所幫助,如果還想學習更多知識,歡迎關注億速云行業資訊頻道!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。