您好,登錄后才能下訂單哦!
InfluxDB是一款Go語言寫的時序數據庫。時序數據庫主要用于存儲基于時間序列的指標數據,例如一個Web頁面的PV、UV等指標,將其定期采集,并打上時間戳,就是一份基于時間序列的指標。時序數據庫通常用來配合前端頁面來展示一段時間的指標曲線。
時序數據庫較傳統的關系型數據庫以及NoSQL究竟有什么優勢,下面會結合相關模型的特性進行分析
LSM tree是基于Google的BigTable架構,數據以K-V方式存儲。
寫數據首先會插入到內存中的樹。當內存中的樹中的數據超過一定閾值時,會進行合并操作。合并操作會從左至右遍歷內存中的樹的葉子節點與磁盤中的樹的葉子節點進行合并,當被合并的數據量達到磁盤的存儲頁的大小時,會將合并后的數據持久化到磁盤,同時更新父親節點對葉子節點的指針。
這種機制保證了寫入的效率,因為數據會在合并后順序寫入磁盤頁。但會推遲磁盤回寫,因此為保障讀數據的一致性,會先在內存中查詢,如果內存中沒有,則到磁盤上查詢。
刪除數據時,在內存(C0)中查找,如果沒有,則在內存中新建一個索引,將鍵值設置刪除標記(創建墓碑),這樣后續的滾動合并操作時,再有查詢操作,就會被直接返回該鍵值不存在。 數據會在之后的Compaction當中從數據文件中刪除。
當日志文件超過一定大小的閾值是 (默認為 1MB):
建立一個新的memtable和日志文件,以后的操作都是用新的memtable和日志文件
后臺進行如下操作:
將舊的 memtable寫到SSTable中(過程為先轉為immtable_table,然后遍歷寫入)
廢棄舊的 memtable
刪除舊的 memtable和日志文件
將新的SSTable加到level 0中.
對于時序數據而言,LSM tree的讀寫效率很高。但是熱備份以及數據批量清理的效率不高。
B+ Tree,很多關系型數據庫像 Berkerly DB , sqlite , mysql 數據庫都使用了B+樹算法處理索引。B+ Tree的特點是數據按照索引有序排放,犧牲一定寫入性能,保證了讀取效率。但數據量很大時(GB),查詢效率就會很低。因為數據量越大,樹分叉就越多,遍歷時的開銷就越大。
influxdb在v0.9.5版本引入TSM引擎,該引擎修改自LSM
當前日志文件達到2MB大小后封閉,并開始寫新的日志文件
寫數據時,日志文件落盤(fsync)且數據索引加入內存表后返回成功。這樣的設計保證了數據的一致性。同時對寫盤的吞吐性能提出要求,建議批量提交數據(influxdb提供了批量提交的API)。日志遵循TLV格式,并采用較精簡的數據結構,來減少寫操作的開銷。
文件結構
一個文件的中數據塊按照時序進行排列
對照LevelDB的結構,增加了min和max time, 基于一段時間范圍的數據提取會非常簡單
Data Block結構
ID由存放的key (measurement name + tagset) 以及 field name進行hash(fnv64-a hash)生成
Compressd block當中會存儲metric值,數據壓縮算法后面會進行詳述
Index Block結構
首先會根據查詢請求的時間范圍,在數據文件中進行二進制搜索,找到符合范圍的文件。之后在內存中的映射表根據查詢指標項HASH獲取ID,并通過索引找到數據塊的起始地址。之后根據數據塊及其下一數據塊的timestamp我們可以推算出需要取出多少個數據塊,最后將數據塊中的數據解壓,得到結果
如果多個更新在同一個時間范圍內,預寫日志會緩存起來一起更新。
兩階段式處理,第一階段,預寫日志會將其持久化在日志中,并通知索引維護內存中的墓碑. 此時查詢數據,就會返回不存在。第二階段,預寫日志寫索引文件,會優先處理刪除,之后再處理刪除操作之后的其他插入(包括刪除的序列以及其他序列),并清除內存中的墓碑。
數據壓縮的目的是為了減少存儲空間以及降低寫磁盤的開銷
每個壓縮數據塊當中會包含一個系列的點(壓縮時間戳、壓縮值), 因為時間戳是一個單調遞增的序列,因此壓縮時填入的時間的偏移量
influxdb的數據存儲結構實現了數據基于系列以及時間戳2個維度的有序存取。并通過壓縮數據來降低I/O開銷。在取一個系列在一定時間范圍內的數據這個場景下,能夠提高處理速度。 由于數據按時間進行歸并,對Retention操作而言,可以以數據文件為單位進行操作,效率會比較高。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。