您好,登錄后才能下訂單哦!
這篇文章跟大家分析一下“分布式內存文件系統Tachyon是怎樣的”。內容詳細易懂,對“分布式內存文件系統Tachyon是怎樣的”感興趣的朋友可以跟著小編的思路慢慢深入來閱讀一下,希望閱讀后能夠對大家有所幫助。下面跟著小編一起深入學習“分布式內存文件系統Tachyon是怎樣的”的知識吧。
Tachyon是一個分布式內存文件系統,可以在集群里以訪問內存的速度來訪問存儲在Tachyon里的文件。Tachyon是架構在最底層的分布式文件系統和上層的各種計算框架之間的一種中間件,其主要職責是將那些不需要落地到DFS里的文件,落地到分布式內存文件系統中,來達到共享內存,從而提高效率,減少內存冗余,減少GC時間等。
Tachyon的架構是傳統的Master—Slave架構,這里和Hadoop類似,TachyonMaster里WorkflowManager是 Master進程,因為是為了防止單點問題,所以通過Zookeeper做了HA,可以部署多臺Standby Master。Slave是由Worker Daemon和Ramdisk構成。Ramdisk使用off heap memory。Master和Worker直接的通訊協議是Thrift。
下圖是Tachyon的架構:
Tachyon的容錯機制是怎么樣的呢?
Tachyon使用lineage這個我們在Spark的RDD里已經很熟悉的概念,通過異步的向Tachyon的底層文件系統做Checkpoint。
當我們向Tachyon里面寫入文件的時候,Tachyon會在后臺異步的把這個文件給checkpoint到它的底層存儲,比如HDFS,S3.. etc...
這里用到了一個Edge的算法,來決定checkpoint的順序。
比較好的策略是每次當前一個checkpoint完成之后,就會checkpoint一個最新生成的文件。當然像Hadoop,Hive這樣的中間文件,需要刪除的,是不需要checkpoint的。
如下圖所示:
關于重新計算時,資源的分配策略:
目前Tachyon支持2種資源分配策略:
1、優先級的資源分配策略
2、公平調度的分配策略
關于分布式內存文件系統Tachyon是怎樣的就分享到這里啦,希望上述內容能夠讓大家有所提升。如果想要學習更多知識,請大家多多留意小編的更新。謝謝大家關注一下億速云網站!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。