91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

Flume有什么用

發布時間:2021-12-09 09:10:33 來源:億速云 閱讀:323 作者:小新 欄目:云計算

這篇文章主要介紹了Flume有什么用,具有一定借鑒價值,感興趣的朋友可以參考下,希望大家閱讀完這篇文章之后大有收獲,下面讓小編帶著大家一起了解一下。

flume是做收集的,可以把它理解為一個數據的轉換者,從本地把數據讀取,然后轉化到hdfs分布式文件系統上,目的是把兩個系統的文件做一個對接;類似于sqoop做數據庫的對接,它把mysql的數據庫轉到hdfs上或Hbase上。

Flume相當于一根管子,里面流的是數據 ,進去的目錄-source(本地目錄),Flume進來監控的是本地目錄;出去的目錄-sink(HDFS目錄,分布式文件系統上);

Spooling Directory Source注意事項:

Flume進來監控的是本地目錄,本地里有一個監控的目錄,本地目錄中的文件要是變化才可以。不能直接監控到nginx服務器,它上面會產生日志,它一直在讀寫,nginx產生日志,進行真正滾動后,比如10分鐘生成一個文件,這時,你把它mv 或 copy到 本地要監控的目錄,flume不能監控目錄中文件內容是一直變化的,只能監控文件的個數的變化,flume一看個數變化,它才把日志抓過來。

最近兩天,仔細的看了一下Flume中央日志系統(版本號:1.3.X),Flume在本人看來,還是一個非常不錯的日志收集系統的,其設計理念非常易用,簡潔。并且是一個開源項目,基于Java語言開發,可以進行一些自定義的功能開發。運行Flume時,機器必須安裝裝JDK6.0以上的版本,并且,Flume目前只有Linux系統的啟動腳本,沒有Windows環境的啟動腳本。  
       Flume有什么用   

Flume主要由3個重要的組件購成:  
       Source:完成對日志數據的收集,分成transtion 和 event 打入到channel之中。  
      Channel:主要提供一個隊列的功能,對source提供中的數據進行簡單的緩存。  
      Sink:取出Channel中的數據,進行相應的存儲文件系統,數據庫,或者提交到遠程服務器。  
對現有程序改動最小的使用方式是使用是直接讀取程序原來記錄的日志文件,基本可以實現無縫接入,不需要對現有程序進行任何改動。  
對于直接讀取文件Source,有兩種方式:  
      ExecSource:以運行Linux命令的方式,持續的輸出最新的數據,如tail -F 文件名指令,在這種方式下,取的文件名必須是指定的。  
      SpoolSource:是監測配置的目錄下新增的文件,并將文件中的數據讀取出來

需要注意兩點: 

1、拷貝到spool目錄下的文件不可以再打開編輯。

2、spool目錄下不可包含相應的子目錄。 在實際使用的過程中,可以結合log4j使用,使用log4j的時候,將log4j的文件分割機制設為1分鐘一次,將文件拷貝到spool的監控目錄。log4j有一個TimeRolling的插件,可以把log4j分割的文件到spool目錄。基本實現了實時的監控。Flume在傳完文件之后,將會修改文件的后綴,變為.COMPLETED(后綴也可以在配置文件中靈活指定)  
ExecSource,SpoolSource對比:

ExecSource可以實現對日志的實時收集,但是存在Flume不運行或者指令執行出錯時,將無法收集到日志數據,無法何證日志數據的完整性。

SpoolSource雖然無法實現實時的收集數據,但是可以使用以分鐘的方式分割文件,趨近于實時。如果應用無法實現以分鐘切割日志文件的話,可以兩種收集方式結合使用。  

Channel有多種方式:有MemoryChannel,JDBC Channel,MemoryRecoverChannel,FileChannel。

MemoryChannel可以實現高速的吞吐,但是無法保證數據的完整性。

MemoryRecoverChannel在官方文檔的建議上已經建義使用FileChannel來替換。

FileChannel保證數據的完整性與一致性。

在具體配置實現的FileChannel時,建議FileChannel設置的目錄和程序日志文件保存的目錄設成不同的磁盤,以便提高效率。  

Sink在設置存儲數據時,可以向文件系統中,數據庫中,hadoop中儲數據(HDFS、HBase),在日志數據較少時,可以將數據存儲在文件系中,并且設定一定的時間間隔保存數據。在日志數據較多時,可以將相應的日志數據存儲到Hadoop中,便于日后進行相應的數據分析。 

感謝你能夠認真閱讀完這篇文章,希望小編分享的“Flume有什么用”這篇文章對大家有幫助,同時也希望大家多多支持億速云,關注億速云行業資訊頻道,更多相關知識等著你來學習!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

孝昌县| 武强县| 稻城县| 晋城| 渭源县| 乐山市| 阿鲁科尔沁旗| 阿拉善左旗| 延寿县| 勃利县| 乌兰察布市| 新巴尔虎右旗| 开原市| 金川县| 临桂县| 泰宁县| 博湖县| 涞源县| 方城县| 东源县| 丘北县| 西充县| 镇巴县| 观塘区| 措勤县| 威远县| 汉寿县| 平乐县| 韶关市| 韶山市| 新津县| 新闻| 子长县| 威信县| 儋州市| 齐河县| 方正县| 大同市| 广东省| 平顺县| 双江|