您好,登錄后才能下訂單哦!
近期,聽了王家林老師的2016年大數據Spark“蘑菇云”行動,需要將flume,kafka和Spark streaming進行整合。感覺一時難以上手,先從簡單著手吧:
一、netcat方式+Logger日志顯示
Flume 配置文件如下:
# example.conf: A single-node Flume configuration # Name the components on this agent a1.sources = r1 a1.sinks = k1 a1.channels = c1 # Describe/configure the source a1.sources.r1.type = netcat a1.sources.r1.bind = localhost a1.sources.r1.port = 44444 # Describe the sink a1.sinks.k1.type = logger # Use a channel which buffers events in memory a1.channels.c1.type = memory a1.channels.c1.capacity = 1000 a1.channels.c1.transactionCapacity = 100 # Bind the source and sink to the channel a1.sources.r1.channels = c1 a1.sinks.k1.channel = c1
flume的啟動:
$ bin/flume-ng agent --conf conf --conf-file example.conf --name a1 -Dflume.root.logger=INFO,console
觸發數據:
telnet localhost 44444
會在flume的控制臺出現同樣的字符。
二、flume級聯方式
通過avro,在兩臺機器間傳送數據,源頭為netcat
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。