91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

hadoop-streaming是什么

發布時間:2021-12-08 10:09:47 來源:億速云 閱讀:153 作者:小新 欄目:云計算

這篇文章給大家分享的是有關hadoop-streaming是什么的內容。小編覺得挺實用的,因此分享給大家做個參考,一起跟隨小編過來看看吧。

Hadoop Streaming是Hadoop提供的一個編程工具,它允許用戶使用任何可執行文件或者腳本文件作為Mapper和Reducer,例如:

采用shell腳本語言中的一些命令作為mapper和reducer(cat作為mapper,wc作為reducer)

bin/hadoop jar contrib/streaming/hadoop-0.20.2-streaming.jar -input
input -output output -mapper /bin/cat -reducer /usr/bin/wc

mapper和reducer會從標準輸入中讀取用戶數據,一行一行處理后發送給標準輸出。Streaming工具會創建MapReduce作業,發送給各個tasktracker,同時監控整個作業的執行過程。

如果一個文件(可執行或者腳本)作為mapper,mapper初始化時,每一個mapper任務會把該文件作為一個單獨進程啟動,mapper任務運行時,它把輸入切分成行并把每一行提供給可執行文件進程的標準輸入。 同時,mapper收集可執行文件進程標準輸出的內容,并把收到的每一行內容轉化成key/value對,作為mapper的輸出。 默認情況下,一行中第一個tab之前的部分作為key,之后的(不包括tab)作為value。如果沒有tab,整行作為key值,value值為null。

對于reducer,類似。

以上是Map/Reduce框架和streaming mapper/reducer之間的基本通信協議。

Hadoop Streaming用法

Usage: $HADOOP_HOME/bin/hadoop jar \

$HADOOP_HOME/contrib/streaming/hadoop-*-streaming.jar [options]

options:

(1)-input:輸入文件路徑

(2)-output:輸出文件路徑

(3)-mapper:用戶自己寫的mapper程序,可以是可執行文件或者腳本

(4)-reducer:用戶自己寫的reducer程序,可以是可執行文件或者腳本

(5)-file:打包文件到提交的作業中,可以是mapper或者reducer要用的輸入文件,如配置文件,字典等。

(6)-partitioner:用戶自定義的partitioner程序

(7)-combiner:用戶自定義的combiner程序(必須用java實現)

(8)-D:作業的一些屬性(以前用的是-jonconf),具體有:
            1)mapred.map.tasks:map task數目
            2)mapred.reduce.tasks:reduce task數目
            3)stream.map.input.field.separator/stream.map.output.field.separator: map task輸入/輸出數
據的分隔符,默認均為\t。
             4)stream.num.map.output.key.fields:指定map task輸出記錄中key所占的域數目
             5)stream.reduce.input.field.separator/stream.reduce.output.field.separator:reduce task輸入/輸出數據的分隔符,默認均為\t。
             6)stream.num.reduce.output.key.fields:指定reduce task輸出記錄中key所占的域數目
另外,Hadoop本身還自帶一些好用的Mapper和Reducer。

感謝各位的閱讀!關于“hadoop-streaming是什么”這篇文章就分享到這里了,希望以上內容可以對大家有一定的幫助,讓大家可以學到更多知識,如果覺得文章不錯,可以把它分享出去讓更多的人看到吧!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

集安市| 平泉县| 皮山县| 迁西县| 兴业县| 花莲县| 东光县| 玛纳斯县| 集贤县| 松原市| 鲁甸县| 彝良县| 新昌县| 乐至县| 四平市| 商河县| 泰和县| 谢通门县| 桂阳县| 华容县| 盐源县| 河西区| 万全县| 太谷县| 万年县| 金寨县| 牙克石市| 闻喜县| 越西县| 乐山市| 思南县| 新余市| 哈尔滨市| 沭阳县| 崇信县| 保山市| 峡江县| 涞水县| 桃源县| 大埔区| 青浦区|