91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

怎樣解析MapReduce中的Map輸入的分片

發布時間:2021-11-25 17:30:38 來源:億速云 閱讀:131 作者:柒染 欄目:互聯網科技

怎樣解析MapReduce中的Map輸入的分片,相信很多沒有經驗的人對此束手無策,為此本文總結了問題出現的原因和解決方法,通過這篇文章希望你能解決這個問題。

回顧:

在一個電話面試之中,對方提到了:Map階段的分片處理。由于在溝通之中有些許緊張,在對方問及:Map分片的算法過程能否簡單的描述?這個問題,由于對方選取了 Map算法的用詞,一時間思路被誘導了,想到的只有shuffle,以及hash分區,和boolean過濾器等。

而事實上,一個 輸入的分片,在MapReduce之中被稱為”split“就是單個Map處理的塊,每一個Map的操作都只是處理一個輸入分片。每個分片被劃分為若干個記錄,并且,每條記錄就是一個鍵值對。Map一個一個的來處理這些數據。事實上,如果單純在是否數據一條條來被處理意外,這和Storm是沒有多大的區別的。而這里的Split 也就是通常數據處理之中的segment,  一個輸入的分片可以對應于同一個表上的若干行。 而一條數據對于與一行。

輸入分片被包裝稱為了一個java 的interface

public interface InputSplit extends Writable
{

    long getLength() throws IOException;
    String[] getLocation() throws IOException

}

通常你也不需要自己來處理這個分片 ,分片是由于 InputFormat來創建的,InputFormat負責產生輸入的分片并將他們分割為記錄。

另外一個關鍵的地方是 RecordReader。 RecorderReader 也就是我們所說的記錄迭代器。Map任務會用一個記錄的迭代器來生產鍵值隊。

而 InputFormat 才是我們真正的的使用類。

Java 代碼如下:

public interface IntputFormat<k,v>
{

    InputSplit[] getSplit(JobConf,int numSplits) throws IOException;
    
    RecordReader<k,v> getRecordReader(InputSplit split,JobConf conf,Reporter reporter)
    throws IOExcetion
}

    第一個方法,你可以指定NumSplits,當然很多時候指定是無效的。

    第二個方法,你一句getRecordReader來拿到RecordReader;

    面試的感觸:很多時候,技術驅動的公司往往沒有產品的思維。更不用說是市場化的邏輯了。

    一個即將被淘汰的組件,卻成了面試的重點。

看完上述內容,你們掌握怎樣解析MapReduce中的Map輸入的分片的方法了嗎?如果還想學到更多技能或想了解更多相關內容,歡迎關注億速云行業資訊頻道,感謝各位的閱讀!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

乌苏市| 肥乡县| 吴江市| 上虞市| 泗水县| 莒南县| 章丘市| 清苑县| 凯里市| 明光市| 两当县| 许昌市| 易门县| 漾濞| 封开县| 永泰县| 石渠县| 墨玉县| 长兴县| 莲花县| 巫山县| 荔波县| 岐山县| 镇坪县| 新津县| 麻城市| 兰西县| 浦江县| 元朗区| 晴隆县| 南岸区| 洪泽县| 阿图什市| 宝兴县| 临邑县| 房产| 海丰县| 阳城县| 会理县| 石景山区| 鹤山市|