91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好，登錄后才能下訂單哦！

密碼登錄×

忘記密碼？

登錄注冊×

獲取短信驗證碼

其他方式登錄

點擊登錄注冊即表示同意《億速云用戶服務條款》

用戶登錄×

賬戶密碼登錄

請使用微信掃描上方二維碼

使用幫助

請求超時！

請點擊重新獲取二維碼

記一次hadoop大數據導出

發布時間：2020-07-21 05:04:27 來源：網絡閱讀：4744 作者：lejie851112 欄目：大數據

需求：導出一個月數據提供測試分析

實施：

直接hive -e “xxxxx”> testdata.txt

然后看輸出信息，map%1 %2 %3...... %100，但是reduce一直是0%，等啊等，等了十幾個小時，還是0%，最后殺掉進程，再試了幾次，現象一樣，可知每次等十幾個小時，一轉眼，兩天了。

于是懷疑集群有問題，排查了好久，沒發現問題。

又懷疑where條件有問題，折騰了半天還是一樣。

后來加上了limit先看看有沒有結果，有的話就證明語法沒錯；果然limit 10很快就出來了10條記錄，語法正確。

又接著換了spark去提取，總是報buffer不足，加到原來10倍，還提示不足。

難道數據這么大？

準備count一下，等等等，一個月總共2億8千萬多條，mygod！！！我錯了

于是先用hive導出一天的數據，等等等，重定性寫文件就寫了20分鐘，我心想這得有多少啊，等寫完了用wc -l 一看，800多萬條，文件大小4G，哦哦哦，頓時明白了，不是集群問題，是因為數據太多reduce執行很慢。

最后，估算了每條約是600B，然后每天取1000條，連續取7天，最后文件大小約4MB

命令如下：

hive -e "set hive.cli.print.header=true;use dw;select * from aem where day ='2015-08-24' limit 1000" > aem_pg_8_24_30.txt

hive -e "use dw;select * from aem where day ='2015-08-25' limit 1000" >> aem_pg_8_24_30.txt

hive -e "use dw;select * from aem where day ='2015-08-26' limit 1000" >> aem_pg_8_24_30.txt

hive -e "use dw;select * from aem where day ='2015-08-27' limit 1000" >> aem_pg_8_24_30.txt

hive -e "use dw;select * from aem where day ='2015-08-28' limit 1000" >> aem_pg_8_24_30.txt

hive -e "use dw;select * from aem where day ='2015-08-29' limit 1000" >> aem_pg_8_24_30.txt

hive -e "use dw;select * from aem where day ='2015-08-30' limit 1000" >> aem_pg_8_24_30.txt

收獲：

大數據處理的思路要稍微不同。首先估算數據量，這個很重要；然后確定導出方式，太大的話縮小顆粒度，多次導出。

思路很重要！思路很重要！思路很重要！

向AI問一下細節

推薦閱讀：

免責聲明：本站發布的內容（圖片、視頻和文字）以原創、轉載和分享為主，文章觀點不代表本網站立場，如果涉及侵權請聯系站長郵箱：is@yisu.com進行舉報，并提供相關證據，一經查實，將立刻刪除涉嫌侵權內容。

上一篇新聞：
phonegap+jQuery Mobile開發應用
下一篇新聞：
如何修改遠程桌面連接端口

猜你喜歡

AI
助
手

產品服務

地區劃分

專題活動

幫助支持

關于我們

售后咨詢

7*24小時在線電話：400-100-2938

7*24小時在線 QQ：800811969

關注億速云

億速云公眾號

手機網站二維碼

阳新县| 定兴县| 柳河县| 时尚| 辽源市| 盐城市| 湘潭市| 唐河县| 海城市| 滨海县| 桃园县| 灵丘县| 锡林浩特市| 清河县| 大渡口区| 灌阳县| 南通市| 浑源县| 岳阳县| 盈江县| 宿州市| 宜宾县| 当涂县| 定陶县| 即墨市| 德格县| 剑河县| 柏乡县| 民勤县| 元江| 闽清县| 靖江市| 方正县| 平阴县| 安徽省| 镇原县| 河源市| 桂东县| 博野县| 马山县| 松原市|