91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

從Hive導入數據到ES

發布時間:2020-07-06 04:18:35 來源:網絡 閱讀:34546 作者:sbp810050504 欄目:大數據

大數據方興未艾,Hive在業界,是大數據的標配了。因此hive數據添加到ES的應用場景還是比較常見的。
學習ES官方的es-hadoop, 有從hive導數據到ES. 實驗可行。
hive的版本: hive-1.1.0-cdh6.9.0

具體的步驟如下:
step1 將elasticsearch-hadoop-hive-version.jar添加到hive

wget https://artifacts.elastic.co/downloads/elasticsearch-hadoop/elasticsearch-hadoop-6.3.0.zip
unzip elasticsearch-hadoop-6.3.0.zip
hdfs dfs -mkdir /user/test/es_hadoop/
hdfs dfs -put elasticsearch-hadoop-hive-6.3.0.jar /user/test/es_hadoop/
ADD JAR hdfs://test/user/test/es_hadoop/elasticsearch-hadoop-hive-6.3.0.jar;

step2 創建Hive表:

CREATE EXTERNAL TABLE elastic_table(
   uuid string,
   key1 int,
   key2 int,
   day string
)
STORED BY 'org.elasticsearch.hadoop.hive.EsStorageHandler'
TBLPROPERTIES('es.resource'='index/type',
'es.nodes'='serverIP:port',
'es.index.auto.create'='TRUE',
'es.mapping.id' = 'uuid'
);

step3 添加數據

INSERT OVERWRITE TABLE elastc_table
SELECT uuid, key1,key2, day FROM source s;

為了避免客戶端版本的問題,es-hadoop使用es的restfull接口導入數據,該接口使用的是Http協議。

通常使用ES, 首當其沖的問題就是: 如何快速將海量數據導入ES? 由于ES的數據需要建立倒排索引,所以導入數據到ES的瓶頸往往在ES這里。

本文記錄了將Hive表的數據導入ES的方法。這里背后隱藏了mapreduce,即集群的威力。 這里有個系列博客,講述如何最大限度的挖掘ES索引數據的性能,立足點是ES。

https://qbox.io/blog/series/how-to-maximize-elasticsearch-indexing-performance

作者總結有3點:

  1. 根據應用場景創建mapping, 去除不必要的字段,如_all, _source;
    這里是從應用場景下手,以避免存儲不必要的信息來提升索引數據的性能。

  2. 修改es/lucene默認的設置,比如
    refresh_interval,
    index.number_of_replicas,
    index.merge.scheduler.max_thread_count,
    index.translog.interval,
    indices.memory.index_buffer_size
    index.index_concurrency
    等參數。 這里是從集群的角度進行調優, 通常用于大批量導入數據到ES。

  3. 如果前面兩種還是沒能解決問題,那就需要對集群進行橫向擴展了,比如增加集群的分片數量。
    集群大了后,各個結點的功能就需要單一化,專注化了。

比如節點只承擔數據相關的任務。

node.master: false
node.data: true
node.ingest: false

bulk api的批量值需要實驗,找到最佳參數。建議bulk的大小在5M~10M.

使用SSD硬盤。索引數據時,副本數設置為0。

參考:
http://note4code.com/2016/06/17/hive-%E5%90%91-elasticsearch-%E5%AF%BC%E5%87%BA%E6%95%B0%E6%8D%AE/

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

彭水| 澎湖县| 淄博市| 那坡县| 社旗县| 长宁县| 固始县| 阿克苏市| 永州市| 巨鹿县| 德昌县| 锦州市| 沅江市| 邢台市| 辉南县| 全南县| 龙南县| 仁怀市| 永清县| 新巴尔虎右旗| 昭觉县| 凤翔县| 治多县| 牟定县| 东兴市| 南江县| 江永县| 长海县| 武山县| 曲靖市| 鹿邑县| 北票市| 平果县| 绥棱县| 扶风县| 焦作市| 呼图壁县| 东兴市| 尼玛县| 闸北区| 炉霍县|