91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

GaussDW如何導入MRS-Hive數據源

發布時間:2021-12-10 11:33:32 來源:億速云 閱讀:156 作者:小新 欄目:大數據

小編給大家分享一下GaussDW如何導入MRS-Hive數據源,相信大部分人都還不怎么了解,因此分享這篇文章給大家參考一下,希望大家閱讀完這篇文章后大有收獲,下面讓我們一起去了解一下吧!

準備環境

已創建DWS集群,需確保MRS和DWS集群在同一個區域、可用區、同一VPC子網內,確保集群網絡互通。

基本流程

本實踐預計時長:1小時,基本流程如下:

1、創建MRS分析集群(選擇Hive、Spark、Tez組件)。

2、通過將本地txt數據文件上傳至OBS桶,再通過OBS桶導入Hive,并由txt存儲表導入ORC存儲表。

3、創建MRS數據源連接。

4、創建外部服務器

5、創建外表。

6、通過外表導入DWS本地表。

一、創建MRS分析集群

1、登錄華為云控制臺,選擇“EI企業智能 > MapReduce服務”,單擊“購買集群”,選擇“自定義購買”,填寫軟件配置參數,單擊“下一步”。

GaussDW如何導入MRS-Hive數據源

2、填寫硬件配置參數,單擊“下一步”。

GaussDW如何導入MRS-Hive數據源

3、填寫高級配置參數如下表,單擊“立即購買”,等待約15分鐘,集群創建成功。

GaussDW如何導入MRS-Hive數據源

二、準備MRS的ORC表數據源

1、本地PC新建一個product_info.txt,并拷貝以下數據,保存到本地。

100,XHDK-A-1293-#fJ3,2017-09-01,A,2017 Autumn New Shirt Women,red,M,328,2017-09-04,715,good
205,KDKE-B-9947-#kL5,2017-09-01,A,2017 Autumn New Knitwear Women,pink,L,584,2017-09-05,406,very good!
300,JODL-X-1937-#pV7,2017-09-01,A,2017 autumn new T-shirt men,red,XL,1245,2017-09-03,502,Bad.
310,QQPX-R-3956-#aD8,2017-09-02,B,2017 autumn new jacket women,red,L,411,2017-09-05,436,It's really super nice
150,ABEF-C-1820-#mC6,2017-09-03,B,2017 Autumn New Jeans Women,blue,M,1223,2017-09-06,1200,The seller's packaging is exquisite
200,BCQP-E-2365-#qE4,2017-09-04,B,2017 autumn new casual pants men,black,L,997,2017-09-10,301,The clothes are of good quality.
250,EABE-D-1476-#oB1,2017-09-10,A,2017 autumn new dress women,black,S,841,2017-09-15,299,Follow the store for a long time.
108,CDXK-F-1527-#pL2,2017-09-11,A,2017 autumn new dress women,red,M,85,2017-09-14,22,It's really amazing to buy
450,MMCE-H-4728-#nP9,2017-09-11,A,2017 autumn new jacket women,white,M,114,2017-09-14,22,Open the package and the clothes have no odor
260,OCDA-G-2817-#bD3,2017-09-12,B,2017 autumn new woolen coat women,red,L,2004,2017-09-15,826,Very favorite clothes
980,ZKDS-J-5490-#cW4,2017-09-13,B,2017 Autumn New Women's Cotton Clothing,red,M,112,2017-09-16,219,The clothes are small
98,FKQB-I-2564-#dA5,2017-09-15,B,2017 autumn new shoes men,green,M,4345,2017-09-18,5473,The clothes are thick and it's better this winter.
150,DMQY-K-6579-#eS6,2017-09-21,A,2017 autumn new underwear men,yellow,37,2840,2017-09-25,5831,This price is very cost effective
200,GKLW-l-2897-#wQ7,2017-09-22,A,2017 Autumn New Jeans Men,blue,39,5879,2017-09-25,7200,The clothes are very comfortable to wear
300,HWEC-L-2531-#xP8,2017-09-23,A,2017 autumn new shoes women,brown,M,403,2017-09-26,607,good
100,IQPD-M-3214-#yQ1,2017-09-24,B,2017 Autumn New Wide Leg Pants Women,black,M,3045,2017-09-27,5021,very good.
350,LPEC-N-4572-#zX2,2017-09-25,B,2017 Autumn New Underwear Women,red,M,239,2017-09-28,407,The seller's service is very good
110,NQAB-O-3768-#sM3,2017-09-26,B,2017 autumn new underwear women,red,S,6089,2017-09-29,7021,The color is very good 
210,HWNB-P-7879-#tN4,2017-09-27,B,2017 autumn new underwear women,red,L,3201,2017-09-30,4059,I like it very much and the quality is good.
230,JKHU-Q-8865-#uO5,2017-09-29,C,2017 Autumn New Clothes with Chiffon Shirt,black,M,2056,2017-10-02,3842,very good

2、登錄OBS控制臺,單擊“創建桶”,填寫以下參數,單擊“立即創建”。

GaussDW如何導入MRS-Hive數據源

3、等待桶創建好,單擊桶名稱,選擇“對象 > 上傳對象”,將product_info.txt上傳至OBS桶。

4、切換回MRS控制臺,單擊創建好的MRS集群名稱,進入“概覽”,單擊“IAM用戶同步”所在行的“單擊同步”,等待約5分鐘同步完成。

5、回到MRS集群頁面,單擊“節點管理”,單擊任意一臺master節點,進入該節點頁面,切換到“彈性公網IP”,單擊“綁定彈性公網IP”,勾選已有彈性IP并單擊“確定”,如果沒有,請創建。記錄此公網IP。

6、確認主master節點。

  • 使用SSH工具以root用戶登錄以上節點,root密碼為Huawei_12345,切換到omm用戶。

  • su - omm

  • 執行以下命令查詢主master節點,回顯信息中“HAActive”參數值為“active”的節點為主master節點。

  • sh ${BIGDATA_HOME}/om-0.0.1/sbin/status-oms.sh

7、使用root用戶登錄主master節點,切換到omm用戶,并進入Hive客戶端所在目錄。

  • su - omm

  • cd /opt/client

8、在Hive上創建存儲類型為TEXTFILE的表product_info。

  • 在/opt/client路徑下,導入環境變量。

  • source bigdata_env

  • 登錄Hive客戶端。

  • beeline

  • 依次執行以下SQL語句創建demo數據庫及表product_info。

CREATE DATABASE demo;
USE demo;
DROP TABLE product_info;
CREATE TABLE product_info 
(    
    product_price                int            not null,
    product_id                   char(30)       not null,
    product_time                 date           ,
    product_level                char(10)       ,
    product_name                 varchar(200)   ,
    product_type1                varchar(20)    ,
    product_type2                char(10)       ,
    product_monthly_sales_cnt    int            ,
    product_comment_time         date           ,
    product_comment_num          int        ,
    product_comment_content      varchar(200)                   
) 
row format delimited fields terminated by ',' 
stored as TEXTFILE

9、將product_info.txt數據文件導入Hive。


    1. 切回到MRS集群,單擊“文件管理”,單擊“導入數據”。

    2. OBS路徑:選擇上面創建好的OBS桶名,找到product_info.txt文件,單擊“是”。

    3. HDFS路徑:選擇/user/hive/warehouse/demo.db/product_info/,單擊“是”。

    4. 單擊“確定”,等待導入成功,此時product_info的表數據已導入成功。

10、創建ORC表,并將數據導入ORC表。

  • 執行以下SQL語句創建ORC表。

DROP TABLE product_info_orc;
CREATE TABLE product_info_orc
(    
    product_price                int            not null,
    product_id                   char(30)       not null,
    product_time                 date           ,
    product_level                char(10)       ,
    product_name                 varchar(200)   ,
    product_type1                varchar(20)    ,
    product_type2                char(10)       ,
    product_monthly_sales_cnt    int            ,
    product_comment_time         date           ,
    product_comment_num          int            ,
    product_comment_content      varchar(200)                   
) 
row format delimited fields terminated by ',' 
stored as orc;
  • 將product_info表的數據插入到Hive ORC表product_info_orc中。

insert into product_info_orc select * from product_info;
  • 查詢ORC表數據導入成功。

select * from product_info_orc;

三、創建MRS數據源連接

  1. 登錄DWS管理控制臺,單擊已創建好的DWS集群,確保DWS集群與MRS在同一個區域、可用分區,并且在同一VPC子網下。

  2. 切換到“MRS數據源”,單擊“創建MRS數據源連接”。

  3. 選擇前序步驟創建名為的“MRS01”數據源,用戶名:admin,密碼:Huawei@12345,單擊“確定”,創建成功。

GaussDW如何導入MRS-Hive數據源

四、創建外部服務器

  • (1)使用Data Studio連接已創建好的DWS集群。

  • (2)新建一個具有創建數據庫權限的用戶dbuser:

CREATE USER dbuser WITH CREATEDB PASSWORD "Bigdata@123";
  • (3)切換為新建的dbuser用戶:

SET ROLE dbuser PASSWORD "Bigdata@123";
  • (4)創建新的mydatabase數據庫:

CREATE DATABASE mydatabase;
  • (5)執行以下步驟切換為連接新建的mydatabase數據庫。

  1. 在Data Studio客戶端的“對象瀏覽器”窗口,右鍵單擊數據庫連接名稱,在彈出菜單中單擊“刷新”,刷新后就可以看到新建的數據庫。

  2. 右鍵單擊“mydatabase”數據庫名稱,在彈出菜單中單擊“打開連接”。

  3. 右鍵單擊“mydatabase”數據庫名稱,在彈出菜單中單擊“打開新的終端”,即可打開連接到指定數據庫的SQL命令窗口,后面的步驟,請全部在該命令窗口中執行。

  • (6)為dbuser用戶授予創建外部服務器的權限:

GRANT ALL ON FOREIGN DATA WRAPPER hdfs_fdw TO dbuser;

其中FOREIGN DATA WRAPPER的名字只能是hdfs_fdw,dbuser為創建SERVER的用戶名。

  • (7)執行以下命令賦予用戶使用外表的權限。

ALTER USER dbuser USEFT;
  • (8)切換回Postgres系統數據庫,查詢創建MRS數據源后系統自動創建的外部服務器。

SELECT * FROM pg_foreign_server;

返回結果如:

                     srvname                      | srvowner | srvfdw | srvtype | srvversion | srvacl |                                                     srvoptions
--------------------------------------------------+----------+--------+---------+------------+--------+---------------------------------------------------------------------------------------------------------------------
 gsmpp_server                                     |       10 |  13673 |         |            |        |
 gsmpp_errorinfo_server                           |       10 |  13678 |         |            |        |
 hdfs_server_8f79ada0_d998_4026_9020_80d6de2692ca |    16476 |  13685 |         |            |        | {"address=192.168.1.245:9820,192.168.1.218:9820",hdfscfgpath=/MRS/8f79ada0-d998-4026-9020-80d6de2692ca,type=hdfs}
(3 rows)
  • (9)切換到mydatabase數據庫,并切換到dbuser用戶。

SET ROLE dbuser PASSWORD "Bigdata@123";
  • (10)創建外部服務器。

SERVER名字、地址、配置路徑保持與8一致即可。

CREATE SERVER hdfs_server_8f79ada0_d998_4026_9020_80d6de2692ca FOREIGN DATA WRAPPER HDFS_FDW 
OPTIONS 
(
address '192.168.1.245:9820,192.168.1.218:9820',   //MRS管理面的Master主備節點的內網IP,可與DWS通訊。
hdfscfgpath '/MRS/8f79ada0-d998-4026-9020-80d6de2692ca',
type 'hdfs'
);
  • (11)查看外部服務器。

SELECT * FROM pg_foreign_server WHERE srvname='hdfs_server_8f79ada0_d998_4026_9020_80d6de2692ca';

返回結果如下所示,表示已經創建成功:

                     srvname                      | srvowner | srvfdw | srvtype | srvversion | srvacl |                                                     srvoptions
--------------------------------------------------+----------+--------+---------+------------+--------+---------------------------------------------------------------------------------------------------------------------
 hdfs_server_8f79ada0_d998_4026_9020_80d6de2692ca |    16476 |  13685 |         |            |        | {"address=192.168.1.245:9820,192.168.1.218:29820",hdfscfgpath=/MRS/8f79ada0-d998-4026-9020-80d6de2692ca,type=hdfs}
(1 row)

五、創建外表

1、獲取Hive的product_info_orc的文件路徑。


    1. 登錄MRS管理控制臺。

    2. 選擇“集群列表 > 現有集群”,單擊要查看的集群名稱,進入集群基本信息頁面。

    3. 單擊“文件管理”,選擇“HDFS文件列表”。

    4. 進入您要導入到GaussDB(DWS)集群的數據的存儲目錄,并記錄其路徑。

圖1 在MRS上查看數據存儲路徑

GaussDW如何導入MRS-Hive數據源

2、創建外表。 SERVER名字填寫10創建的外部服務器名稱,foldername填寫1查到的路徑。

DROP FOREIGN TABLE IF EXISTS foreign_product_info;
CREATE FOREIGN TABLE foreign_product_info
(
    product_price                integer        not null,
    product_id                   char(30)       not null,
    product_time                 date           ,
    product_level                char(10)       ,
    product_name                 varchar(200)   ,
    product_type1                varchar(20)    ,
    product_type2                char(10)       ,
    product_monthly_sales_cnt    integer        ,
    product_comment_time         date           ,
    product_comment_num          integer        ,
    product_comment_content      varchar(200)                      
) SERVER hdfs_server_8f79ada0_d998_4026_9020_80d6de2692ca 
OPTIONS (
format 'orc', 
encoding 'utf8',
foldername '/user/hive/warehouse/demo.db/product_info_orc/'
) 
DISTRIBUTE BY ROUNDROBIN;

六、執行數據導入

1、創建本地目標表。

DROP TABLE IF EXISTS product_info;
CREATE TABLE product_info
(
    product_price                integer        not null,
    product_id                   char(30)       not null,
    product_time                 date           ,
    product_level                char(10)       ,
    product_name                 varchar(200)   ,
    product_type1                varchar(20)    ,
    product_type2                char(10)       ,
    product_monthly_sales_cnt    integer        ,
    product_comment_time         date           ,
    product_comment_num          integer        ,
    product_comment_content      varchar(200)                   
) 
with (
orientation = column,
compression=middle
) 
DISTRIBUTE BY HASH (product_id);

2、從外表導入目標表。

INSERT INTO product_info SELECT * FROM foreign_product_info;

3、查詢導入結果。

SELECT * FROM product_info;

以上是“GaussDW如何導入MRS-Hive數據源”這篇文章的所有內容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內容對大家有所幫助,如果還想學習更多知識,歡迎關注億速云行業資訊頻道!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

桓台县| 筠连县| 武平县| 红河县| 辽中县| 清新县| 大田县| 东乡县| 嘉兴市| 明光市| 娄底市| 兴山县| 遂川县| 应用必备| 广河县| 松溪县| 巴马| 昌黎县| 枝江市| 弥渡县| 临猗县| 平利县| 交城县| 邛崃市| 思南县| 成武县| 凤冈县| 临海市| 廉江市| 美姑县| 巴塘县| 新化县| 洛阳市| 司法| 汉源县| 锦屏县| 临朐县| 伊川县| 朝阳区| 丰城市| 曲松县|