使用Hive讀取CSV文件可以通過以下步驟實現:
創建一個外部表來定義CSV文件的模式。例如,假設CSV文件名為data.csv
,包含的列有col1
和col2
,可以使用以下命令創建外部表:
CREATE EXTERNAL TABLE csv_table (
col1 STRING,
col2 INT
)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ','
STORED AS TEXTFILE
LOCATION '/path/to/csv/file';
其中,LOCATION
指定了CSV文件的路徑,可以是本地文件系統路徑或者HDFS路徑。
使用SELECT
語句從外部表中讀取數據。例如:
SELECT col1, col2 FROM csv_table;
這樣就可以讀取CSV文件中的數據。
注意事項:
FIELDS TERMINATED BY ','
指定分隔符。