Hive通過HiveQL語言可以讀取HDFS文件。在Hive中,可以使用CREATE EXTERNAL TABLE語句來創建外部表,然后使用SELECT語句來讀取HDFS文件中的數據。以下是一個簡單的示例:
CREATE EXTERNAL TABLE my_table (
id INT,
name STRING
)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ','
LOCATION '/user/hive/data';
SELECT * FROM my_table;
在上面的示例中,首先創建了一個名為my_table的外部表,該外部表包含id和name兩個字段,并且數據是以逗號分隔的。然后通過SELECT語句來讀取my_table表中的數據。
需要注意的是,Hive中的外部表是與HDFS文件直接關聯的,數據并不會被復制到Hive的存儲中,因此對于HDFS文件的修改也會直接影響到Hive表的數據。