您好,登錄后才能下訂單哦!
本篇內容主要講解“怎么用HDFS恢復被刪除的文件”,感興趣的朋友不妨來看看。本文介紹的方法操作簡單快捷,實用性強。下面就讓小編來帶大家學習“怎么用HDFS恢復被刪除的文件”吧!
Hadoop有一個“垃圾回收站”的功能,用于恢復在過去一段時間內被刪除文件。若某個文件被刪除了多次,你還可以恢復具體哪一次刪除的文件。該功能默認是關閉狀態,若想開啟,需要在$HADOOP_HOME/etc/hadoop/core-site.xml文件中,添加以下配置:
<property> <name>fs.trash.interval</name> <value>10</value> </property>
上面的配置意思為:Hadoop會設立一個回收站,回收站每隔10分鐘清空一次。
若在一個回收周期內多次刪除同一個文件或目錄,則Trash內會分版本保存你每次刪除的文件。這就意味你可以恢復在某個時刻所刪除的文件。
舉個例子:
時間點 | 動作 | Trash內容 |
12:40 | 回收站清空 | empty |
12:41 | 刪除fruit.data | fruit.data |
12:42 | 重新上傳fruit.data且再次刪除fruit.data | fruit.data,fruit.data1446352935186 |
12:45 | 重新上傳fruit.data且再次刪除fruit.data | fruit.data,fruit.data1446352935186,fruit.data1446353100390 |
12:50 | 回收站清空 | empty |
根據上表,在12:41第二次刪除friut.data,回收站中出現了fruit.?data1446352935186?,后面的那串數字就是你刪除時刻的時間戳。那么我們就可在垃圾回收站清空之前,恢復12:41或12:45刪除的文件。
結合hive的使用,一般會有很多定時任務向hive中插入更新數據,那么.Trash中針對某個table就會有很多個版本的存在,若想查看某個時刻的數據,只要在Trash中把該時間的數據恢復即可,針對誤刪特別有用。
到此,相信大家對“怎么用HDFS恢復被刪除的文件”有了更深的了解,不妨來實際操作一番吧!這里是億速云網站,更多相關內容可以進入相關頻道進行查詢,關注我們,繼續學習!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。