91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

linux中去掉文件重復數據行的方法

發布時間:2021-07-26 21:51:55 來源:億速云 閱讀:257 作者:chen 欄目:系統運維

本篇內容主要講解“linux中去掉文件重復數據行的方法”,感興趣的朋友不妨來看看。本文介紹的方法操作簡單快捷,實用性強。下面就讓小編來帶大家學習“linux中去掉文件重復數據行的方法”吧!

一、去掉相鄰重復的數據行

代碼如下:


$cat data1.txt | uniq  
輸出:
beijing  
wuhan  
beijing  
wuhan

二、去掉所有重復的數據行

代碼如下:


$cat data1.txt | sort | uniq

注:
只有uniq命令的話,只是把相鄰的重復的數據行去掉。
如果先 sort 的話,就會把所有重復的數據行變成相鄰的數據行,再 uniq 的話,就去掉所有重復的數據行了。

輸出:
beijing 
wuhan

附:data1.txt

代碼如下:


[root@syy ~]# cat data1.txt  
beijing  
beijing  
wuhan  
wuhan  
wuhan  
beijing  
beijing  
beijing  
wuhan  
wuhan  

注:在過濾日志中的IP地址很有用。

Linux下刪除大數據文件中部分字段重復的行

最近寫的一個數據采集程序生成了一個含有1千多萬行數據的文件,數據由4個字段組成,按照要求需要刪除第二個字段重復的行,找來找去linux下也沒找到合適的工具,sed/gawk等流處理工具只能針對一行一行處理,并無法找到字段重復的行。看來只好自己python一個程序了,突然想起來利用mysql,于是進行乾坤大挪移:

1. 利用mysqlimport --local dbname data.txt導入數據到表中,表名要與文件名一致
2. 執行下列sql語句(要求唯一的字段為uniqfield)

代碼如下:


use dbname;
alter table tablename add rowid int auto_increment not null;
create table t select min(rowid) as rowid from tablename group by uniqfield;
create table t2 select tablename .* from tablename,t where tablename.rowid= t.rowid;</p> <p>drop table tablename;
rename table t2 to tablename;

到此,相信大家對“linux中去掉文件重復數據行的方法”有了更深的了解,不妨來實際操作一番吧!這里是億速云網站,更多相關內容可以進入相關頻道進行查詢,關注我們,繼續學習!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

桦南县| 烟台市| 吉安县| 长白| 上虞市| 凌海市| 中阳县| 平果县| 乐东| 拉萨市| 瑞安市| 定结县| 安福县| 疏附县| 望城县| 蓬溪县| 海晏县| 平乡县| 上饶市| 项城市| 沙河市| 武义县| 成武县| 寿光市| 仪陇县| 尉氏县| 西乌珠穆沁旗| 安阳市| 额尔古纳市| 赤壁市| 福清市| 新疆| 河津市| 江城| 子长县| 南京市| 喀喇| 诸城市| 岳池县| 砀山县| 宁南县|