您好,登錄后才能下訂單哦!
這篇文章為大家帶來有關shell腳本中文本處理工具使用的詳細介紹。大部分工具可能大家會經常用到,為此分享給大家做個詳細的總結,希望你們能深刻了解shell文本處理工具的用法。
grep是行過濾工具;用于根據關鍵字進行行過濾
語法:
# grep [選項] '關鍵字' 文件名
常見選項:
OPTIONS:
-i: 不區分大小寫
-v: 查找不包含指定內容的行,反向選擇
-w: 按單詞搜索
-o: 打印匹配關鍵字
-c: 統計匹配到的行數
-n: 顯示行號
-r: 逐層遍歷目錄查找
-A: 顯示匹配行及后面多少行
-B: 顯示匹配行及前面多少行
-C: 顯示匹配行前后多少行
-l:只列出匹配的文件名
-L:列出不匹配的文件名
-e: 使用正則匹配
-E:使用擴展正則匹配
^key:以關鍵字開頭
key$:以關鍵字結尾
^$:匹配空行
--color=auto :可以將找到的關鍵詞部分加上顏色的顯示
顏色顯示(別名設置):
臨時設置:
# alias grep='grep --color=auto' //只針對當前終端和當前用戶生效
永久設置:
1)全局(針對所有用戶生效)
vim /etc/bashrc
alias grep='grep --color=auto'
source /etc/bashrc
2)局部(針對具體的某個用戶)
vim ~/.bashrc
alias grep='grep --color=auto'
source ~/.bashrc
舉例說明:
==說明:不要直接使用/etc/passwd文件,將其拷貝到/tmp下做實驗!==
# grep -i root passwd 忽略大小寫匹配包含root的行
# grep -w ftp passwd 精確匹配ftp單詞
# grep -w hello passwd 精確匹配hello單詞;自己添加包含hello的行到文件
# grep -wo ftp passwd 打印匹配到的關鍵字ftp
# grep -n root passwd 打印匹配到root關鍵字的行好
# grep -ni root passwd 忽略大小寫匹配統計包含關鍵字root的行
# grep -nic root passwd 忽略大小寫匹配統計包含關鍵字root的行數
# grep -i ^root passwd 忽略大小寫匹配以root開頭的行
# grep bash$ passwd 匹配以bash結尾的行
# grep -n ^$ passwd 匹配空行并打印行號
# grep ^# /etc/vsftpd/vsftpd.conf 匹配以#號開頭的行
# grep -v ^# /etc/vsftpd/vsftpd.conf 匹配不以#號開頭的行
# grep -A 5 mail passwd 匹配包含mail關鍵字及其后5行
# grep -B 5 mail passwd 匹配包含mail關鍵字及其前5行
# grep -C 5 mail passwd 匹配包含mail關鍵字及其前后5行
cut是列截取工具,用于列的截取
語法:
# cut 選項 文件名
常見選項:
-c: 以字符為單位進行分割,截取
-d: 自定義分隔符,默認為制表符\t
-f: 與-d一起使用,指定截取哪個區域
舉例說明:
# cut -d: -f1 1.txt 以:冒號分割,截取第1列內容
# cut -d: -f1,6,7 1.txt 以:冒號分割,截取第1,6,7列內容
# cut -c4 1.txt 截取文件中每行第4個字符
# cut -c1-4 1.txt 截取文件中每行的1-4個字符
# cut -c4-10 1.txt 截取文件中每行的4-10個字符
# cut -c5- 1.txt 從第5個字符開始截取后面所有字符
sort工具用于排序;它將文件的每一行作為一個單位,從首字符向后,依次按ASCII碼值進行比較,最后將他們按升序輸出。
-u :去除重復行
-r :降序排列,默認是升序
-o : 將排序結果輸出到文件中,類似重定向符號>
-n :以數字排序,默認是按字符排序
-t :分隔符
-k :第N列
-b :忽略前導空格。
-R :隨機排序,每次運行的結果均不同
舉例說明
# sort -n -t: -k3 1.txt 按照用戶的uid進行升序排列
# sort -nr -t: -k3 1.txt 按照用戶的uid進行降序排列
# sort -n 2.txt 按照數字排序
# sort -nu 2.txt 按照數字排序并且去重
# sort -nr 2.txt
# sort -nru 2.txt
# sort -nru 2.txt
# sort -n 2.txt -o 3.txt 按照數字排序并將結果重定向到文件
# sort -R 2.txt
# sort -u 2.txt
uniq用于去除==連續==的==重復==行
常見選項:
-i: 忽略大小寫
-c: 統計重復行次數
-d:只顯示重復行
舉例說明:
# uniq 2.txt
# uniq -d 2.txt
# uniq -dc 2.txt
tee工具是從標準輸入讀取并寫入到標準輸出和文件,即:雙向覆蓋重定向(屏幕輸出|文本輸入)
選項:
-a 雙向追加重定向
# echo hello world
# echo hello world|tee file1
# cat file1
# echo 999|tee -a file1
# cat file1
diff工具用于逐行比較文件的不同
注意:diff描述兩個文件不同的方式是告訴我們==怎樣改變第一個==文件之后==與第二個文件匹配==。
語法:
diff [選項] 文件1 文件2
常用選項:
選項 | 含義 | 備注 |
---|---|---|
-b | 不檢查空格 | |
-B | 不檢查空白行 | |
-i | 不檢查大小寫 | |
-w | 忽略所有的空格 | |
--normal | 正常格式顯示(默認) | |
-c | 上下文格式顯示 | |
-u | 合并格式顯示 |
舉例說明:
[root@MissHou ~]# cat file1
aaaa
111
hello world
222
333
bbb
[root@MissHou ~]#
[root@MissHou ~]# cat file2
aaa
hello
111
222
bbb
333
world
1)正常顯示
diff目的:file1如何改變才能和file2匹配
[root@MissHou ~]# diff file1 file2
1c1,2 第一個文件的第1行需要改變(c=change)才能和第二個文件的第1到2行匹配
< aaaa 小于號"<"表示左邊文件(file1)文件內容
--- ---表示分隔符
> aaa 大于號">"表示右邊文件(file2)文件內容
> hello
3d3 第一個文件的第3行刪除(d=delete)后才能和第二個文件的第3行匹配
< hello world
5d4 第一個文件的第5行刪除后才能和第二個文件的第4行匹配
< 333
6a6,7 第一個文件的第6行增加(a=add)內容后才能和第二個文件的第6到7行匹配
> 333 需要增加的內容在第二個文件里是333和world
> world
2)上下文格式顯示
[root@MissHou ~]# diff -c file1 file2
前兩行主要列出需要比較的文件名和文件的時間戳;文件名前面的符號***表示file1,---表示file2
*** file1 2019-04-16 16:26:05.748650262 +0800
--- file2 2019-04-16 16:26:30.470646030 +0800
*************** 我是分隔符
*** 1,6 **** 以***開頭表示file1文件,1,6表示1到6行
! aaaa !表示該行需要修改才與第二個文件匹配
111
- hello world -表示需要刪除該行才與第二個文件匹配
222
- 333 -表示需要刪除該行才與第二個文件匹配
bbb
--- 1,7 ---- 以---開頭表示file2文件,1,7表示1到7行
! aaa 表示第一個文件需要修改才與第二個文件匹配
! hello 表示第一個文件需要修改才與第二個文件匹配
111
222
bbb
+ 333 表示第一個文件需要加上該行才與第二個文件匹配
+ world 表示第一個文件需要加上該行才與第二個文件匹配
3)合并格式顯示
[root@MissHou ~]# diff -u file1 file2
前兩行主要列出需要比較的文件名和文件的時間戳;文件名前面的符號---表示file1,+++表示file2
--- file1 2019-04-16 16:26:05.748650262 +0800
+++ file2 2019-04-16 16:26:30.470646030 +0800
@@ -1,6 +1,7 @@
-aaaa
+aaa
+hello
111
-hello world
222
-333
bbb
+333
+world
默認情況下也會比較兩個目錄里相同文件的內容
[root@MissHou tmp]# diff dir1 dir2
diff dir1/file1 dir2/file1
0a1
> hello
Only in dir1: file3
Only in dir2: test1
如果只需要比較兩個目錄里文件的不同,不需要進一步比較文件內容,需要加-q選項
[root@MissHou tmp]# diff -q dir1 dir2
Files dir1/file1 and dir2/file1 differ
Only in dir1: file3
Only in dir2: test1
其他小技巧:
有時候我們需要以一個文件為標準,去修改其他文件,并且修改的地方較多時,我們可以通過打補丁的方式完成。
1)先找出文件不同,然后輸出到一個文件
[root@MissHou ~]# diff -uN file1 file2 > file.patch
-u:上下文模式
-N:將不存在的文件當作空文件
2)將不同內容打補丁到文件
[root@MissHou ~]# patch file1 file.patch
patching file file1
3)測試驗證
[root@MissHou ~]# diff file1 file2
[root@MissHou ~]#
paste工具用于合并文件行
常用選項:
-d:自定義間隔符,默認是tab
-s:串行處理,非并行
##8. tr工具
tr用于字符轉換,替換和刪除;主要用于==刪除文件中控制字符==或進行==字符轉換==
語法:
用法1:命令的執行結果交給tr處理,其中string1用于查詢,string2用于轉換處理
# commands|tr 'string1' 'string2'
用法2:tr處理的內容來自文件,記住要使用"<"標準輸入
# tr 'string1' 'string2' < filename
用法3:匹配string1進行相應操作,如刪除操作
# tr options 'string1' < filename
常用選項:
-d 刪除字符串1中所有輸入字符。
-s 刪除所有重復出現字符序列,只保留第一個;即將重復出現字符串壓縮為一個字符串
常匹配字符串:
字符串 | 含義 | 備注 |
---|---|---|
==a-z==或[:lower:] | 匹配所有小寫字母 | [a-zA-Z0-9] |
==A-Z==或[:upper:] | 匹配所有大寫字母 | |
==0-9==或[:digit:] | 匹配所有數字 | |
[:alnum:] | 匹配所有字母和數字 | |
[:alpha:] | 匹配所有字母 | |
[:blank:] | 所有水平空白 | |
[:punct:] | 匹配所有標點符號 | |
[:space:] | 所有水平或垂直的空格 | |
[:cntrl:] | 所有控制字符 | \f Ctrl-L 走行換頁<br/>\n Ctrl-J 換行 |
\r Ctrl-M 回車
\t Ctrl-I tab鍵 |
舉例說明:
[root@MissHou shell01]# cat 3.txt 自己創建該文件用于測試
ROOT:x:0:0:root:/root:/bin/bash
bin:x:1:1:bin:/bin:/sbin/nologin
daemon:x:2:2:daemon:/sbin:/sbin/nologin
adm:x:3:4:adm:/var/adm:/sbin/nologin
lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin
sync:x:5:0:sync:/sbin:/bin/sync
shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown
halt:x:7:0:halt:/sbin:/sbin/halt
mail:x:8:12:mail:/var/spool/mail:/sbin/nologin
uucp:x:10:14:uucp:/var/spool/uucp:/sbin/nologin
boss02:x:516:511::/home/boss02:/bin/bash
vip:x:517:517::/home/vip:/bin/bash
stu1:x:518:518::/home/stu1:/bin/bash
mailnull:x:47:47::/var/spool/mqueue:/sbin/nologin
smmsp:x:51:51::/var/spool/mqueue:/sbin/nologin
aaaaaaaaaaaaaaaaaaaa
bbbbbb111111122222222222233333333cccccccc
hello world 888
666
777
999
# tr -d '[:/]' < 3.txt 刪除文件中的:和/
# cat 3.txt |tr -d '[:/]' 刪除文件中的:和/
# tr '[0-9]' '@' < 3.txt 將文件中的數字替換為@符號
# tr '[a-z]' '[A-Z]' < 3.txt 將文件中的小寫字母替換成大寫字母
# tr -s '[a-z]' < 3.txt 匹配小寫字母并將重復的壓縮為一個
# tr -s '[a-z0-9]' < 3.txt 匹配小寫字母和數字并將重復的壓縮為一個
# tr -d '[:digit:]' < 3.txt 刪除文件中的數字
# tr -d '[:blank:]' < 3.txt 刪除水平空白
# tr -d '[:space:]' < 3.txt 刪除所有水平和垂直空白
# ifconfig eth0|grep 'Bcast'|tr -d '[a-zA-Z ]'|cut -d: -f2,3,4
10.1.1.1:10.1.1.255:255.255.255.0
# ifconfig eth0|grep 'Bcast'|tr -d '[a-zA-Z ]'|cut -d: -f2,3,4|tr ':' '\n'
10.1.1.1
10.1.1.255
255.255.255.0
# ifconfig eth0|grep 'HWaddr'|cut -d: -f2-|cut -d' ' -f4
00:0C:29:25:AE:54
# ifconfig eth0|grep 'HW'|tr -s ' '|cut -d' ' -f5
00:0C:29:B4:9E:4E
# ifconfig eth2|grep Bcast|cut -d: -f2|cut -d' ' -f1
# ifconfig eth2|grep Bcast|cut -d: -f2|tr -d '[ a-zA-Z]'
# ifconfig eth2|grep Bcast|tr -d '[:a-zA-Z]'|tr ' ' '@'|tr -s '@'|tr '@' '\n'|grep -v ^$
# ifconfig eth0|grep 'Bcast'|tr -d [:alpha:]|tr '[ :]' '\n'|grep -v ^$
# ifconfig eth2|grep HWaddr|cut -d ' ' -f11
# ifconfig eth0|grep HWaddr|tr -s ' '|cut -d' ' -f5
# ifconfig eth2|grep HWaddr|tr -s ' '|cut -d' ' -f5
# ifconfig eth0|grep 'Bcast'|tr -d 'a-zA-Z:'|tr ' ' '\n'|grep -v '^$'
# grep 'bash$' passwd |grep -v 'root'|cut -d: -f1,2,7|tr ':' '\t' |tee abc.txt
以上就是shell腳本中文本處理工具的介紹和使用,工具的詳細使用情況還得要大家自己使用過才能知道具體要領。如果想閱讀更多相關內容的文章,歡迎關注億速云行業資訊頻道!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。