您好,登錄后才能下訂單哦!
這篇文章給大家分享的是有關Linux系統中bash shell編程的基礎問題有哪些的內容。小編覺得挺實用的,因此分享給大家做個參考,一起跟隨小編過來看看吧。
第1問:為何叫做shell?
在介紹 shell 是什么東西之前,不妨讓我們重新審視使用者與電腦的關系。我們知道電腦的運作不能離開硬件,但使用者卻無法直接對硬件作驅動,硬件的驅動只能透過一個稱為“操作系統(Operating System)”的軟件來控管,事實上,我們每天所談的linux,嚴格來說只是一個操作系統,我們稱之為“核心(kernel)”。然而,從使用者的角度來說,使用者也沒辦法直接操作kernel,而是透過kernel的“外殼”程序,也就是所謂的shell,來與kernel溝通。
這也正是kernel跟shell的形像命名關系。
從技術角度來說,shell是一個使用者與系統的互動界面(interface),主要是讓使用者透過命令行(command line)來使用系統以完成工作。因此,shell的最簡單的定義就是---命令解釋器(Command Interpreter):
將使用者的命令翻譯給核心處理,
同時,將核心處理結果翻譯給使用者。
每次當我們完成系統登入(log in),我們就取得一個互動模式的shell,也稱為login shell或primary shell。若從行程(process)角度來說,我們在shell所下達的命令,均是shell所產生的子行程。這現像,我們暫可稱之為fork。如果是執行腳本(shell script)的話,腳本中的命令則是由另外一個非互動模式的子shell(sub shell)來執行的。也就是primary shell產生sub shell的行程,sub shell再產生script中所有命令的行程。(關于行程,我們日后有機會再補充。)
這里,我們必須知道:kernel與shell是不同的兩套軟件,而且都是可以被替換的:
不同的操作系統使用不同的kernel,
而在同一個kernel之上,也可使用不同的shell。
在linux的預設系統中,通常都可以找到好幾種不同的shell,且通常會被列于如下檔案里:
/etc/shells
不同的shell有著不同的功能,且也彼此各異、或說“大同小異”。常見的shell主要分為兩大主流:
sh:
burne shell(sh)
burne again shell(bash)
csh:
c shell(csh)
tc shell(tcsh)
korn shell(ksh)
大部份的Linux系統的預設shell都是bash,其原因大致如下兩點:
自由軟件
功能強大
bash是gnu project最成功的產品之一,自推出以來深受廣大Unix用戶喜愛,且也逐漸成為不少組織的系統標準。
第2問:shell prompt(PS1)與 Carriage Return(CR)的關系?
當你成功登錄進一個文字界面之后,大部份情形下,你會在熒幕上看到一個不斷閃爍的方塊或底線(視不同版本而別),我們稱之為游標(cursor)。游標的作用就是告訴你接下來你從鍵盤輸入的按鍵所插入的位置,且每輸入一鍵游標便向右邊移動一個格子,若連續輸入太多的話,則自動接在下一行輸入。假如你剛完成登錄還沒輸入任何按鍵之前,你所看到的游標所在位置的同一行的左邊部份,我們稱之為提示符號(prompt)。提示符號的格式或因不同系統版本而各有不同,在Linux上,只需留意最接近游標的一個可見的提示符號,通常是如下兩者之一:
$:給一般使用者帳號使用
#:給root(管理員)帳號使用
事實上,shell prompt的意思很簡單:是shell告訴使用者:您現在可以輸入命令行了。我們可以說,使用者只有在得到shell prompt才能打命令行,而cursor是指示鍵盤在命令行所輸入的位置,使用者每輸入一個鍵,cursor就往后移動一格,直到碰到命令行讀進CR(Carriage Return,由Enter鍵產生)字符為止。CR的意思也很簡單:是使用者告訴shell:老兄你可以執行我的命令了。
嚴格來說:所謂的命令行,就是在shell prompt與CR字符之間所輸入的文字。(思考:為何我們這里堅持使用CR字符而不說Enter鍵呢?答案在后面的學習中揭曉。)不同的命令可接受的命令行格式或有不同,一般情況下,一個標準的命令行格式為如下所列:
command-name options argument
若從技術細節來看,shell會依據IFS(Internal Field Seperator)將command line所輸入的文字給拆解為“字段”(word)。然后再針對特殊字符(meta)先作處理,最后再重組整行command line。(注意:請務必理解上兩句話的意思,我們日后的學習中會常回到這里思考。)
其中的IFS是shell預設使用的字段分隔符號,可以由一個及多個如下按鍵組成:
空白鍵(White Space)
表格鍵(Tab)
回車鍵(Enter)
系統可接受的命令名稱(command-name)可以從如下途徑獲得:
明確路徑所指定的外部命令
命令別名(alias)
自定功能(function)
shell內置命令(built-in)
$PATH之下的外部命令
每一個命令行均必需含用命令名稱,這是不能缺少的。
第3問:別人echo、你也echo,是問echo知多少?
承接上一章所介紹的command line,這里我們用echo這個命令加以進一步說明。溫習---標準的command line包含三個部件:
command_name option argument
echo是一個非常簡單、直接的Linux命令:將argument送出至標準輸出(STDOUT),通常就是在顯示器(monitor)上輸出。(注:stdout我們日后有機會再解說)。為了更好理解,不如先讓我們先跑一下echo命令好了:
$ echo
你會發現只有一個空白行,然后又回到shell prompt上了。這是因為echo在預設上,在顯示完argument之后,還會送出一個換行符號(new-line charactor)。但是上面的command并沒任何的argument,那結果就只剩一個換行符號了…
若你要取消這個換行符號,可利用echo的-n option:
$ echo -n
不妨讓我們回到command line的概念上來討論上例的echo命令好了:command line只有command_name(echo)及option(-n),并沒有任何argument。
要想看看echo的argument,那還不簡單﹗接下來,你可試試如下的輸入:
$ echo first line first line $ echo -n first line first line $
于上兩個echo命令中,你會發現argument的部份顯示在你的熒幕,而換行符號則視-n option的有無而別。
很明顯的,第二個echo由于換行符號被取消了,接下來的shell prompt就接在輸出結果同一行了…^_^
事實上,echo除了-n options之外,常用選項還有:
-e:啟用反斜線控制字符的轉換(參考下表)
-E:關閉反斜線控制字符的轉換(預設如此)
-n:取消行末之換行符號(與-e選項下的\c字符同意)
關于echo命令所支持的反斜線控制字符如下表:
\a:ALERT / BELL(從系統喇叭送出鈴聲)
\b:BACKSPACE,也就是向左退格鍵
\c:取消行末之換行符號
\E:ESCAPE,跳脫鍵
\f:FORMFEED,分頁字符
\n:NEWLINE,換行字符
\r:RETURN,回車鍵
\t:TAB,表格跳位鍵
\v:VERTICAL TAB,垂直表格跳位鍵
\n:ASCII八進位編碼(以x開首為十六進位)
\\:反斜線本身
(表格數據來自O'Reilly出版社之Learning the Bash Shell,2nd Ed.)
或許,我們可以透過實例來了解echo的選項及控制字符:
例一:
$ echo -e "a\tb\tc\nd\te\tf" a b c d e f
上例運用\t來區隔abc還有def,及用\n將def換至下一行。
例二:
$ echo -e "\141\011\142\011\143\012\144\011\145\011\146" a b c d e f
與例一的結果一樣,只是使用ASCII八進位編碼。
例三:
$ echo -e "\x61\x09\x62\x09\x63\x0a\x64\x09\x65\x09\x66" a b c d e f
與例二差不多,只是這次換用ASCII十六進位編碼。
例四:
$ echo -ne "a\tb\tc\nd\te\bf\a" a b c d f $
因為e字母后面是退格鍵(\b),因此輸出結果就沒有e了。在結束時聽到一聲鈴向,那是\a的杰作﹗
由于同時使用了-n選項,因此shell prompt緊接在第二行之后。若你不用-n的話,那你在\a后再加個\c,也是同樣的效果。
事實上,在日后的shell操作及shell script設計上,echo命令是最常被使用的命令之一。
比方說,用echo來檢查變量值:
$ A=B $ echo $A B $ echo $? 0
(注:關于變量概念,我們留到下兩章才跟大家說明。)
好了,更多的關于command line的格式,以及echo命令的選項,就請您自行多加練習、運用了…
第4問:“”(雙引號)與''(單引號)差在哪?
還是回到我們的command line來吧…
經過前面兩章的學習,應該很清楚當你在shell prompt后面敲打鍵盤、直到按下Enter的時候,
你輸入的文字就是command line了,然后shell才會以行程的方式執行你所交給它的命令。但是,你又可知道:你在command line輸入的每一個文字,對shell來說,是有類別之分的呢?
簡單而言(我不敢說這是精確的定議,注一),command line的每一個charactor,分為如下兩種:
literal:也就是普通純文字,對shell來說沒特殊功能。
meta:對shell來說,具有特定功能的特殊保留字元。(注一:關于bash shell在處理command line時的順序說明,請參考O'Reilly出版社之Learning the Bash Shell,2nd Edition,第177 - 180頁的說明,尤其是178頁的流程圖Figure 7-1…)
Literal沒甚么好談的,凡舉abcd、123456這些“文字”都是literal…(easy?)。但meta卻常使我們困惑…..(confused?)事實上,前兩章我們在command line中已碰到兩個機乎每次都會碰到的meta:
IFS:由<space>或<tab>或<enter>三者之一組成(我們常用space)。
CR:由<enter>產生。
IFS是用來拆解command line的每一個詞(word)用的,因為shell command line是按詞來處理的。而CR則是用來結束command line用的,這也是為何我們敲<enter>命令就會跑的原因。除了IFS與CR,常用的meta還有:
= : 設定變量。
$ : 作變量或運算替換(請不要與shell prompt搞混了)。
> : 重導向stdout。
< : 重導向stdin。
| : 命令管線。
& : 重導向file descriptor,或將命令置于背境執行。
() : 將其內的命令置于nested subshell執行,或用于運算或命令替換。
{} : 將其內的命令置于non-named function中執行,或用在變量替換的界定范圍。
; : 在前一個命令結束時,而忽略其返回值,繼續執行下一個命令。
&& : 在前一個命令結束時,若返回值為true,繼續執行下一個命令。
|| : 在前一個命令結束時,若返回值為false,繼續執行下一個命令。
!: 執行history列表中的命令
...
假如我們需要在command line中將這些保留字元的功能關閉的話,就需要quoting處理了。在bash中,常用的quoting有如下三種方法:
hard quote:' '(單引號),凡在hard quote中的所有meta均被關閉。
soft quote:“”(雙引號),在soft quote中大部份meta都會被關閉,但某些則保留(如$)。(注二:在soft quote中被豁免的具體meta清單,我不完全知道,有待大家補充,或透過實作來發現及理解。)
escape : \(反斜線),只有緊接在escape(跳脫字符)之后的單一meta才被關閉。
下面的例子將有助于我們對quoting的了解:
$ A=B C #空白鍵未被關掉,作為IFS處理。 $ C: command not found. $ echo $A $ A="B C" #空白鍵已被關掉,僅作為空白鍵處理。 $ echo $A B C
在第一次設定A變量時,由于空白鍵沒被關閉,command line將被解讀為:A=B然后碰到<IFS>,再執行C命令
在第二次設定A變量時,由于空白鍵被置于soft quote中,因此被關閉,不再作為IFS:A=B<space>C
事實上,空白鍵無論在soft quote還是在hard quote中,均會被關閉。Enter鍵亦然:
$ A='B > C > ' $ echo "$A" B C
在上例中,由于<enter>被置于hard quote當中,因此不再作為CR字符來處理。這里的<enter>單純只是一個斷行符號(new-line)而已,由于command line并沒得到CR字符,因此進入第二個shell prompt(PS2,以>符號表示),command line并不會結束,直到第三行,我們輸入的<enter>并不在hard quote里面,因此并沒被關閉,此時,command line碰到CR字符,于是結束、交給shell來處理。
上例的<enter>要是被置于soft quote中的話,CR也會同樣被關閉:
$ A="B > C >" $ echo $A B C
然而,由于echo $A時的變量沒至于soft quote中,因此當變量替換完成后并作命令行重組時,<enter>會被解釋為IFS,而不是解釋為New Line字符。
同樣的,用escape亦可關閉CR字符:
$ A=B\ > C\ > $ echo $A BC
上例中,第一個<enter>跟第二個<enter>均被escape字符關閉了,因此也不作為CR來處理,
但第三個<enter>由于沒被跳脫,因此作為CR結束command line。
但由于<enter>鍵本身在shell meta中的特殊性,在\跳脫后面,僅僅取消其CR功能,而不會保留其IFS功能。
您或許發現光是一個<enter>鍵所產生的字符就有可能是如下這些可能:CR、IFS、NL(New Line)、FF(Form Feed)、NULL ...至于什么時候會解釋為什么字符,這個我就沒去深挖了,或是留給讀者諸君自行慢慢摸索了…^_^
至于soft quote跟hard quote的不同,主要是對于某些meta的關閉與否,以$來作說明:
$ A=B\ C $ echo "$A" B C $ echo '$A' $A
在第一個echo命令行中,$被置于soft quote中,將不被關閉,因此繼續處理變量替換,因此echo將A的變量值輸出到熒幕,也就得到B C的結果。在第二個echo命令行中,$被置于hard quote中,則被關閉,因此$只是一個$符號,并不會用來作變量替換處理,因此結果是$符號后面接一個A字母:$A。
# 練習與思考:如下結果為何不同? $ A=B\ C $ echo '"$A"' #最外面的是單引號 "$A" $ echo "'$A'" #最外面的是雙引號 'B C'
(提示:單引號及雙引號,在quoting中均被關閉了。)
在CU的shell版里,我發現有很多初學者的問題,都與quoting理解的有關。比方說,若我們在awk或sed的命令參數中調用之前設定的一些變量時,常會問及為何不能的問題。要解決這些問題,關鍵點就是:
區分出shell meta與command meta
前面我們提到的那些meta,都是在command line中有特殊用途的,比方說{ }是將其內一系列command line置于不具名的函式中執行(可簡單視為command block),但是,awk卻需要用{ }來區分出awk的命令區段(BEGIN,MAIN,END)。若你在command line中如此輸入:
$ awk {print $0} 1.txt
由于{ }在shell中并沒關閉,那shell就將{print $0}視為command block,但同時又沒有;符號作命令區隔,因此就出現awk的語法錯誤結果。要解決之,可用hard quote:
$ awk '{print $0}' 1.txt
上面的hard quote應好理解,就是將原本的{、<space>、$(注三)、}這幾個shell meta關閉,避免掉在shell中遭到處理,而完整的成為awk參數中的command meta。(注三:而其中的$0是awk內置的field number,而非awk的變量,awk自身的變量無需使用$。)
要是理解了hard quote的功能,再來理解soft quote與escape就不難:
awk "{print \$0}" 1.txt awk \{print\ \$0\} 1.txt
然而,若你要改變awk的$0的0值是從另一個shell變量讀進呢?比方說:已有變量$A的值是0,那如何在command line中解決awk的$$A呢?你可以很直接否定掉hard quoe的方案:
$ awk '{print $$A}' 1.txt
那是因為$A的$在hard quote中是不能替換變量的。聰明的讀者(如你!),經過本章學習,我想,應該可以解釋為何我們可以使用如下操作了吧:
A=0 awk "{print \$$A}" 1.txt awk \{print\ \$$A\} 1.txt awk '{print $'$A'}' 1.txt awk '{print $'"$A"'}' 1.txt #注:“$A”包在soft quote中
或許,你能舉出更多的方案呢….^_^
第5問:var=value? export前后差在哪?
這次讓我們暫時丟開command line,先來了解一下bash變量(variable)吧…
所謂的變量,就是利用一個特定的“名稱”(name)來存取一段可以變化的“值”(value)。
設定(set)
在bash中,你可以用“=”來設定或重新定義變量的內容:
name=value
在設定變量的時侯,得遵守如下規則:
等號左右兩邊不能使用區隔符號(IFS),也應避免使用shell的保留字元(meta charactor)。
變量名稱不能使用$符號。
變量名稱的第一個字母不能是數字(number)。
變量名稱長度不可超過256個字母。
變量名稱及變量值之大小寫是有區別的(case sensitive)。
如下是一些變量設定時常見的錯誤:
A= B # 不能有IFS
1A=B # 不能以數字開頭
$A=B # 名稱不能有$
a=B # 這跟a=b是不同的(這不是錯誤,提醒windows的使用者要特別注意)
如下則是可以接受的設定:
A=" B" # IFS被關閉了(請參考前面的quoting章節) A1=B # 并非以數字開頭 A=$B # $可用在變量值內 This_Is_A_Long_Name=b #可用_連接較長的名稱或值,且大小寫有別。
變量替換(substitution)
Shell之所以強大,其中的一個因素是它可以在命令行中對變量作替換(substitution)處理。
在命令行中使用者可以使用$符號加上變量名稱(除了在用=號定義變量名稱之外),
將變量值給替換出來,然后再重新組建命令行。
比方:
$ A=ls $ B=la $ C=/tmp $ $A -$B $C
(注意:以上命令行的第一個$是shell prompt,并不在命令行之內。)
必需強調的是,我們所提的變量替換,只發生在command line上面。(是的,讓我們再回到command line吧﹗)仔細分析最后那行command line,不難發現在被執行之前(在輸入CR字符之前),
$符號會對每一個變量作替換處理(將變量值替換出來再重組命令行),最后會得出如下命令行:
ls -la /tmp
還記得第二章我請大家“務必理解”的那兩句嗎?若你忘了,那我這里再重貼一遍:
若從技術細節來看,shell會依據IFS(Internal Field Seperator)將command line所輸入的文字給拆解為“字段”(word)。然后再針對特殊字符(meta)先作處理,最后再重組整行command line。這里的$就是command line中最經典的meta之一了,就是作變量替換的﹗
在日常的shell操作中,我們常會使用echo命令來查看特定變量的值,例如:
$ echo $A -$B $C
我們已學過,echo命令只單純將其argument送至“標準輸出”(STDOUT,通常是我們的熒幕)。所以上面的命令會在熒幕上得到如下結果:
ls -la /tmp
這是由于echo命令在執行時,會先將$A(ls)、$B(la)、跟$C(/tmp)給替換出來的結果。
利用shell對變量的替換處理能力,我們在設定變量時就更為靈活了:
A=B B=$A
這樣,B的變量值就可繼承A變量“當時”的變量值了。不過,不要以“數學邏輯”來套用變量的設定,比方說:
A=B B=C
這樣并不會讓A的變量值變成C。再如:
A=B B=$A A=C
同樣也不會讓B的值換成C。上面是單純定義了兩個不同名稱的變量:A與B,它們的值分別是B與C。
若變量被重復定義的話,則原有舊值將被新值所取代。(這不正是“可變的量”嗎?^_^)
當我們在設定變量的時侯,請記著這點:用一個名稱儲存一個數值,僅此而已。此外,我們也可利用命令行的變量替換能力來“擴充”(append)變量值:
A=B:C:D A=$A:E
這樣,第一行我們設定A的值為“B:C:D”,然后,第二行再將值擴充為“B:C:D:E”。
上面的擴充示例,我們使用區隔符號(:)來達到擴充目的,要是沒有區隔符號的話,如下是有問題的:
A=BCD A=$AE
因為第二次是將A的值繼承$AE的提換結果,而非$A再加E!要解決此問題,我們可用更嚴謹的替換處理:
A=BCD A=${A}E
上例中,我們使用{}將變量名稱的范圍給明確定義出來,如此一來,我們就可以將A的變量值從BCD給擴充為BCDE。(提示:關于${name}事實上還可做到更多的變量處理能力,這些均屬于比較進階的變量處理,
export
嚴格來說,我們在當前shell中所定義的變量,均屬于“本地變量”(local variable),只有經過export命令的“輸出”處理,才能成為環境變量(environment variable):
$ A=B $ export A
或:
$ export A=B
經過export輸出處理之后,變量A就能成為一個環境變量供其后的命令使用。在使用export的時侯,請別忘記shell在命令行對變量的“替換”(substitution)處理,比方說:
$ A=B $ B=C $ export $A
上面的命令并未將A輸出為環境變量,而是將B作輸出,這是因為在這個命令行中,$A會首先被替換為B,然后再“塞回”作export的參數。要理解這個export,事實上需要從process的角度來理解才能透徹。我將于下一章為大家說明process的觀念,敬請留意。
取消變量
要取消一個變量,在bash中可使用unset命令來處理:
unset A
與export一樣,unset命令行也同樣會作變量替換(這其實就是shell的功能之一),因此:
$ A=B $ B=C $ unset $A
事實上所取消的變量是B而不是A。
此外,變量一旦經過unset取消之后,其結果是將整個變量拿掉,而不僅是取消其變量值。
如下兩行其實是很不一樣的:
$ A= $ unset A
第一行只是將變量A設定為“空值”(null value),但第二行則讓變量A不在存在。
雖然用眼睛來看,這兩種變量狀態在如下命令結果中都是一樣的:
$ A= $ echo $A $ unset A $ echo $A
請學員務必能識別null value與unset的本質區別,這在一些進階的變量處理上是很嚴格的。比方說:
$ str= #設為null $ var=${str=expr} #定義var $ echo $var $ echo $str $ unset str #取消 $ var=${str=expr} #定義var $ echo $var expr $ echo $str expr
聰明的讀者(yes,you!),稍加思考的話,應該不難發現為何同樣的var=${str=expr}在null與unset之下的不同吧?若你看不出來,那可能是如下原因之一:
你太笨了
不了解var=${str=expr}這個進階處理
對本篇說明還沒來得及消化吸收
我講得不好
不知,你選哪個呢?….^_^ 嗯... 好吧,我就解釋一下 var=${str=expr} :
首先,var=$str 這個大家都可理解吧。而接下來的思考方向是,究竟 $str 這個變量是如下哪一種情況呢:
unset
null
not null
假如是 unset ,那麼 var=${str=expr} 的結果將是:
var=expr str=expr
假如是 null ,那 var=${str=expr} 的結果是:
var= str=
假如是 not null (比方為 xyz ),那 var=${str=expr} 之結果是:
var=xyz str=xyz
第6問:exec跟source差在哪?
這次先讓我們從CU Shell版的一個實例貼子來談起吧:(論壇改版后原連接已經失效)例中的提問原文如下:
cd /etc/aa/bb/cc 可以執行,但是把這條命令寫入shell時shell不執行!這是什么原因呀!(意思是:運行腳本后并沒有移到/etc/aa/bb/cc目錄)
我當時如何回答暫時別去深究,先讓我們了解一下行程(process)的觀念好了。首先,我們所執行的任何程序,都是由父行程(parent process)所產生出來的一個子行程(child process),子行程在結束后,將返回到父行程去。此一現像在Linux系統中被稱為fork。(為何要程為fork呢?嗯,畫一下圖或許比較好理解…^_^)
當子行程被產生的時候,將會從父行程那里獲得一定的資源分配、及(更重要的是)繼承父行程的環境﹗讓我們回到上一章所談到的“環境變量”吧:
所謂環境變量其實就是那些會傳給子行程的變量。簡單而言,“遺傳性”就是區分本地變量與環境變量的決定性指標。
然而,從遺傳的角度來看,我們也不難發現環境變量的另一個重要特征:
環境變量只能從父行程到子行程單向繼承。換句話說:在子行程中的環境如何變更,均不會影響父行程的環境。
接下來,再讓我們了解一下命令腳本(shell script)的概念。所謂的shell script講起來很簡單,就是將你平時在shell prompt后所輸入的多行command line依序寫入一個文件去而已。其中再加上一些條件判斷、互動界面、參數運用、函數調用等等技巧,得以讓script更加“聰明”的執行,但若撇開這些技巧不談,我們真的可以簡單的看成script只不過依次執行預先寫好的命令行而已。
再結合以上兩個概念(process + script),那應該就不難理解如下這句話的意思了:
正常來說,當我們執行一個shell script時,其實是先產生一個sub-shell的子行程,然后sub-shell再去產生命令行的子行程。
然則,那讓我們回到本章開始時所提到的例子再從新思考:cd /etc/aa/bb/cc可以執行,但是把這條命令寫入shell時shell不執行!這是什么原因呀!我當時的答案是這樣的:
因為,一般我們跑的shell script是用subshell去執行的。從process的觀念來看,是parent process產生一個child process去執行,當child結束后,會返回parent,但parent的環境是不會因child的改變而改變的。所謂的環境元數很多,凡舉effective id,variable,workding dir等等…其中的workding dir($PWD)正是樓主的疑問所在:當用subshell來跑script的話,sub shell的$PWD會因為cd而變更,但當返回primary shell時,$PWD是不會變更的。
能夠了解問題的原因及其原理是很好的,但是?如何解決問題恐怕是我們更感興趣的﹗是吧?^_^
那好,接下來,再讓我們了解一下source命令好了。當你有了fork的概念之后,要理解source就不難:
所謂source就是讓script在當前shell內執行、而不是產生一個sub-shell來執行。
由于所有執行結果均于當前shell內完成,若script的環境有所改變,當然也會改變當前環境了﹗因此,只要我們將原本單獨輸入的script命令行變成source命令的參數,就可輕易解決前例提到的問題了。
比方說,原本我們是如此執行script的:
./my.script
現在改成這樣即可:
source ./my.script
或:
../my.script
說到這里,我想,各位有興趣看看/etc底下的眾多設定文件,應該不難理解它們被定義后,如何讓其他script讀取并繼承了吧?若然,日后你有機會寫自己的script,應也不難專門指定一個設定文件以供不同的script一起“共享”了…^_^
okay,到這里,若你搞得懂fork與source的不同,那接下來再接受一個挑戰:
那exec又與source/fork有何不同呢?
哦…要了解exec或許較為復雜,尤其扯上File Descriptor的話…不過,簡單來說:
exec也是讓script在同一個行程上執行,但是原有行程則被結束了。也就是簡而言之:原有行程會否終止,就是exec與source/fork的最大差異了。
嗯,光是從理論去理解,或許沒那么好消化,不如動手“實作+思考”來的印象深刻哦。下面讓我們寫兩個簡單的script,分別命名為1.sh及2.sh:
1.sh
#!/bin/bash A=B echo "PID for 1.sh before exec/source/fork:$$" export A echo "1.sh: \$A is $A" case $1 in exec) echo "using exec…" exec ./2.sh;; source) echo "using source…" ../2.sh;; *) echo "using fork by default…" ./2.sh;; esac echo "PID for 1.sh after exec/source/fork:$$" echo "1.sh: \$A is $A"
2.sh
#!/bin/bash echo "PID for 2.sh: $$" echo "2.sh get \$A=$A from 1.sh" A=C export A echo "2.sh: \$A is $A"
然后,分別跑如下參數來觀察結果:
$ ./1.sh fork $ ./1.sh source $ ./1.sh exec
好了,別忘了仔細比較輸出結果的不同及背后的原因哦…若有疑問,歡迎提出來一起討論討論~~~happy scripting!^_^
第7問:( ) 與 { } 差在哪?
嗯,這次輕松一下,不講太多…^_^
先說一下,為何要用()或{ }好了。許多時候,我們在shell操作上,需要在一定條件下一次執行多個命令,也就是說,要么不執行,要么就全執行,而不是每次依序的判斷是否要執行下一個命令。或是,需要從一些命令執行優先次順中得到豁免,如算術的2*(3+4)那樣…
這時候,我們就可引入“命令群組”(command group)的概念:將多個命令集中處理。在shell command line中,一般人或許不太計較()與{ }這兩對符號的差異,雖然兩者都可將多個命令作群組化處理,但若從技術細節上,卻是很不一樣的:
( ) 將command group置于sub-shell去執行,也稱nested sub-shell。
{ } 則是在同一個shell內完成,也稱為non-named command group。
若,你對上一章的fork與source的概念還記得了的話,那就不難理解兩者的差異了。
要是在command group中扯上變量及其他環境的修改,我們可以根據不同的需求來使用()或{ }。
通常而言,若所作的修改是臨時的,且不想影響原有或以后的設定,那我們就nested sub-shell,反之,則用non-named command group。
是的,光從command line來看,()與{ }的差別就講完了,夠輕松吧~~~ ^_^
然而,若這兩個meta用在其他command meta或領域中(如Regular Expression),還是有很多差別的。只是,我不打算再去說明了,留給讀者自己慢慢發掘好了…我這里只想補充一個概念,就是function。
所謂的function,就是用一個名字去命名一個command group,然后再調用這個名字去執行command group。從non-named command group來推斷,大概你也可以猜到我要說的是{ }了吧?(yes!你真聰明﹗^_^)
在bash中,function的定義方式有兩種:
方式一:
function function_name { command1 command2 command3 … }
方式二:
fuction_name() { command1 command2 command3 … }
用哪一種方式無所謂,只是若碰到所定意的名稱與現有的命令或別名(Alias)沖突的話,方式二或許會失敗。但方式二起碼可以少打function這一串英文字母,對懶人來說(如我),又何樂不為呢?…^_^
function在某一程度來說,也可稱為“函式”,但請不要與傳統編程所使用的函式(library)搞混了,畢竟兩者差異很大。惟一相同的是,我們都可以隨時用“已定義的名稱”來調用它們…
若我們在shell操作中,需要不斷的重覆執行某些命令,我們首先想到的,或許是將命令寫成命令腳本(shell script)。不過,我們也可以寫成function,然后在command line中打上function_name就可當一舨的script來使用了。
只是若你在shell中定義的function,除了可用unset function_name取消外,一旦退出shell,function也跟著取消。
然而,在script中使用function卻有許多好處,除了可以提高整體script的執行性能外(因為已被加載),還可以節省許多重覆的代碼…
簡單而言,若你會將多個命令寫成script以供調用的話,那,你可以將function看成是script中的script…^_^
而且,透過上一章介紹的source命令,我們可以自行定義許許多多好用的function,再集中寫在特定文件中,然后,在其他的script中用source將它們加載并反復執行。
若你是RedHat Linux的使用者,或許,已經猜得出/etc/rc.d/init.d/functions這個文件是作啥用的了~~~ ^_^
okay,說要輕松點的嘛,那這次就暫時寫到這吧。祝大家學習愉快﹗^_^
第8問:$(( )) 與 $( ) 還有${ } 差在哪?
我們上一章介紹了( )與{ }的不同,這次讓我們擴展一下,看看更多的變化:$()與${ }又是啥玩意兒呢?
在bash shell中,$() 與` `(反引號)都是用來做命令替換用(command substitution)的。所謂的命令替換與我們第五章學過的變量替換差不多,都是用來重組命令行:
完成引號里的命令行,然后將其結果替換出來,再重組命令行。
例如:
$ echo the last sunday is $(date -d "last sunday" +%Y-%m-%d)
如此便可方便得到上一星期天的日期了…^_^
在操作上,用$()或` `都無所謂,只是我”個人"比較喜歡用$(),理由是:
` `很容易與' '(單引號)搞混亂,尤其對初學者來說。有時在一些奇怪的字形顯示中,兩種符號是一模一樣的(直豎兩點)。當然了,有經驗的朋友還是一眼就能分辯兩者。只是,若能更好的避免混亂,又何樂不為呢?^_^
在多層次的復合替換中, 須要額外的跳脫(\`)處理,而$() 則比較直觀。例如:這是錯的:
command1 `command2 `command3` `
原本的意圖是要在command2 `command3`先將command3提換出來給command2處理,然后再將結果傳給command1 `command2…`來處理。然而,真正的結果在命令行中卻是分成了`command2`與` `兩段。正確的輸入應該如下:
command1 `command2 \`command3\` `
要不然,換成$()就沒問題了:
command1 $(command2 $(command3))
只要你喜歡,做多少層的替換都沒問題啦~~~ ^_^
不過,$()并不是沒有斃端的…
首先,`基本上可用在全部的unix shell中使用,若寫成shell script,其移植性比較高。而$()并不見的每一種shell都能使用,我只能跟你說,若你用bash3`的話,肯定沒問題…^_^
接下來,再讓我們看${}吧…它其實就是用來作變量替換用的啦。一般情況下,$var與${var}并沒有啥不一樣。但是用${}會比較精確的界定變量名稱的范圍,比方說:
$ A=B $ echo $AB
原本是打算先將$A的結果替換出來,然后再補一個B字母于其后,但在命令行上,真正的結果卻是只會提換變量名稱為AB的值出來…若使用${}就沒問題了:
$ echo ${A}B BB
不過,假如你只看到${}只能用來界定變量名稱的話,那你就實在太小看bash了﹗為了完整起見,我這里再用一些例子加以說明${}的一些特異功能。
假設我們定義了一個變量為:
file=/dir1/dir2/dir3/my.file.txt
我們可以用${}分別替換獲得不同的值:
${file#*/} # 拿掉第一條/及其左邊的字串:dir1/dir2/dir3/my.file.txt ${file##*/} # 拿掉最后一條/及其左邊的字串:my.file.txt ${file#*.} # 拿掉第一個.及其左邊的字串:file.txt ${file##*.} # 拿掉最后一個.及其左邊的字串:txt ${file%/*} # 拿掉最后條/及其右邊的字串:/dir1/dir2/dir3 ${file%%/*} # 拿掉第一條/及其右邊的字串:(空值) ${file%.*} # 拿掉最后一個.及其右邊的字串:/dir1/dir2/dir3/my.file ${file%%.*} #拿掉第一個.及其右邊的字串:/dir1/dir2/dir3/my
記憶的方法為:
# 是去掉左邊(在鍵盤上#在$之左邊)
% 是去掉右邊(在鍵盤上%在$之右邊)
單一符號是最小匹配,兩個符號是最大匹配。
${file:0:5} # 提取最左邊的5個字節:/dir1 ${file:5:5} # 提取第5個字節右邊的連續5個字節:/dir2
我們也可以對變量值里的字串作替換:
${file/dir/path} # 將第一個dir提換為path:/path2/dir2/dir3/my.file.txt ${file//dir/path} # 將全部dir提換為path:/path2/path3/path4/my.file.txt
利用${}還可針對不同的變數狀態賦值(沒設定、空值、非空值)
${file-my.file.txt} # 假如$file沒有設定,則使用my.file.txt作傳回值。(空值及非空值時不作處理) ${file:-my.file.txt} # 假如$file沒有設定或為空值,則使用my.file.txt作傳回值。(非空值時不作處理) ${file+my.file.txt} # 假如$file設為空值或非空值,均使用my.file.txt作傳回值。(沒設定時不作處理) ${file:+my.file.txt} # 若$file為非空值,則使用my.file.txt作傳回值。(沒設定及空值時不作處理) ${file=my.file.txt} # 若$file沒設定,則使用my.file.txt作傳回值,同時將$file賦值為my.file.txt。(空值及非空值時不作處理) ${file:=my.file.txt} # 若$file沒設定或為空值,則使用my.file.txt作傳回值,同時將$file賦值為my.file.txt。(非空值時不作處理) ${file?my.file.txt} # 若$file沒設定,則將my.file.txt輸出至STDERR。(空值及非空值時不作處理) ${file:?my.file.txt} # 若$file沒設定或為空值,則將my.file.txt輸出至STDERR。(非空值時不作處理)
Tips:
以上的理解在于,你一定要分清楚unset與null及non-null這三種賦值狀態。一般而言,: 與null有關,若不帶 : 的話,null不受影響,若帶 : 則連null也受影響。
還有哦,${#var}可計算出變量值的長度:
${#file} # 可得到27,因為/dir1/dir2/dir3/my.file.txt剛好是27個字節…
接下來,再為大家介稍一下bash的數組(array)處理方法。
一般而言,A="a b c def"這樣的變量只是將$A替換為一個單一的字串,但是改為A=(a b c def),則是將$A定義為數組…bash的數組替換方法可參考如下方法:
${A[@]}或${A[*]} # 可得到a b c def(全部組數)
${A[0]} # 可得到a(第一個組數),${A[1]}則為第二個組數…
${#A[@]}或${#A[*]} #可得到4(全部組數數量)
${#A[0]} #可得到1(即第一個組數(a)的長度),${#A[3]}可得到3(第四個組數(def)的長度)
A[3]=xyz # 則是將第四個組數重新定義為xyz…
能夠善用bash的$()與${}可大大提高及簡化shell在變量上的處理能力哦~~~ ^_^
好了,最后為大家介紹$(())的用途吧:它是用來作整數運算的。在bash中,$(())的整數運算符號大致有這些:+ - * /:分別為“加、減、乘、除”。%:余數運算。& | ^!:分別為“AND、OR、XOR、NOT”運算。
例:
$ a=5;b=7;c=2 $ echo $((a+b*c)) 19 $ echo $(((a+b)/c)) 6 $ echo $(((a*b)%c)) 1
在$(())中的變量名稱,可于其前面加$符號來替換,也可以不用,如:
$(($a + $b * $c))也可得到19的結果
此外,$(())還可作不同進位(如二進位、八進位、十六進位)作運算呢,只是,輸出結果皆為十進制而已:
echo $((16#2a)) # 結果為42(16進位轉十進制)
以一個實用的例子來看看吧:假如當前的umask是022,那么新建文件的權限即為:
$ umask 022 $ echo "obase=8;$((8#666 & (8#777 ^ 8#$(umask))))" | bc 644
事實上,單純用(())也可重定義變量值,或作testing:
a=5;((a++)) #可將$a重定義為6
a=5;((a--)) 則為a=4
a=5;b=7;((a < b)) 會得到0(true)的返回值。
常見的用于(())的測試符號有如下這些:
<:小于
\>:大于
<=:小于或等于
\>=:大于或等于
==:等于
!=:不等于
不過,使用(())作整數測試時,請不要跟[ ]的整數測試搞混亂了。(更多的測試我將于第十章為大家介紹)怎樣?好玩吧..^_^ okay,這次暫時說這么多…
上面的介紹,并沒有詳列每一種可用的狀態,更多的,就請讀者參考手冊文件啰…
第9問:$@ 與 $* 差在哪?
要說$@與$*之前,需得先從shell script的positional parameter談起…
我們都已經知道變量(variable)是如何定義及替換的,這個不用再多講了。但是,我們還需要知道有些變量是shell內定的,且其名稱是我們不能隨意修改的,其中就有positional parameter在內。在shell script中,我們可用$0,$1,$2,$3…這樣的變量分別提取命令行中的如下部份:
script_name parameter1 parameter2 parameter3…
我們很容易就能猜出$0就是代表shell script名稱(路徑)本身,而$1就是其后的第一個參數,如此類推… 須得留意的是IFS的作用,也就是,若IFS被quoting處理后,那么positional parameter也會改變。如下例:
my.sh p1 "p2 p3" p4
由于在p2與p3之間的空白鍵被soft quote所關閉了,因此my.sh中的$2是"p2 p3"而$3則是p4…
還記得前兩章我們提到fucntion時,我不是說過它是script中的script嗎?^_^ 是的,function一樣可以讀取自己的(有別于script的)postitional parameter,惟一例外的是$0而已。舉例而言:假設my.sh里有一個fucntion叫my_fun,若在script中跑my_fun fp1 fp2 fp3,那么,function內的$0是my.sh,而$1則是fp1而非p1了…不如寫個簡單的my.sh script看看吧:
#!/bin/bash my_fun() { echo '$0 inside function is '$0 echo '$1 inside function is '$1 echo '$2 inside function is '$2 } echo '$0 outside function is '$0 echo '$1 outside function is '$1 echo '$2 outside function is '$2 my_fun fp1 "fp2 fp3"
然后在command line中跑一下script就知道了:
chmod +x my.sh ./my.sh p1 "p2 p3" $0 outside function is ./my.sh $1 outside function is p1 $2 outside function is p2 p3 $0 inside function is ./my.sh $1 inside function is fp1 $2 inside function is fp2 fp3
然而,在使用positional parameter的時候,我們要注意一些陷井哦:
$10不是替換第10個參數,而是替換第一個參數($1)然后再補一個0于其后!
也就是,my.sh one two three four five six seven eigth nine ten這樣的command line,my.sh里的$10不是ten而是one0哦…小心小心!要抓到ten的話,有兩種方法:
方法一是使用我們上一章介紹的${ },也就是用${10}即可。
方法二,就是shift了。用通俗的說法來說,所謂的shift就是取消positional parameter中最左邊的參數($0不受影響)。其預設值為1,也就是shift或shift 1都是取消$1,而原本的$2則變成$1、$3變成$2…若shift 3則是取消前面三個參數,也就是原本的$4將變成$1…
那,親愛的讀者,你說要shift掉多少個參數,才可用$1取得${10}呢?^_^
okay,當我們對positional parameter有了基本概念之后,那再讓我們看看其他相關變量吧。
首先是$#:它可抓出positional parameter的數量。以前面的my.sh p1 "p2 p3"為例:由于p2與p3之間的IFS是在soft quote中,因此$#可得到2的值。但如果p2與p3沒有置于quoting中話,那$#就可得到3的值了。同樣的道理在function中也是一樣的…
因此,我們常在shell script里用如下方法測試script是否有讀進參數:
[ $# = 0 ]
假如為0,那就表示script沒有參數,否則就是有帶參數…
接下來就是$@與$*:精確來講,兩者只有在soft quote中才有差異,否則,都表示“全部參數”($0除外)。舉例來說好了:若在command line上跑my.sh p1 "p2 p3" p4的話,不管是$@還是$*,都可得到p1 p2 p3 p4就是了。但是,如果置于soft quote中的話:
"$@" 則可得到"p1" "p2 p3" "p4"這三個不同的詞段(word)
"$*" 則可得到"p1 p2 p3 p4"這一整串單一的詞段。
我們可修改一下前面的my.sh,使之內容如下:
#!/bin/bash my_fun() { echo "$#" } echo 'the number of parameter in "$@" is '$(my_fun "$@") echo 'the number of parameter in "$*" is '$(my_fun "$*")
然后再執行./my.sh p1 "p2 p3" p4就知道$@與$*差在哪了…^_^
the number of parameter in "$@" is 3 the number of parameter in "$*" is 1
第10問:&& 與 || 差在哪?
好不容易,進入兩位數的章節了…一路走來,很辛苦吧?也很快樂吧?^_^ 在解答本章題目之前,先讓我們了解一個概念:return value!
我們在shell下跑的每一個command或function,在結束的時候都會傳回父行程一個值,稱為return value。在shell command line中可用$?這個變量得到最"新"的一個return value,也就是剛結束的那個行程傳回的值。Return Value(RV)的取值為0-255之間,由程序(或script)的作者自行定議:
若在script里,用exit RV來指定其值,若沒指定,在結束時以最后一道命令之RV為值。
若在function里,則用return RV來代替exit RV即可。
Return Value的作用,是用來判斷行程的退出狀態(exit status),只有兩種:
0的話為“真”(true)
非0的話為“假”(false)
舉個例子來說明好了:假設當前目錄內有一份my.file的文件,而no.file是不存在的:
$ touch my.file $ ls my.file $ echo $? # first echo 0 $ ls no.file ls: no.file: No such file or directory $ echo $? # second echo 1 $ echo $? # third echo 0
上例的第一個echo是關于ls my.file的RV,可得到0的值,因此為true;第二個echo是關于ls no.file的RV,則得到非0的值,因此為false;第三個echo是關于第二個echo $?的RV,為0的值,因此也為true。
請記住:每一個command在結束時都會送回return value的! 不管你跑甚么樣的命令…然而,有一個命令卻是"專門"用來測試某一條件而送出return value以供true或false的判斷,它就是test命令了!
若你用的是bash,請在command line下打man test或man bash來了解這個test的用法。這是你可用作參考的最精確的文件了,要是聽別人說的,僅作參考就好…下面我只簡單作一些輔助說明,其余的一律以man為準:
首先,test的表示式我們稱為expression,其命令格式有兩種:
test expression or: [ expression ]
(請務必注意[ ]之間的空白鍵﹗)
用哪一種格式沒所謂,都是一樣的效果。(我個人比較喜歡后者…)其次,bash的test目前支持的測試對像只有三種:
string:字串,也就是純文字。
integer:整數(0或正整數,不含負數或小數點)。
file:文件。
請初學者一定要搞清楚這三者的差異,因為test所用的expression是不一樣的。
以A=123這個變量為例:
[ "$A" = 123 ] # 是字串的測試,以測試$A是否為1、2、3這三個連續的“文字”。 [ "A" -eq 123 ] # 是整數的測試,以測試$A是否等于“一百二十三”。 [ -e "$A" ] # 是關于文件的測試,以測試123這份“文件”是否存在。
第三,當expression測試為“真”時,test就送回0(true)的return value,否則送出非0(false)。若在expression之前加上一個!(感嘆號),則是當expression為“假時”才送出0,否則送出非0。
同時,test也允許多重的復合測試:
expression1 -a expression2 # 當兩個exrepssion都為true,才送出0,否則送出非0。 expression1 -o expression2 # 只需其中一個exrepssion為true,就送出0,只有兩者都為false才送出非0。
例如:
[ -d "$file" -a -x "$file" ]
是表示當$file是一個目錄、且同時具有x權限時,test才會為true。
第四,在command line中使用test時,請別忘記命令行的“重組”特性,也就是在碰到meta時會先處理meta再重新組建命令行。(這個特性我在第二及第四章都曾反復強調過)比方說,若test碰到變量或命令替換時,若不能滿足expression格式時,將會得到語法錯誤的結果。舉例來說好了:關于[ string1 = string2 ]這個test格式,在=號兩邊必須要有字串,其中包括空(null)字串(可用soft quote或hard quote取得)。
假如$A目前沒有定義,或被定議為空字串的話,那如下的寫法將會失敗:
$ unset A $ [ $A = abc ] [:=:unary operator expected
這是因為命令行碰到$這個meta時,會替換$A的值,然后再重組命令行,那就變成了:[ = abc ]
如此一來=號左邊就沒有字串存在了,因此造成test的語法錯誤﹗但是,下面這個寫法則是成立的:
$ [ "$A" = abc ] $ echo $? 1
這是因為在命令行重組后的結果為:[ "" = abc ]。由于=左邊我們用soft quote得到一個空字串,而讓test語法得以通過…讀者諸君請務必留意這些細節哦,因為稍一不慎,將會導至test的結果變了個樣!
若您對test還不是很有經驗的話,那在使用test時不妨先采用如下這一個"法則":
假如在test中碰到變量替換,用soft quote是最保險的﹗若你對quoting不熟的話,請重新溫習第四章的內容吧…^_^
okay,關于更多的test用法,老話一句:請看man page吧!^_^ 雖然洋洋灑灑講了一大堆,或許你還在嘀咕….那…那個return value有啥用啊?!問得好﹗
告訴你:return value的作用可大了﹗若你想讓你的shell變“聰明”的話,就全靠它了:
有了return value,我們可以讓shell跟據不同的狀態做不同的時情…
這時候,才讓我來揭曉本章的答案吧~~~ ^_^ && 與 || 都是用來“組建”多個command line用的:
command1 && command2:其意思是command2只有在RV為0(true)的條件下執行。
command1 || command2:其意思是command2只有在RV為非0(false)的條件下執行。
來,以例子來說好了:
$ A=123 $ [ -n "$A" ] && echo "yes!it's ture." yes!it's ture. $ unset A $ [ -n "$A" ] && echo "yes!it's ture." $ [ -n "$A" ] || echo "no,it's NOT ture." no,it's NOT ture.
(注:[ -n string ]是測試string長度大于0則為true。)
上例的第一個&&命令行之所以會執行其右邊的echo命令,是因為上一個test送回了0的RV值﹔但第二次就不會執行,因為test送回非0的結果…同理,||右邊的echo會被執行,卻正是因為左邊的test送回非0所引起的。
事實上,我們在同一命令行中,可用多個&&或||來組建呢:
$ A=123 $ [ -n "$A" ] && echo "yes!it's ture." || echo "no,it's NOT ture." yes!it's ture. $ unset A $ [ -n "$A" ] && echo "yes!it's ture." || echo "no,it's NOT ture." no,it's NOT ture.
怎樣,從這一刻開始,你是否覺得我們的shell是“很聰明”的呢?^_^ 好了,最后,布置一道習題給大家做做看...
下面的判斷是:當$A被賦與值時,再看是否小于100,否則送出too big!:
$ A=123 $ [ -n "$A" ] && [ "$A" -lt 100 ] || echo 'too big!' too big!
若我將A取消,照理說,應該不會送文字才對啊(因為第一個條件就不成立了)…
$ unset A $ [ -n "$A" ] && [ "$A" -lt 100 ] || echo 'too big!' too big!
感謝各位的閱讀!關于“Linux系統中bash shell編程的基礎問題有哪些”這篇文章就分享到這里了,希望以上內容可以對大家有一定的幫助,讓大家可以學到更多知識,如果覺得文章不錯,可以把它分享出去讓更多的人看到吧!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。