您好,登錄后才能下訂單哦!
這篇文章給大家分享的是有關PHP排序算法之快速排序Quick Sort及其優化算法的示例分析的內容。小編覺得挺實用的,因此分享給大家做個參考,一起跟隨小編過來看看吧。
本文實例講述了PHP排序算法之快速排序(Quick Sort)及其優化算法。分享給大家供大家參考,具體如下:
基本思想:
快速排序(Quicksort)是對冒泡排序的一種改進。他的基本思想是:通過一趟排序將待排記錄分割成獨立的兩部分,其中一部分的關鍵字均比另一部分記錄的關鍵字小,則可分別對這兩部分記錄繼續進行快速排序,整個排序過程可以遞歸進行,以達到整個序列有序的目的。
基本算法步驟:
舉個栗子:
假如現在待排序記錄是:
6 2 7 3 8 9
第一步、創建變量 $low 指向記錄中的第一個記錄,$high 指向最后一個記錄,$pivot 作為樞軸賦值為待排序記錄的第一個元素(不一定是第一個),這里:
$low = 0; $high = 5; $pivot = 6;
第二步、我們要把所有比 $pivot 小的數移動到 $pivot 的左面,所以我們可以開始尋找比6小的數,從 $high 開始,從右往左找,不斷遞減變量 $high 的值,我們找到第一個下標 3 的數據比 6 小,于是把數據 3 移到下標 0 的位置($low 指向的位置),把下標 0 的數據 6 移到下標 3,完成第一次比較:
3 2 7 6 8 9
//這時候,$high 減小為 3 $low = 0; $high = 3; $pivot = 6;
第三步、我們開始第二次比較,這次要變成找比 $pivot 大的了,而且要從前往后找了。遞加變量 $low,發現下標 2 的數據是第一個比 $pivot 大的,于是用下標 2 ($low 指向的位置)的數據 7 和 指向的下標 3 ($high 指向的位置)的數據的 6 做交換,數據狀態變成下表:
3 2 6 7 8 9
//這時候,$high 減小為 3 $low = 2; $high = 3; $pivot = 6;
完成第二步和第三步我們稱為完成一個循環。
第四步(也就是開啟下一個循環)、模仿第二步的過程執行。
第五步、模仿第三步的過程執行。
執行完第二個循環之后,數據狀態如下:
3 2 6 7 8 9
//這時候,$high 減小為 3 $low = 2; $high = 2; $pivot = 6;
到了這一步,我們發現 $low 和 $high“碰頭”了:他們都指向了下標 2。于是,第一遍比較結束。得到結果如下,凡是 $pivot(=6) 左邊的數都比它小,凡是 $pivot 右邊的數都比它大。
然后,對 、$pivot 兩邊的數據 {3,2} 和 {7,8,9},再分組分別進行上述的過程,直到不能再分組為止。
注意:第一遍快速排序不會直接得到最終結果,只會把比k大和比k小的數分到k的兩邊。為了得到最后結果,需要再次對下標2兩邊的數組分別執行此步驟,然后再分解數組,直到數組不能再分解為止(只有一個數據),才能得到正確結果。
算法實現:
//交換函數 function swap(array &$arr,$a,$b){ $temp = $arr[$a]; $arr[$a] = $arr[$b]; $arr[$b] = $temp; } //主函數: function QuickSort(array &$arr){ $low = 0; $high = count($arr) - 1; QSort($arr,$low,$high); }
主函數中,由于第一遍快速排序是對整個數組排序的,因此開始是 $low=0,$high=count($arr)-1
。
然后 QSort()
函數是個遞歸調用過程,因此對它封裝了一下:
function QSort(array &$arr,$low,$high){ //當 $low >= $high 時表示不能再進行分組,已經能夠得出正確結果了 if($low < $high){ $pivot = Partition($arr,$low,$high); //將$arr[$low...$high]一分為二,算出樞軸值 QSort($arr,$low,$pivot - 1); //對低子表($pivot左邊的記錄)進行遞歸排序 QSort($arr,$pivot + 1,$high); //對高子表($pivot右邊的記錄)進行遞歸排序 } }
從上面的 QSort()函數中我們看出,Partition()函數才是整段代碼的核心,因為該函數的功能是:選取當中的一個關鍵字,比如選擇第一個關鍵字。然后想盡辦法將它放到某個位置,使得它左邊的值都比它小,右邊的值都比它大,我們將這樣的關鍵字成為樞軸(pivot)。
直接上代碼:
//選取數組當中的一個關鍵字,使得它處于數組某個位置時,左邊的值比它小,右邊的值比它大,該關鍵字叫做樞軸 //使樞軸記錄到位,并返回其所在位置 function Partition(array &$arr,$low,$high){ $pivot = $arr[$low]; //選取子數組第一個元素作為樞軸 while($low < $high){ //從數組的兩端交替向中間掃描(當 $low 和 $high 碰頭時結束循環) while($low < $high && $arr[$high] >= $pivot){ $high --; } swap($arr,$low,$high); //終于遇到一個比$pivot小的數,將其放到數組低端 while($low < $high && $arr[$low] <= $pivot){ $low ++; } swap($arr,$low,$high); //終于遇到一個比$pivot大的數,將其放到數組高端 } return $low; //返回high也行,畢竟最后low和high都是停留在pivot下標處 }
組合起來的整個代碼如下:
function swap(array &$arr,$a,$b){ $temp = $arr[$a]; $arr[$a] = $arr[$b]; $arr[$b] = $temp; } function Partition(array &$arr,$low,$high){ $pivot = $arr[$low]; //選取子數組第一個元素作為樞軸 while($low < $high){ //從數組的兩端交替向中間掃描 while($low < $high && $arr[$high] >= $pivot){ $high --; } swap($arr,$low,$high); //終于遇到一個比$pivot小的數,將其放到數組低端 while($low < $high && $arr[$low] <= $pivot){ $low ++; } swap($arr,$low,$high); //終于遇到一個比$pivot大的數,將其放到數組高端 } return $low; //返回high也行,畢竟最后low和high都是停留在pivot下標處 } function QSort(array &$arr,$low,$high){ if($low < $high){ $pivot = Partition($arr,$low,$high); //將$arr[$low...$high]一分為二,算出樞軸值 QSort($arr,$low,$pivot - 1); //對低子表進行遞歸排序 QSort($arr,$pivot + 1,$high); //對高子表進行遞歸排序 } } function QuickSort(array &$arr){ $low = 0; $high = count($arr) - 1; QSort($arr,$low,$high); }
我們調用算法:
$arr = array(9,1,5,8,3,7,4,6,2); QuickSort($arr); var_dump($arr);
運行結果:
array(9) { [0]=> int(1) [1]=> int(2) [2]=> int(3) [3]=> int(4) [4]=> int(5) [5]=> int(6) [6]=> int(7) [7]=> int(8) [8]=> int(9) }
復雜度分析:
在最優的情況下,也就是選擇數軸處于整個數組的中間值的話,則每一次就會不斷將數組平分為兩半。因此最優情況下的時間復雜度是 O(nlogn) (跟堆排序、歸并排序一樣)。
最壞的情況下,待排序的序列是正序或逆序的,那么在選擇樞軸的時候只能選到邊緣數據,每次劃分得到的比上一次劃分少一個記錄,另一個劃分為空,這樣的情況的最終時間復雜度為 O(n^2).
綜合最優與最差情況,平均的時間復雜度是 O(nlogn).
快速排序是一種不穩定排序方法。
由于快速排序是個比較高級的排序,而且被列為20世紀十大算法之一。。。。如此牛掰的算法,我們還有什么理由不去學他呢!
盡管這個算法已經很牛掰了,但是上面的算法程序依然有改進的地方,下面具體討論一下
快速排序算法優化
優化一:優化選取樞軸:
在前面的復雜度分析的過程中,我們看到最壞的情況無非就是當我們選中的樞軸是整個序列的邊緣值。比如這么一個序列:
9 1 5 8 3 7 4 6 2
按照習慣我們選擇數組的第一個元素作為樞軸,則 $pivot = 9,在一次循環下來后劃分為{1,5,8,3,7,4,6,2} 和{ }(空序列),也就是每一次劃分只得到少一個記錄的子序列,而另一個子序列為空。最終時間復雜度為 O(n^2)。最優的情況是當我們選中的樞軸是整個序列的中間值。但是我們不能每次都去遍歷數組拿到最優值吧?那么就有了一下解決方法:
1、隨機選取:隨機選取 $low 到 $high 之間的數值,但是這樣的做法有些撞大運的感覺了,萬一沒撞成功呢,那上面的問題還是沒有解決。
2、三數取中法:取三個關鍵字先進行排序,取出中間數作為樞軸。這三個數一般取最左端、最右端和中間三個數,也可以隨機取三個數。這樣的取法得到的樞軸為中間數的可能性就大大提高了。由于整個序列是無序的,隨機選擇三個數和從左中右端取出三個數其實就是同一回事。而且隨機數生成器本身還會帶來時間的開銷,因此隨機生成不予考慮。
出于這個想法,我們修改 Partition()
函數:
function Partition(array &$arr,$low,$high){ $mid = floor($low + ($high - $low) / 2); //計算數組中間的元素的下標 if($arr[$low] > $arr[$high]){ swap($arr,$low,$high); } if($arr[$mid] > $arr[$high]){ swap($arr,$mid,$high); } if($arr[$low] < $arr[$mid]){ swap($arr,$low,$mid); } //經過上面三步之后,$arr[$low]已經成為整個序列左中右端三個關鍵字的中間值 $pivot = $arr[$low]; while($low < $high){ //從數組的兩端交替向中間掃描(當 $low 和 $high 碰頭時結束循環) while($low < $high && $arr[$high] >= $pivot){ $high --; } swap($arr,$low,$high); //終于遇到一個比$pivot小的數,將其放到數組低端 while($low < $high && $arr[$low] <= $pivot){ $low ++; } swap($arr,$low,$high); //終于遇到一個比$pivot大的數,將其放到數組高端 } return $low; //返回high也行,畢竟最后low和high都是停留在pivot下標處 }
三數取中法對于小數組有很大可能能溝得出比較理想的 $pivot,但是對于大數組就未必了,因此還有個辦法是九數取中法。。。。。。
優化二:優化不必要的交換:
現在假如有個待排序的序列如下:
5 1 9 3 7 4 8 6 2
根據三數取中法我們取 5 7 2 中的 5 作為樞軸。
當你按照快速排序算法走一個循環,你會發現 5 的下標變換順序是這樣的:0 -> 8 -> 2 -> 5 -> 4,但是它的最終目標就是 4 的位置,當中的交換其實是不需要的。
根據這個思想,我們改進我們的 Partition()
函數:
function Partition(array &$arr,$low,$high){ $mid = floor($low + ($high - $low) / 2); //計算數組中間的元素的下標 if($arr[$low] > $arr[$high]){ swap($arr,$low,$high); } if($arr[$mid] > $arr[$high]){ swap($arr,$mid,$high); } if($arr[$low] < $arr[$mid]){ swap($arr,$low,$mid); } //經過上面三步之后,$arr[$low]已經成為整個序列左中右端三個關鍵字的中間值 $pivot = $arr[$low]; $temp = $pivot; while($low < $high){ //從數組的兩端交替向中間掃描(當 $low 和 $high 碰頭時結束循環) while($low < $high && $arr[$high] >= $pivot){ $high --; } //swap($arr,$low,$high); //終于遇到一個比$pivot小的數,將其放到數組低端 $arr[$low] = $arr[$high]; //使用替換而不是交換的方式進行操作 while($low < $high && $arr[$low] <= $pivot){ $low ++; } //swap($arr,$low,$high); //終于遇到一個比$pivot大的數,將其放到數組高端 $arr[$high] = $arr[$low]; } $arr[$low] = $temp; //將樞軸數值替換回 $arr[$low]; return $low; //返回high也行,畢竟最后low和high都是停留在pivot下標處 }
在上面的改進中,我們使用替換而不是交進行操作,由于在這當中少了多次的數據交換,因此在性能上也是有所提高的。
優化三:優化小數組的排序方案:
對于一個數學科學家、博士生導師,他可以攻克世界性的難題,可以培育最優秀的數學博士,當讓他去教小學生“1 + 1 = 2”的算術課程,那還真未必比常年在小學里耕耘的數學老師教的好。換句話說,大材小用有時會變得反而不好用。
也就是說,快速排序對于比較大數組來說是一個很好的排序方案,但是假如數組非常小,那么快速排序算法反而不如直接插入排序來得更好(直接插入排序是簡單排序中性能最好的)。其原因在于快速排序用到了遞歸操作,在大量數據排序的時候,這點性能影響相對于它的整體算法優勢而言是可以忽略的,但如果數組只有幾個記錄需要排序時,這就成了大炮打蚊子的大問題。
因此我們需要修改一下我們的 QSort()
函數:
//規定數組長度閥值 #define MAX_LENGTH_INSERT_SORT 7 function QSort(array &$arr,$low,$high){ //當 $low >= $high 時表示不能再進行分組,已經能夠得出正確結果了 if(($high - $low) > MAX_LENGTH_INSERT_SORT){ $pivot = Partition($arr,$low,$high); //將$arr[$low...$high]一分為二,算出樞軸值 QSort($arr,$low,$pivot - 1); //對低子表($pivot左邊的記錄)進行遞歸排序 QSort($arr,$pivot + 1,$high); //對高子表($pivot右邊的記錄)進行遞歸排序 }else{ //直接插入排序 InsertSort($arr); } }
PS:上面的直接插入排序算法大家可以參考:《PHP排序算法之直接插入排序(Straight Insertion Sort)》
在這里我們增加一個判斷,當 $high - $low 不大于一個常數時(有資料認為 7 比較合適,也有認為 50 比較合適,實際情況可以是適當調整),就用直接插入排序,這樣就能保證最大化的利用這兩種排序的優勢來完成排序工作。
優化四:優化遞歸操作:
大家知道,遞歸對性能時有一定影響的,QSort()
函數在其尾部有兩次遞歸的操作,如果待排序的序列劃分極端不平衡(就是我們在選擇樞軸的時候不是中間值),那么遞歸的深度將趨近于 n,而不是平衡時的 log?n,這就不僅僅是速度快慢的問題了。
我們也知道,遞歸是通過棧來實現的,棧的大小是很有限的,每次遞歸調用都會耗費一定的棧空間,函數的參數越多,每次遞歸耗費的空間也越多,因此如果能減少隊規,將會大大提高性能。
聽說,遞歸都可以改造成循環實現。我們在這里就是使用循環去優化遞歸。(關于遞歸與循環大家可以參考知乎里面的討論 《所有遞歸都可以改寫成循環嗎?》)
我們對QSort()
函數尾部遞歸進行優化:
//規定數組長度閥值 #define MAX_LENGTH_INSERT_SORT 7 function QSort(array &$arr,$low,$high){ //當 $low >= $high 時表示不能再進行分組,已經能夠得出正確結果了 if(($high - $low) > MAX_LENGTH_INSERT_SORT){ while($low < $high){ $pivot = Partition($arr,$low,$high); //將$arr[$low...$high]一分為二,算出樞軸值 QSort($arr,$low,$pivot - 1); //對低子表($pivot左邊的記錄)進行遞歸排序 $low = $pivot + 1; } }else{ //直接插入排序 InsertSort($arr); } }
在上面,我們使用循環替換遞歸,減少了之前一般的遞歸量。結果是一樣的,但是采用循環而不是遞歸的方法可以縮減堆棧的深度,從而提高了整體性能。
好了、終于寫完了。這篇博客基本上是 Copy 《大話數據結構》里面的內容,在這里總結出來不僅是一個記錄,大家也可以從中獲得很大的收獲。
感謝各位的閱讀!關于“PHP排序算法之快速排序Quick Sort及其優化算法的示例分析”這篇文章就分享到這里了,希望以上內容可以對大家有一定的幫助,讓大家可以學到更多知識,如果覺得文章不錯,可以把它分享出去讓更多的人看到吧!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。