您好,登錄后才能下訂單哦!
如何利用PHP實現協程?針對這個問題,這篇文章給出了相對應的分析和解答,希望能幫助更多想解決這個問題的朋友找到更加簡單易行的辦法。
先搞清楚,什么是協程。
你可能已經聽過『進程』和『線程』這兩個概念。
進程就是二進制可執行文件在計算機內存里的一個運行實例,就好比你的.exe文件是個類,進程就是new出來的那個實例。
進程是計算機系統進行資源分配和調度的基本單位(調度單位這里別糾結線程進程的),每個CPU下同一時刻只能處理一個進程。
所謂的并行,只不過是看起來并行,CPU事實上在用很快的速度切換不同的進程。
進程的切換需要進行系統調用,CPU要保存當前進程的各個信息,同時還會使CPUCache被廢掉。
所以進程切換不到非不得已就不做。
那么怎么實現『進程切換不到非不得已就不做』呢?
首先進程被切換的條件是:進程執行完畢、分配給進程的CPU時間片結束,系統發生中斷需要處理,或者進程等待必要的資源(進程阻塞)等。你想下,前面幾種情況自然沒有什么話可說,但是如果是在阻塞等待,是不是就浪費了。
其實阻塞的話我們的程序還有其他可執行的地方可以執行,不一定要傻傻的等!
所以就有了線程。
線程簡單理解就是一個『微進程』,專門跑一個函數(邏輯流)。
所以我們就可以在編寫程序的過程中將可以同時運行的函數用線程來體現了。
線程有兩種類型,一種是由內核來管理和調度。
我們說,只要涉及需要內核參與管理調度的,代價都是很大的。這種線程其實也就解決了當一個進程中,某個正在執行的線程遇到阻塞,我們可以調度另外一個可運行的線程來跑,但是還是在同一個進程里,所以沒有了進程切換。
還有另外一種線程,他的調度是由程序員自己寫程序來管理的,對內核來說不可見。這種線程叫做『用戶空間線程』。
協程可以理解就是一種用戶空間線程。
協程,有幾個特點:
說到這里,你應該明白協程的基本概念了吧?
一步一步來,從解釋概念說起!
PHP5提供了一種定義對象的方法使其可以通過單元列表來遍歷,例如用foreach
語句。
你如果要實現一個可迭代對象,你就要實現Iterator
接口:
<?php class MyIterator implements Iterator { private $var = array(); public function __construct($array) { if (is_array($array)) { $this->var = $array; } } public function rewind() { echo "rewinding\n"; reset($this->var); } public function current() { $var = current($this->var); echo "current: $var\n"; return $var; } public function key() { $var = key($this->var); echo "key: $var\n"; return $var; } public function next() { $var = next($this->var); echo "next: $var\n"; return $var; } public function valid() { $var = $this->current() !== false; echo "valid: {$var}\n"; return $var; } } $values = array(1,2,3); $it = new MyIterator($values); foreach ($it as $a => $b) { print "$a: $b\n"; }
可以說之前為了擁有一個能夠被foreach
遍歷的對象,你不得不去實現一堆的方法,yield
關鍵字就是為了簡化這個過程。
生成器提供了一種更容易的方法來實現簡單的對象迭代,相比較定義類實現Iterator
接口的方式,性能開銷和復雜性大大降低。
<?php function xrange($start, $end, $step = 1) { for ($i = $start; $i <= $end; $i += $step) { yield $i; } } foreach (xrange(1, 1000000) as $num) { echo $num, "\n"; }
記住,一個函數中如果用了yield
,他就是一個生成器,直接調用他是沒有用的,不能等同于一個函數那樣去執行!
所以,yield
就是yield
,下次誰再說yield
是協程,我肯定把你xxxx。
前面介紹協程的時候說了,協程需要程序員自己去編寫調度機制,下面我們來看這個機制怎么寫。
既然生成器不能像函數一樣直接調用,那么怎么才能調用呢?
方法如下:
Task就是一個任務的抽象,剛剛我們說了協程就是用戶空間協程,線程可以理解就是跑一個函數。
所以Task的構造函數中就是接收一個閉包函數,我們命名為coroutine
。
/** * Task任務類 */ class Task { protected $taskId; protected $coroutine; protected $beforeFirstYield = true; protected $sendValue; /** * Task constructor. * @param $taskId * @param Generator $coroutine */ public function __construct($taskId, Generator $coroutine) { $this->taskId = $taskId; $this->coroutine = $coroutine; } /** * 獲取當前的Task的ID * * @return mixed */ public function getTaskId() { return $this->taskId; } /** * 判斷Task執行完畢了沒有 * * @return bool */ public function isFinished() { return !$this->coroutine->valid(); } /** * 設置下次要傳給協程的值,比如 $id = (yield $xxxx),這個值就給了$id了 * * @param $value */ public function setSendValue($value) { $this->sendValue = $value; } /** * 運行任務 * * @return mixed */ public function run() { // 這里要注意,生成器的開始會reset,所以第一個值要用current獲取 if ($this->beforeFirstYield) { $this->beforeFirstYield = false; return $this->coroutine->current(); } else { // 我們說過了,用send去調用一個生成器 $retval = $this->coroutine->send($this->sendValue); $this->sendValue = null; return $retval; } } }
接下來就是Scheduler
這個重點核心部分,他扮演著調度員的角色。
/** * Class Scheduler */ Class Scheduler { /** * @var SplQueue */ protected $taskQueue; /** * @var int */ protected $tid = 0; /** * Scheduler constructor. */ public function __construct() { /* 原理就是維護了一個隊列, * 前面說過,從編程角度上看,協程的思想本質上就是控制流的主動讓出(yield)和恢復(resume)機制 * */ $this->taskQueue = new SplQueue(); } /** * 增加一個任務 * * @param Generator $task * @return int */ public function addTask(Generator $task) { $tid = $this->tid; $task = new Task($tid, $task); $this->taskQueue->enqueue($task); $this->tid++; return $tid; } /** * 把任務進入隊列 * * @param Task $task */ public function schedule(Task $task) { $this->taskQueue->enqueue($task); } /** * 運行調度器 */ public function run() { while (!$this->taskQueue->isEmpty()) { // 任務出隊 $task = $this->taskQueue->dequeue(); $res = $task->run(); // 運行任務直到 yield if (!$task->isFinished()) { $this->schedule($task); // 任務如果還沒完全執行完畢,入隊等下次執行 } } } }
這樣我們基本就實現了一個協程調度器。
你可以使用下面的代碼來測試:
<?php function task1() { for ($i = 1; $i <= 10; ++$i) { echo "This is task 1 iteration $i.\n"; yield; // 主動讓出CPU的執行權 } } function task2() { for ($i = 1; $i <= 5; ++$i) { echo "This is task 2 iteration $i.\n"; yield; // 主動讓出CPU的執行權 } } $scheduler = new Scheduler; // 實例化一個調度器 $scheduler->addTask(task1()); // 添加不同的閉包函數作為任務 $scheduler->addTask(task2()); $scheduler->run();
關鍵說下在哪里能用得到PHP協程。
function task1() { /* 這里有一個遠程任務,需要耗時10s,可能是一個遠程機器抓取分析遠程網址的任務,我們只要提交最后去遠程機器拿結果就行了 */ remote_task_commit(); // 這時候請求發出后,我們不要在這里等,主動讓出CPU的執行權給task2運行,他不依賴這個結果 yield; yield (remote_task_receive()); ... } function task2() { for ($i = 1; $i <= 5; ++$i) { echo "This is task 2 iteration $i.\n"; yield; // 主動讓出CPU的執行權 } }
這樣就提高了程序的執行效率。
關于『系統調用』的實現,鳥哥已經講得很明白,我這里不再說明。
鳥哥文中還有一個協程堆棧的例子。
我們上面說過了,如果在函數中使用了yield
,就不能當做函數使用。
所以你在一個協程函數中嵌套另外一個協程函數:
<?php function echoTimes($msg, $max) { for ($i = 1; $i <= $max; ++$i) { echo "$msg iteration $i\n"; yield; } } function task() { echoTimes('foo', 10); // print foo ten times echo "---\n"; echoTimes('bar', 5); // print bar five times yield; // force it to be a coroutine } $scheduler = new Scheduler; $scheduler->addTask(task()); $scheduler->run();
這里的echoTimes是執行不了的!所以就需要協程堆棧。
不過沒關系,我們改一改我們剛剛的代碼。
把Task中的初始化方法改下,因為我們在運行一個Task的時候,我們要分析出他包含了哪些子協程,然后將子協程用一個堆棧保存。(C語言學的好的同學自然能理解這里,不理解的同學我建議去了解下進程的內存模型是怎么處理函數調用)
/** * Task constructor. * @param $taskId * @param Generator $coroutine */ public function __construct($taskId, Generator $coroutine) { $this->taskId = $taskId; // $this->coroutine = $coroutine; // 換成這個,實際Task->run的就是stackedCoroutine這個函數,不是$coroutine保存的閉包函數了 $this->coroutine = stackedCoroutine($coroutine); }
當Task->run()的時候,一個循環來分析:
/** * @param Generator $gen */ function stackedCoroutine(Generator $gen) { $stack = new SplStack; // 不斷遍歷這個傳進來的生成器 for (; ;) { // $gen可以理解為指向當前運行的協程閉包函數(生成器) $value = $gen->current(); // 獲取中斷點,也就是yield出來的值 if ($value instanceof Generator) { // 如果是也是一個生成器,這就是子協程了,把當前運行的協程入棧保存 $stack->push($gen); $gen = $value; // 把子協程函數給gen,繼續執行,注意接下來就是執行子協程的流程了 continue; } // 我們對子協程返回的結果做了封裝,下面講 $isReturnValue = $value instanceof CoroutineReturnValue; // 子協程返回`$value`需要主協程幫忙處理 if (!$gen->valid() || $isReturnValue) { if ($stack->isEmpty()) { return; } // 如果是gen已經執行完畢,或者遇到子協程需要返回值給主協程去處理 $gen = $stack->pop(); //出棧,得到之前入棧保存的主協程 $gen->send($isReturnValue ? $value->getValue() : NULL); // 調用主協程處理子協程的輸出值 continue; } $gen->send(yield $gen->key() => $value); // 繼續執行子協程 } }
然后我們增加echoTime的結束標示:
class CoroutineReturnValue { protected $value; public function __construct($value) { $this->value = $value; } // 獲取能把子協程的輸出值給主協程,作為主協程的send參數 public function getValue() { return $this->value; } } function retval($value) { return new CoroutineReturnValue($value); }
然后修改echoTimes
:
function echoTimes($msg, $max) { for ($i = 1; $i <= $max; ++$i) { echo "$msg iteration $i\n"; yield; } yield retval(""); // 增加這個作為結束標示 }
Task
變為:
function task1() { yield echoTimes('bar', 5); }
這樣就實現了一個協程堆棧,現在你可以舉一反三了。
PHP7中增加了yield from
,所以我們不需要自己實現攜程堆棧,真是太好了。
把Task的構造函數改回去:
public function __construct($taskId, Generator $coroutine) { $this->taskId = $taskId; $this->coroutine = $coroutine; // $this->coroutine = stackedCoroutine($coroutine); //不需要自己實現了,改回之前的 }
echoTimes
函數:
function echoTimes($msg, $max) { for ($i = 1; $i <= $max; ++$i) { echo "$msg iteration $i\n"; yield; } }
task1
生成器:
function task1() { yield from echoTimes('bar', 5); }
這樣,輕松調用子協程。
以上便是利用PHP實現協程的方法,雖然從篇幅上看很復雜,但是示例代碼非常詳細且容易理解,如果想了解更多相關內容,請關注億速云行業資訊。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。