您好,登錄后才能下訂單哦!
上次寫Stream pipe細節時,在源碼中發現一段無用邏輯,由此引發了對Stream data事件觸發時機與順序的探索。
無用邏輯
當時研究pipe細節是基于Node.js v8.11.1的源碼,其中針對上游的ondata事件處理有如下一段代碼:
// If the user pushes more data while we're writing to dest then we'll end up // in ondata again. However, we only want to increase awaitDrain once because // dest will only emit one 'drain' event for the multiple writes. // => Introduce a guard on increasing awaitDrain. var increasedAwaitDrain = false; src.on('data', ondata); function ondata(chunk) { debug('ondata'); increasedAwaitDrain = false; var ret = dest.write(chunk); if (false === ret && !increasedAwaitDrain) { if (((state.pipesCount === 1 && state.pipes === dest) || (state.pipesCount > 1 && state.pipes.indexOf(dest) !== -1)) && !cleanedUp) { debug('false write response, pause', src._readableState.awaitDrain); src._readableState.awaitDrain++; increasedAwaitDrain = true; } src.pause(); } }
重點關注increasedAwaitDrain
變量,理解這個變量期望達到什么目的,然后仔細閱讀代碼,會發現if (false === ret && !increasedAwaitDrain)
語句中increasedAwaitDrain
變量肯定是false,因為前一行才將該變量賦值為false,這樣一來這個變量就變得毫無意義。
increasedAwaitDrain = false; var ret = dest.write(chunk); if (false === ret && !increasedAwaitDrain) {}
以上就是關鍵的三行代碼,因為Node.js是單線程且dest.write(chunk)
內部沒有修改變量increasedAwaitDrain
的值,那么if語句中increasedAwaitDrain
的值肯定還是false,即increasedAwaitDrain
相關邏輯沒有達到所期望的目標。
無用代碼出現的原因
前段雖已經分析出increasedAwaitDrain
沒起到作用,但作者為什么寫了這樣一段邏輯呢?其實在定義increasedAwaitDrain
語句的上方,作者說可能存在這樣一種情況:“當我們接收到一次上游的ondata事件并嘗試將數據寫到下游時,上游可能同時又有一個data事件觸發,而這兩個ondata的數據在寫入下游時可能都返回false,從而導致src._readableState.awaitDrain++
執行兩次”。
awaitDrain++
執行兩次是作者不希望看到的情況,因為下游觸發drain事件時awaitDrain
相應減1,直到其值為0時才讓上游重新流動,如果awaitDrain++
執行兩次,下游卻只觸發一次drain事件,awaitDrain
就不會為0,上游不重新流動也就無法繼續讀取數據。
真相的探索過程
雖然從理性上認為increasedAwaitDrain
沒起到作用,但也無法肯定加絕對,自己嘗試去求助,沒有出現高手指點出問題所在,但一個同事聽我描述后,說可能這就是個BUG,雖心中覺得可能性不大,但還是抱著試試看的心態切換到master分支上去瞅瞅,隨即發現最新的代碼里并沒有與increasedAwaitDrain
類似的邏輯,間接說明v8.11.1分支上increasedAwaitDrain
相關邏輯的確無用。
雖然比較肯定這里存在一段無用代碼,但應該如何理解作者在increasedAwaitDrain
上方的注釋呢?為了進一步揭露真相,自己繼續花時間去看了看stream.Readable相關代碼,想知道data事件的觸發時機與順序是如何決定的。
readable流的簡單原理
在進一步解釋data事件的觸發順序前,簡單講一下readable流的實現原理,如果需要自己實現一個readable流,可以使用new stream.Readable(options)方法,其中options可包含四個屬性:highWaterMark、encoding、objectMode、read。最主要的是read屬性,當流的使用者需要數據時,read方法被用來從數據源獲取數據,然后通過this.push(chunk)
將數據傳遞給使用者,如果沒有更多數據可供讀取時使用this.push(null)
表示讀取結束。
const Readable = require('stream').Readable; let letter = 'ABCDEFG'.split(''); let index = 0; const rs = new Readable({ read(size) { this.push(letter[index++] || null); } }); rs.on('data', chunk => { console.log(chunk.toString()); }); // 輸出 // A // B // C // ...
這里ondata雖然沒有明顯調用read方法,但內部依舊是通過調用read方法結合this.push輸出數據,并且在源代碼內部可以發現通過參數傳遞的read方法實際上被賦值給this._read,然后在Readable.prototype.read中調用this._read獲取數據。
靈魂代碼
為了進一步說明stream.Readable的data事件觸發順序與場景,將有關官方源碼經過修改和刪減成如下:
function Readable(options) { this._read = options.read; // 將參數傳遞的read函數賦值到this._read } // 使用者通過調用read方法獲取數據 Readable.prototype.read = function (size) { var state = this._readableState; // 模擬鎖,一次_read如果沒有返回(this.push),后續read不會繼續調用_read讀取數據 if (!state.reading) { state.reading = true; state.sync = true; // sync用于在push方法中指示_read內部是否同步調用了push this._read(size); state.sync = false; } // _read內部如果是同步調用push,數據會放入緩沖區 // _read內部如果是異步調用push且緩沖區沒有內容,數據可能emit data返回 // 嘗試從緩沖區(state.buffer)中獲取大小為size的數據,如果獲取成功則觸發data事件 if (ret) this.emit('data', ret); return ret; }; // 在this._read執行過程中通過this.push輸出數據 Readable.prototype.push = function (chunk, encoding) { var state = this._readableState; // 本次_read獲取到數據,打開鎖 state.reading = false; // 流動模式 & 緩沖區沒有數據 & 非同步返回,則直接觸發data事件 if (state.flowing && state.length === 0 && !state.sync) { stream.emit('data', chunk); stream.read(0); // 觸發下一次讀取,_read異步push的話還是會到這里,類似flow中的保持流出于流動 } else { // 將數據放入緩沖區 state.length += chunk.length; state.buffer.push(chunk); } }; // 暫停流動 Readable.prototype.pause = function() { if (this._readableState.flowing !== false) { this._readableState.flowing = false; this.emit('pause'); } return this; }; function flow(stream) { const state = stream._readableState; while (state.flowing && stream.read() !== null); }
data事件的觸發時機與順序
時機
data的觸發只有兩處:
順序
關于data的觸發順序,實際是由emit順序決定,為討論原始問題:“increasedAwaitDrain
相關邏輯為什么可以被刪除?”,將代碼簡化:
let count = 0; src.on('data', chunk => { let ret = dest.write(chunk); if (!ret) { count++; src.pause(); } });
當監聽流的data事件時,流最終會通過resume并調用flow函數進入流動模式模式,即不斷的調用read方法讀取數據。接下來分析以下幾種場景,當dest.write(chunk)
返回false時++count
會執行幾次,注意結合前文的靈魂代碼。
當發生第一次讀取,數據同步push到緩沖區,緊接著從緩沖區中讀取數據并通過emit data的方式傳遞到ondata中,如果此時dest.write(chunk)返回false,count++將執行一次,接著由于調用了stream.pause(),while條件state.flowing為false導致stream.read不再被調用,在流重新流動前,count的值不會繼續增加。
當發生第一次讀取,異步push的數據將直接通過emit data傳遞到ondata中,而read函數中的emit由于無法從緩沖區讀取數據從而不會觸發,同時read返回null導致while循環也相應停止,此種情況下異步push觸發data事件后,緊接著的stream.read(0)會繼續保持流的流動,當dest.write(chunk)返回false,count++執行一次并將流暫停,緊接著會繼續調用一次read,但這次數據將被放入緩沖區且不觸發data事件,count++依舊只執行一次。
場景二流暫停一次后再次流動時,數據消耗模式與之前會有所差異,會優先消耗緩沖區數據直至為空時回到之前的模式,但這同樣不會導致count++執行多次。
與場景一類似,只是每次_read會多次往緩沖區寫入數據,最終data事件還是依靠從緩沖區讀數據后觸發。
同場景二類似,假設在一次_read中有兩次異步push,當第一個異步push執行時,data事件觸發且其中的dest.write(chunk)返回false,導致count++同時流被暫停,等第二個異步push執行時,由于流已經暫停,數據將寫入緩沖區而不是觸發data事件,所以count++只執行一次。
不管是同步或者異步push,當一次ondata內部將流設置為暫停模式后,flow函數中while條件state.flowing為false將導致stream.read不再調用,異步的push的emit data判斷條件同樣不再滿足,即目前階段內部不會再有data事件觸發直到外部再次間接或直接調用read方法。
以上五個場景是為了分析該問題而模擬的,實際只要能理解第五個場景就能明白所有。
小結
文章最終寫出來的內容與我最開始的初衷所偏離,而且自己不知道如何評價這篇文章的好壞,但為了寫這文章花了兩天業余時間去深入理解stream.Readable卻是非常有收獲的一件事情,更堅定自己在寫文章的路途上可以走的更遠。
PS:猜測為什么有爛電影的存在,可能是因為導演長時間投入的創作會讓他迷失在內部而無法發現問題,寫文章也是,難以通過閱讀去優化費心思寫的文章。
PS:下圖是美團博客的,也許我寫了這么多卻抵不上這張圖,說明方式很重要。
總結
以上就是這篇文章的全部內容了,希望本文的內容對大家的學習或者工作具有一定的參考學習價值,謝謝大家對億速云的支持。如果你想了解更多相關內容請查看下面相關鏈接
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。