您好,登錄后才能下訂單哦!
本文首發于 vivo互聯網技術 微信公眾號?
鏈接:https://mp.weixin.qq.com/s/t__Jqzg1rbTlsCHXKMwh7A
作者:賴勇高
本文主要講解的是V8的技術,是V8的入門篇,主要目的是了解V8的內部機制,希望對前端,快應用,瀏覽器,以及nodejs同學有些幫助。這里不涉及到如何編寫優秀的前端,只是對JS內部引擎技術的講解。
V8的名字來源于汽車的“V型8缸發動機”(V8發動機)。V8發動機主要是美國發展起來,因為馬力十足而廣為人知。V8引擎的命名是Google向用戶展示它是一款強力并且高速的JavaScript引擎。
V8未誕生之前,早期主流的JavaScript引擎是JavaScriptCore引擎。JavaScriptCore是主要服務于Webkit瀏覽器內核,他們都是由蘋果公司開發并開源出來。據說Google是不滿意JavaScriptCore和Webkit的開發速度和運行速度,Google另起爐灶開發全新的JavaScript引擎和瀏覽器內核引擎,所以誕生了V8和Chromium兩大引擎,到現在已經是最受歡迎的瀏覽器相關軟件。
V8是依托Chrome發展起來的,后面確不局限于瀏覽器內核。發展至今V8應用于很多場景,例如流行的nodejs,weex,快應用,早期的RN。
V8引擎的誕生帶著使命而來,就是要在速度和內存回收上進行革命的。JavaScriptCore的架構是采用生成字節碼的方式,然后執行字節碼。Google覺得JavaScriptCore這套架構不行,生成字節碼會浪費時間,不如直接生成機器碼快。所以V8在前期的架構設計上是非常激進的,采用了直接編譯成機器碼的方式。后期的實踐證明Google的這套架構速度是有改善,但是同時也造成了內存消耗問題。可以看下V8的初期流程圖:
早期的V8有Full-Codegen和Crankshaft兩個編譯器。V8 首先用 Full-Codegen把所有的代碼都編譯一次,生成對應的機器碼。JS在執行的過程中,V8內置的Profiler篩選出熱點函數并且記錄參數的反饋類型,然后交給 Crankshaft 來進行優化。所以Full-Codegen本質上是生成的是未優化的機器碼,而Crankshaft生成的是優化過的機器碼。
隨著版本的引進,網頁的復雜化,V8也漸漸的暴露出了自己架構上的缺陷:
Full-Codegen編譯直接生成機器碼,導致內存占用大
Full-Codegen編譯直接生成機器碼,導致編譯時間長,導致啟動速度慢
Crankshaft 無法優化try,catch和finally等關鍵字劃分的代碼塊
為了解決上述缺點,V8采用JavaScriptCore的架構,生成字節碼。這里是不是感覺Google又繞回來了。V8采用生成字節碼的方式,整體流程如下圖:
Ignition是V8的解釋器,背后的原始動機是減少移動設備上的內存消耗。在Ignition之前,V8的Full-codegen基線編譯器生成的代碼通常占據Chrome整體JavaScript堆的近三分之一。這為Web應用程序的實際數據留下了更少的空間。
Ignition的字節碼可以直接用TurboFan生成優化的機器代碼,而不必像Crankshaft那樣從源代碼重新編譯。Ignition的字節碼在V8中提供了更清晰且更不容易出錯的基線執行模型,簡化了去優化機制,這是V8 自適應優化的關鍵特性。最后,由于生成字節碼比生成Full-codegen的基線編譯代碼更快,因此激活Ignition通常會改善腳本啟動時間,從而改善網頁加載。
TurboFan是V8的優化編譯器,TurboFan項目最初于2013年底啟動,旨在解決Crankshaft的缺點。Crankshaft只能優化JavaScript語言的子集。例如,它不是設計用于使用結構化異常處理優化JavaScript代碼,即由JavaScript的try,catch和finally關鍵字劃分的代碼塊。很難在Crankshaft中添加對新語言功能的支持,因為這些功能幾乎總是需要為九個支持的平臺編寫特定于體系結構的代碼。
采用新架構后的優勢
不同架構下V8的內存對比,如圖:
結論:可以明顯看出Ignition+TurboFan架構比Full-codegen+Crankshaft架構內存降低一半多。
不同架構網頁速度提升對比,如圖:
結論:可以明顯看出Ignition+TurboFan架構比Full-codegen+Crankshaft架構70%網頁速度是有提升的。
接下來我們大致的講解下現有架構的每個流程:
學過編譯原理的同學可以知道,JS文件只是一個源碼,機器是無法執行的,詞法分析就是把源碼的字符串分割出來,生成一系列的token,如下圖可知不同的字符串對應不同的token類型。
詞法分析完后,接下來的階段就是進行語法分析。語法分析語法分析的輸入就是詞法分析的輸出,輸出是AST抽象語法樹。當程序出現語法錯誤的時候,V8在語法分析階段拋出異常。
七、V8 AST抽象語法樹
下圖是一個add函數的抽象語法樹數據結構
V8 Parse階段后,接下來就是根據抽象語法樹生成字節碼。如下圖可以看出add函數生成對應的字節碼:
BytecodeGenerator類的作用是根據抽象語法樹生成對應的字節碼,不同的node會對應一個字節碼生成函數,函數開頭為Visit****。如下圖+號對應的函數字節碼生成:
void BytecodeGenerator::VisitArithmeticExpression(BinaryOperation* expr) {
FeedbackSlot slot = feedback_spec()->AddBinaryOpICSlot();
Expression* subexpr;
Smi* literal;
if (expr->IsSmiLiteralOperation(&subexpr, &literal)) {
VisitForAccumulatorValue(subexpr);
builder()->SetExpressionPosition(expr);
builder()->BinaryOperationSmiLiteral(expr->op(), literal,
feedback_index(slot));
} else {
Register lhs = VisitForRegisterValue(expr->left());
VisitForAccumulatorValue(expr->right());
builder()->SetExpressionPosition(expr); // 保存源碼位置 用于調試
builder()->BinaryOperation(expr->op(), lhs, feedback_index(slot)); // 生成Add字節碼
}
}
上述可知有個源碼位置記錄,然后下圖可知源碼和字節碼位置的對應關系:
生成字節碼,那字節碼如何執行的呢?接下來講解下:
八、字節碼
首先說下V8字節碼:
?每個字節碼指定其輸入和輸出作為寄存器操作數
?Ignition 使用registers寄存器 r0,r1,r2... 和累加器寄存器(accumulator register)
?registers寄存器:函數參數和局部變量保存在用戶可見的寄存器中
如下圖ADD字節碼:
字節碼執行
下面一系列圖表示每個字節碼執行時,對應寄存器和累加器的變化,add函數傳入10,20的參數,最終累加器返回的結果是50。
每個字節碼對應一個處理函數,字節碼處理程序保存的地址在dispatch_table_中。執行字節碼時會調用到對應的字節碼處理程序進行執行。Interpreter類成員dispatch_table_保存了每個字節碼的處理程序地址。
例如ADD字節碼對應的處理函數是(當執行ADD字節碼時候,會調用InterpreterBinaryOpAssembler類):
IGNITION_HANDLER(Add, InterpreterBinaryOpAssembler) {
BinaryOpWithFeedback(&BinaryOpAssembler::Generate_AddWithFeedback);
}
void BinaryOpWithFeedback(BinaryOpGenerator generator) {
Node* reg_index = BytecodeOperandReg(0);
Node* lhs = LoadRegister(reg_index);
Node* rhs = GetAccumulator();
Node* context = GetContext();
Node* slot_index = BytecodeOperandIdx(1);
Node* feedback_vector = LoadFeedbackVector();
BinaryOpAssembler binop_asm(state());
Node* result = (binop_asm.*generator)(context, lhs, rhs, slot_index,
feedback_vector, false);
SetAccumulator(result); // 將ADD計算的結果設置到累加器中
Dispatch(); // 處理下一條字節碼
}
其實到此JS代碼就已經執行完成了。在執行過程中,發現有熱點函數,V8會啟用Turbofan進行優化編譯,直接生成機器碼。所以接下來講解下Turbofan優化編譯器:
Turbofan是根據字節碼和熱點函數反饋類型生成優化后的機器碼,Turbofan很多優化過程,基本和編譯原理的后端優化差不多,采用的sea-of-node。
add函數優化:
function add(x, y) {
return x+y;
}
add(1, 2);
%OptimizeFunctionOnNextCall(add);
add(1, 2);
V8是有函數可以直接調用指定優化哪個函數,執行%OptimizeFunctionOnNextCall主動調用Turbofan優化add函數,根據上次調用的參數反饋優化add函數,很明顯這次的反饋是整型數,所以turbofan會根據參數是整型數進行優化直接生成機器碼,下次函數調用直接調用優化好的機器碼。(注意執行V8需要加上 --allow-natives-syntax,OptimizeFunctionOnNextCall為內置函數,只有加上 --allow-natives-syntax,JS才能調用內置函數 ,否則執行會報錯)。
JS的add函數生成對應的機器碼如下:
這里會涉及small interger小整數概念,可以查看這篇文章https://zhuanlan.zhihu.com/p/82854566
如果把add函數的傳入參數改成字符
function add(x, y) {
return x+y;
}
add(1, 2);
%OptimizeFunctionOnNextCall(add);
add(1, 2);
優化后的add函數生成對應的機器碼如下:
對比上面兩圖,add函數傳入不同的參數,經過優化生成不同的機器碼。
如果傳入的是整型,則本質上是直接調用add匯編指令
如果傳入的是字符串,則本質上是調用V8的內置Add函數
到此V8的整體執行流程就結束了。文章中可能存在理解不正確的地方敬請指出。
https://v8.dev/docs
https://docs.google.com/presentation/d/1HgDDXBYqCJNasBKBDf9szap1j4q4wnSHhOYpaNy5mHU/edit#slide=id.g17d335048f\_1\_1105
https://docs.google.com/presentation/d/1Z9iIHojKDrXvZ27gRX51UxHD-bKf1QcPzSijntpMJBM/edit#slide=id.p
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。