您好,登錄后才能下訂單哦!
今天小編給大家分享的是PHP 8的JIT特性介紹,相信很多人都不太了解,為了讓大家更加了解,所以給大家總結了以下內容,一起往下看吧。一定會有所收獲的哦。
TL;DR
PHP 8 的 JIT(Just In Time)編譯器將作為擴展集成到 php 中 Opcache 擴展 用于運行時將某些操作碼直接轉換為從 cpu 指令。
這意味著使用 JIT 后,Zend VM 不需要解釋某些操作碼,并且這些指令將直接作為 CPU 級指令執行。
PHP 8 的 JIT
PHP 8 Just In Time (JIT) 編譯器帶來的影響是毋庸置疑的。但是到目前為止,我發現關于 JIT 應該做什么卻知之甚少。
經過多次研究和放棄,我決定親自檢查 PHP 源代碼。結合我對 C 語言的一些知識和我目前收集到的所有零散信息,我提出了這篇文章,我希望它能幫助您更好地理解 PHP 的 JIT。
簡單一點來說 : 當 JIT 按預期工作時,您的代碼不會通過 Zend VM 執行,而是作為一組 CPU 級指令直接執行。
這就是全部的想法。
但是為了更好地理解它,我們需要考慮 php 如何在內部工作。不是很復雜,但需要一些介紹。
PHP 的代碼是怎么執行的?
總所周知, PHP 是解釋型語言,但這句話本身是什么意思呢?
每次執行 PHP 代碼(命令行腳本或者 WEB 應用)時,都要經過 PHP 解釋器。最常用的是 PHP-FPM 和 CLI 解釋器。
解釋器的工作很簡單:接收 PHP 代碼,對其進行解釋,然后返回結果。
一般的解釋型語言都是這個流程。有些語言可能會減少幾個步驟,但總體的思路相同。在 PHP 中,這個流程如下:
讀取 PHP 代碼并將其解釋為一組稱為 Tokens 的關鍵字。這個過程讓解釋器知道各個程序都寫了哪些代碼。 這一步稱為 Lexing 或 Tokenizing 。
拿到 Tokens 集合以后,PHP 解釋器將嘗試解析他們。通過稱之為 Parsing 的過程生成抽象語法樹(AST)。這里 AST 是一個節點集表示要執行哪些操作。比如,「 echo 1 + 1 」實際含義是 「打印 1 + 1 的結果」 或者更詳細的說 「打印一個操作,這個操作是 1 + 1」。
有了 AST ,可以更輕松地理解操作和優先級。將抽象語法樹轉換成可以被 CPU 執行的操作需要一個用于過渡的表達式 (IR),在 PHP 中我們稱之為 Opcodes 。將 AST 轉換為 Opcodes 的過程稱為 compilation 。
有了 Opcodes ,有趣的部分就來了: executing 代碼! PHP 有一個稱為 Zend VM 的引擎,該引擎能夠接收一系列 Opcodes 并執行它們。執行所有 Opcodes 后, Zend VM 就會將該程序終止。
這個圖可以讓你更清楚:
一個簡化版的 PHP 解釋流程概述。
如你所見。這里有個問題:即使 PHP 代碼沒改變,每次執行還是會走此流程嗎?
讓我們看回 Opcodes 。對了!這就是 Opcache 擴展 存在的原因。
Opcache 擴展
Opcache 擴展是 PHP 附帶的,通常沒必要停用它。使用 PHP 最好打開 Opcache 。
它的作用是為 Opcodes 添加一個內存共享緩存層。它的工作是從 AST 中提取新生成的 Opcodes 并緩存它們,以便執行時
可以跳過 Lexing/Tokenizing 和 Parsing 步驟。
這是包含 Opcache 擴展的流程示意圖:
PHP 使用 Opcache 的解釋流程。如果文件已經被解析,則 PHP 會為其獲取緩存的 Opcodes ,而不是再次解析。
完美的跳過了 Lexing/Tokenizing 、 Parsing 和 Compiling 步驟 。
旁注: 這是超贊的 PHP 7.4 預加載功能 RFC ! 允許你告訴 PHP FPM 解析代碼庫,將其轉換為 Opcodes 并且在執行之前就將其緩存。
你想知道 JIT 是怎么參與這個解釋流程的嗎?這篇文章的將說明。
Just In Time 編譯有什么效果?
聽了 Zeev 在 PHP Internals News 發表的 PHP 和 JIT 廣播 之后,我弄清了 JIT 實際做了什么事情。
如果說 Opcache 擴展可以更快的獲取 Opcodes 將其直接轉到 Zend VM,則 JIT 讓它們完全不使用 Zend VM 即可運行。
Zend VM 是用 C 編寫的程序,充當 Opcodes 和 CPU 之間的一層。 JIT 在運行時直接生成編譯后的代碼,因此 PHP 可以
跳過 Zend VM 并直接被 CPU 執行。 從理論上說,性能會更好。
這聽起來很奇怪,因為在編譯成機器碼之前,需要為每種類型的結構體編寫一個具體的實現。但實際上這也是合理的。
PHP 的 JIT 使用了名為 DynASM (Dynamic Assembler) 的庫,該庫將一種特定格式的一組 CPU 指令映射為許多不同 CPU 類型的匯編代碼。因此,編譯器只需要使用 DynASM 就可以將 Opcodes 轉換為特定結構體的機器碼。
但是,有一個問題困擾了我很久。
如果預加載能夠在執行之前將 PHP 代碼解析為 Opcodes,并且 DynASM 可以將 Opcodes 編譯為機器碼 (Just In Time 編譯) ,為什么我們不立即使用運行前編譯 (Ahead of Time 編譯) 立即編譯 PHP 呢?
通過收聽 Zeev 的廣播,我找到的原因之一就是 PHP 是弱類型語言,這意味著在 Zend VM 嘗試執行某個操作碼之前, PHP 通常不知道變量的類型。
可以查看 Zend_value 聯合類型 得知,很多指針指向不同類型的變量。每當 Zend VM 嘗試從 Zend_value 獲取值時,它都會使用像 ZSTR_VAL 這樣的宏,獲取聯合類型中字符串的指針。
例如,這個 Zend VM handler 是處理「小于或等于」(<=) 表達式。看看它編碼這么多的 if else 分支,只是為了類型推斷。
使用機器碼執行類型推斷邏輯是不可行的,并且可能變得更慢。
先求值再編譯也不是一個好選擇,因為編譯為機器碼是 CPU 密集型任務。因此,在運行時編譯所有內容也不好。
那么 Just In Time 編譯是怎么做的?
現在我們知道無法很好的推斷類型來提前編譯。我們也知道在運行時進行編譯的運算成本很高。那么 JIT 對 PHP 有何好處呢?
為了尋求平衡, PHP 的 JIT 嘗試只編譯有價值的 Opcodes 。為此, JIT 會分析 Zend VM 要執行的 Opcodes 并檢查可能編譯的地方。(根據配置文件)
當某個 Opcode 編譯后,它將把執行交給該編譯后的代碼,而不是交給 Zend VM 。看起來如下:
PHP 的 JIT 解釋流程。如果已編譯,則 Opcodes 不會通過 Zend VM 執行。
因此,在 Opcache 擴展中,有兩條檢測指令判斷要不要編譯 Opcode 。如果要,編譯器將使用 DynASM 將此 Opcode 轉換為機器碼,并執行此機器碼。
有趣的是,由于當前接口中編譯的代碼有 MB 的限制 (也是可配置的),所以代碼執行必須能夠在 JIT 和解釋代碼之間無縫切換。
順便說一句,Benoit Jacquemont 在 php 的 JIT 上的這篇演講幫助我理解了這整件事。
我仍然不確定編譯部分什么時候有效進行,但我想現在我真的不想知道。
所以你的性能收益可能不會很大
我希望現在大家都很清楚為什么大多數 php 應用程序不會因為使用即時編譯器而獲得很大的性能收益。這也是為什么 Zeev 建議為你的應用程序分析和試驗不同的 JIT 配置是最好的方法。
如果您使用的是 PHP FPM,則通常會在多個請求之間共享已編譯的操作碼,但這仍然不能改變游戲規則。
這是因為 JIT 優化了計算密集型的操作,而如今大多數 php 應用程序比其他任何東西都更受 I/O 約束。如果您無論如何都要訪問磁盤或網絡,則處理操作是否已編譯則無關緊要。時間上將非常相似。
除非…
你正在做一些不受 I/O 約束的事情, 像圖像處理或機器學習。 任何不接觸 I/O 的東西都將受益于 JIT 編譯器。
這也是為什么現在人們說我們更愿意用 PHP 編寫原生功能而不是 C 編寫的原因。 如果仍然要編譯此功能,則開銷將毫無表現力。
有趣的時光成為一個 PHP 程序員…
關于PHP 8的JIT特性介紹就分享到這里了,希望以上內容可以對大家有一定的參考價值,可以學以致用。如果喜歡本篇文章,不妨把它分享出去讓更多的人看到。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。