PHP內(nèi)核探索 —— PHP腳本的執(zhí)行細(xì)節(jié):PHP、C、匯編、機(jī)器碼
眾所周知,計(jì)算機(jī)的CPU只能執(zhí)行二進(jìn)制的機(jī)器碼,每種CPU都有對(duì)應(yīng)的匯編語(yǔ)言,匯編語(yǔ)言編譯器將匯編語(yǔ)言翻譯成二進(jìn)制的機(jī)器語(yǔ)言,然后CPU開(kāi)始執(zhí)行這些機(jī)器碼。匯編語(yǔ)言作為機(jī)器語(yǔ)言與程序設(shè)計(jì)者之間的一個(gè)層,給我們帶來(lái)了很多方便,程序員不需要用晦澀的01數(shù)字來(lái)書(shū)寫(xiě)程序,當(dāng)然人們并不滿足這樣的一個(gè)進(jìn)步,于是在匯編語(yǔ)言之上又多了一個(gè)層——C語(yǔ)言,C語(yǔ)言更貼近人類熟悉的“自然語(yǔ)言”,程序設(shè)計(jì)者可以通過(guò)C語(yǔ)言編譯器將C源代碼文件編譯成目標(biāo)文件(二進(jìn)制文件,中間會(huì)先翻譯成匯編語(yǔ)言,然后由匯編語(yǔ)言生成機(jī)器碼),然后將各個(gè)目標(biāo)文件連接在一起就組成了一個(gè)可執(zhí)行文件。正如有人說(shuō)過(guò)的一句名言“計(jì)算機(jī)科學(xué)領(lǐng)域的任何問(wèn)題都可以通過(guò)增加一個(gè)間接的中間層來(lái)解決”(“Any problem in computer science can be solved by another layer of indirection.”) PHP語(yǔ)言就是在C語(yǔ)言之上的一個(gè)層,PHP引擎是由C語(yǔ)言來(lái)實(shí)現(xiàn)的,因此PHP語(yǔ)言這一個(gè)在C之上抽象出來(lái)的層使用起來(lái)比C更簡(jiǎn)單方便,入門門檻更低。
那么,PHP語(yǔ)言究竟如何被執(zhí)行呢?
PHP語(yǔ)言到C語(yǔ)言之間的轉(zhuǎn)換如果使用“翻譯”這個(gè)詞是不夠準(zhǔn)確的,因?yàn)橐娌皇菍HP語(yǔ)言轉(zhuǎn)換成C語(yǔ)言,然后將轉(zhuǎn)換后的C語(yǔ)言編譯鏈接執(zhí)行。引擎在解析PHP代碼的時(shí)候通常是分為兩個(gè)部分,編譯和執(zhí)行:
編譯階段:引擎把PHP代碼轉(zhuǎn)換成opcode中間代碼執(zhí)行階段:引擎解釋并執(zhí)行編譯階段產(chǎn)生的opcode關(guān)于op code會(huì)有專門的文章來(lái)介紹,現(xiàn)在網(wǎng)絡(luò)上也已經(jīng)有很多相關(guān)內(nèi)容的文章,總之PHP代碼會(huì)被編譯成_zend_op_array的形式,這是一個(gè)結(jié)構(gòu)體,其中包括很多相關(guān)屬性,以及最重要的成員zend_op *opcodes,即opcode的數(shù)組。執(zhí)行階段引擎會(huì)按照順序執(zhí)行各個(gè)opcode。
目前5.3.2版本的PHP中,opcode一共有154種,可以在{PHPSRC}/Zend/zend_vm_opcodes.h看到這些opcode的宏定義。op的結(jié)構(gòu)定義為:
struct _zend_op {opcode_handler_t handler;znode result;znode op1;znode op2;ulong extended_value;uint lineno;zend_uchar opcode;};
其中的成員opcode就對(duì)應(yīng)154個(gè)opcode宏定義中的一個(gè),每一個(gè)op根據(jù)opcode和操作數(shù)的類型不同都會(huì)對(duì)應(yīng)一個(gè)相關(guān)的執(zhí)行句柄(opcode_handler_t handler),執(zhí)行句柄是一個(gè)函數(shù)指針,op的執(zhí)行執(zhí)行句柄都定義在{PHPSRC}/Zend/zend_vm_execute.h中,這個(gè)文件可以通過(guò)一個(gè)PHP腳本({PHPSRC}/Zend/zend_vm_gen.php)來(lái)生成,這個(gè)PHP腳本用來(lái)生成zend_vm_opcodes.h和zend_vm_execute.h兩個(gè)文件,zend_vm_execute.h的內(nèi)容會(huì)根據(jù)生成時(shí)的參數(shù)不同而不同,這里主要是可以定置zend 引擎對(duì)op的分發(fā)方式,比如用CALL,SWITCH,GOTO,默認(rèn)的是用CALL,也就是函數(shù)調(diào)用,所以這里就以函數(shù)調(diào)用來(lái)簡(jiǎn)單的介紹下這個(gè)文件的功能(文件極大,有近36000行,所以不要仔細(xì)啃),在這個(gè)文件中所有定義為 static int ZEND_FASTCALL 并且以 ZEND_* 開(kāi)頭的函數(shù)就是op的句柄,此文件中第一個(gè)函數(shù)execute是執(zhí)行op的主方法,以這里作為入口執(zhí)行一連串的op。可以說(shuō)整個(gè)PHP的功能特性都是通過(guò)這些op句柄完成的(當(dāng)然這些句柄會(huì)間接調(diào)用其他模塊中的功能),那么這154個(gè)opcode如何對(duì)應(yīng)到這些static int ZEND_FASTCALL? ZEND_*的執(zhí)行句柄的呢?同樣在這個(gè)文件中,可以看到zend_init_opcodes_handlers函數(shù),這個(gè)函數(shù)初始化一個(gè) static const opcode_handler_t labels[]數(shù)組,這個(gè) labels數(shù)組就是handlers的一張表,這個(gè)表有近4000個(gè)項(xiàng),有一個(gè)算法將一個(gè)opcode映射到這個(gè)表中的一個(gè)元素,算法同樣在zend_vm_execute.h中可以找到,靠近文件結(jié)尾zend_vm_set_opcode_handler和zend_vm_get_opcode_handler就是這個(gè)算法的實(shí)現(xiàn)。
那么引擎是如何通過(guò)這些op handler實(shí)現(xiàn)PHP語(yǔ)言的特性的呢?這里我舉一個(gè)最簡(jiǎn)單的例子,考慮下面只有一行的PHP代碼:
<?php$a = 123;?>
通過(guò)某種方法(以后再介紹這些方法)我們可以知道這行代碼主要生成一個(gè)zend_op,其主要成員值為:
opcode = 38? (對(duì)應(yīng)#define ZEND_ASSIGN??38)op1?????? = $a ($a變量實(shí)際上是以cv形式存在,以后介紹)op2?????? = 123 (以const常量形式存在)handler = ZEND_ASSIGN_SPEC_CV_CONST_HANDLER(得到這個(gè)handler的名字不是一件容易的事,以后給出方法)
opcode ZEND_ASSIGN的意思是將一個(gè)常量賦值給一個(gè)cv(compiled variable),這個(gè)cv其實(shí)就是$a變量的一種存在形式。在zend_vm_execute.h中搜索到ZEND_ASSIGN_SPEC_CV_CONST_HANDLER的定義,其主要功能就是取op2的值123,將其賦值給op1的變量,當(dāng)然這個(gè)過(guò)程比想象中的要復(fù)雜一些,會(huì)有變量的初始化,變量的寫(xiě)時(shí)賦值等過(guò)程,以后會(huì)介紹每一個(gè)過(guò)程。這樣這條PHP語(yǔ)句的功能就完成了。可以看出,op handler只是按照一些固定的方式來(lái)對(duì)操作數(shù)op1 op2(可能還有result)進(jìn)行操作,handler不理會(huì)這些操作數(shù)中的具體值,這些值是在編譯階段生成op的時(shí)候確定的,比如如果$a = 123 改成 $a =456,那么生成的op中op2就是456了,handler始終按照固定的方式來(lái)處理。
因此我們能知道,PHP的執(zhí)行過(guò)程是先通過(guò)編譯器將PHP代碼編譯成op code,然后然后zend虛擬機(jī)按照一定順序執(zhí)行這些opcode,具體是將每個(gè)opcode分發(fā)給特定的op code handler。
相關(guān)文章:
1. Xml簡(jiǎn)介_(kāi)動(dòng)力節(jié)點(diǎn)Java學(xué)院整理2. Python TestSuite生成測(cè)試報(bào)告過(guò)程解析3. Python查找算法之分塊查找算法的實(shí)現(xiàn)4. .NET 中配置從xml轉(zhuǎn)向json方法示例詳解5. 深入了解JAVA 軟引用6. python基于tkinter點(diǎn)擊按鈕實(shí)現(xiàn)圖片的切換7. python實(shí)現(xiàn)讀取類別頻數(shù)數(shù)據(jù)畫(huà)水平條形圖案例8. 解決AJAX返回狀態(tài)200沒(méi)有調(diào)用success的問(wèn)題9. JSP之表單提交get和post的區(qū)別詳解及實(shí)例10. python之cur.fetchall與cur.fetchone提取數(shù)據(jù)并統(tǒng)計(jì)處理操作
