亚洲日本精品宅男,免费国产高清在线精品

新網(wǎng) > 虛擬主機 > 正文

高效動態(tài)語言虛擬機的設(shè)計(一)

作者：新網(wǎng)
來源：新網(wǎng)
瀏覽：100
2018-05-09 14:43:06

最近在做Python相關(guān)的一些東西，發(fā)現(xiàn)Python的性能實在是非常差，所以就深入到Python內(nèi)部，看了一下它的實現(xiàn)，并對比了幾個比較流行的虛擬機的實現(xiàn)，包括：

<div>　　V8 (Javascript)

　　Tamarin (ActionScript 3)

　　Lua 5.0

　　CPython (Python 2.7.2)

　　做了一定分析和比對，獲得了一些靈感，在這里寫下來作一個分享的討論。

　　Ok，先從計算機是如何將一個高級語言的代碼，轉(zhuǎn)變成可以執(zhí)行的程序說起。

　　計算機程序語言的機制

　　眾所周知，計算機能夠執(zhí)行的代碼是機器碼，也就是所謂的二進制。那么一段高級語言的代碼要想能夠被計算機執(zhí)行，必須經(jīng)過這樣的一個過程：

　　編譯 (將源代碼編譯成目標(biāo)代碼：目標(biāo)代碼是機器碼片段的集合，每一段機器碼都有一個名字，也就是這段代碼的符號)

　　連接 (將多個目標(biāo)文件中的符號連接在一起，形成一個大的可執(zhí)行機器碼，這樣計算機(大部分時候是操作系統(tǒng))就可以加載、執(zhí)行代碼了)

　　編譯器的設(shè)計

　　在早期，編譯的過程是直譯式的，編譯器直接將源代碼解析成Token流，再將Token流分析成AST(抽象語法樹)，然后直接根據(jù)抽象語法樹中的語法元素生成目標(biāo)機器的匯編代碼，最后再通過匯編器(Assembler)匯編成目標(biāo)文件。

　　然而現(xiàn)代的編譯器都會有一種中間代碼，然后將編譯器分成兩半(前端和后端)。

　　前端是語言相關(guān)的，負責(zé)將原始的語言編譯成中間代碼;

　　后端是目標(biāo)機器相關(guān)的，負責(zé)將中間代碼翻譯成目標(biāo)機器的機器碼。

　　這樣做的好處就在于，編譯器變得更加可移植了。

　　當(dāng)出現(xiàn)一種新的語言時，只要實現(xiàn)一個這個語言的前端，就可以工作在不同的平臺和cpu上;

　　當(dāng)出現(xiàn)一個新的平臺時，只要實現(xiàn)一個后端，就可以支持所有的語言。

　　GCC就是這樣設(shè)計的一個范例。

　　從上一節(jié)的內(nèi)容，我們可以看出，假設(shè)語言都實現(xiàn)到了生成中間語言這一步，那么虛擬機的實現(xiàn)可以有2種方式：

　　Interpreting (解釋執(zhí)行)

　　也就是通過類似while() { switch() {} }的循環(huán)，分析中間語言的每條指令，動態(tài)解釋執(zhí)行

　　Binary Translation (這個名詞大家可能比較陌生，它還有一個大家更加熟知的名字：JIT)

　　顧名思義，就是虛擬機實現(xiàn)了從中間語言，到可執(zhí)行文件的轉(zhuǎn)換的功能，在運行時，將中間語言轉(zhuǎn)換成了可執(zhí)行文件，最終執(zhí)行

　　這兩種方式各有特色：

　　Interpreting

　　啟動非?？焖?，執(zhí)行性能相對較差，通常應(yīng)用于一些對性能本身不是很敏感的語言

　　Binary Translation

　　有一個翻譯的過程，啟動的時候會相對比較慢，但是執(zhí)行的性能非常好，有時甚至比c代碼還要快速(聽起來很科幻?)

　　我們來橫向比較一下這幾個虛擬機的實現(xiàn)方式：

　　虛擬機語言語言特性虛擬機實現(xiàn)方式速度

　　V8JavaScript較豐富Binary Translation非常快

　　TamarinActionScript 3(EcmaScript 4)較豐富Interpreting + Binary Translation非?？?/div>

　　Lua 5.0Lua 5.0較少Interpreting較快

　　CPythonPython 2.7很豐富Interpreting較慢

　　從這里，我們可以看到使用Jit方式執(zhí)行的虛擬機明顯比較快，而采用解釋執(zhí)行的虛擬機明顯較慢。

　　然而同樣是采用解釋執(zhí)行的虛擬機，lua也要比python更快，這不僅僅是由于語言更簡單導(dǎo)致的，同時也跟lua虛擬機的實現(xiàn)有關(guān)。

　　V8是一朵奇葩

　　V8虛擬機可以說是所有的虛擬機里面設(shè)計最特別的一款，所有其他的虛擬機都會首先將源代碼編譯成一種中間代碼，如：

　　虛擬機中間代碼指令數(shù)

　　Tamarinabc (Adobe Byte Code)200+

　　LuaLua Byte Code35

　　PythonPython Byte Code100+

　　然而，v8虛擬機的方式很特別，它在進行jit的時候直接從ast生成目標(biāo)平臺的匯編代碼，并使用內(nèi)置的宏匯編器生成可執(zhí)行代碼，這樣就大大減少了jit過程所消耗的時間。

　　Lua的指令為什么那么少?

　　細心的讀者一定發(fā)現(xiàn)了，Lua虛擬機的指令要比其他的虛擬機少很多，甚至不再同一個數(shù)量級上，那為什么那么設(shè)計呢?　　最近在做Python相關(guān)的一些東西，發(fā)現(xiàn)Python的性能實在是非常差，所以就深入到Python內(nèi)部，看了一下它的實現(xiàn)，并對比了幾個比較流行的虛擬機的實現(xiàn)，包括：

　　V8 (Javascript)