×

高效動態(tài)語言虛擬機的設(shè)計(一)

  • 作者:新網(wǎng)
  • 來源:新網(wǎng)
  • 瀏覽:100
  • 2018-05-09 14:43:06

最近在做Python相關(guān)的一些東西,發(fā)現(xiàn)Python的性能實在是非常差,所以就深入到Python內(nèi)部,看了一下它的實現(xiàn),并對比了幾個比較流行的虛擬機的實現(xiàn),包括:

   最近在做Python相關(guān)的一些東西,發(fā)現(xiàn)Python的性能實在是非常差,所以就深入到Python內(nèi)部,看了一下它的實現(xiàn),并對比了幾個比較流行的虛擬機的實現(xiàn),包括:

1a9e54a8-08e6-4532-9197-5b2e9bbd47ce.jpg

<div>  V8 (Javascript)
  Tamarin (ActionScript 3)
  Lua 5.0
  CPython (Python 2.7.2)
  做了一定分析和比對,獲得了一些靈感,在這里寫下來作一個分享的討論。
  Ok,先從計算機是如何將一個高級語言的代碼,轉(zhuǎn)變成可以執(zhí)行的程序說起。
  計算機程序語言的機制
  眾所周知,計算機能夠執(zhí)行的代碼是機器碼,也就是所謂的二進制。那么一段高級語言的代碼要想能夠被計算機執(zhí)行,必須經(jīng)過這樣的一個過程:
  編譯 (將源代碼編譯成目標(biāo)代碼:目標(biāo)代碼是機器碼片段的集合,每一段機器碼都有一個名字,也就是這段代碼的符號)
  連接 (將多個目標(biāo)文件中的符號連接在一起,形成一個大的可執(zhí)行機器碼,這樣計算機(大部分時候是操作系統(tǒng))就可以加載、執(zhí)行代碼了)
  編譯器的設(shè)計
  在早期,編譯的過程是直譯式的,編譯器直接將源代碼解析成Token流,再將Token流分析成AST(抽象語法樹),然后直接根據(jù)抽象語法樹中的語法元素生成目標(biāo)機器的匯編代碼,最后再通過匯編器(Assembler)匯編成目標(biāo)文件。
  然而現(xiàn)代的編譯器都會有一種中間代碼,然后將編譯器分成兩半(前端和后端)。
  前端是語言相關(guān)的,負責(zé)將原始的語言編譯成中間代碼;
  后端是目標(biāo)機器相關(guān)的,負責(zé)將中間代碼翻譯成目標(biāo)機器的機器碼。
  這樣做的好處就在于,編譯器變得更加可移植了。
  當(dāng)出現(xiàn)一種新的語言時,只要實現(xiàn)一個這個語言的前端,就可以工作在不同的平臺和cpu上;
  當(dāng)出現(xiàn)一個新的平臺時,只要實現(xiàn)一個后端,就可以支持所有的語言。
  GCC就是這樣設(shè)計的一個范例。
  從上一節(jié)的內(nèi)容,我們可以看出,假設(shè)語言都實現(xiàn)到了生成中間語言這一步,那么虛擬機的實現(xiàn)可以有2種方式:
  Interpreting (解釋執(zhí)行)
  也就是通過類似while() { switch() {} }的循環(huán),分析中間語言的每條指令,動態(tài)解釋執(zhí)行
  Binary Translation (這個名詞大家可能比較陌生,它還有一個大家更加熟知的名字:JIT)
  顧名思義,就是虛擬機實現(xiàn)了從中間語言,到可執(zhí)行文件的轉(zhuǎn)換的功能,在運行時,將中間語言轉(zhuǎn)換成了可執(zhí)行文件,最終執(zhí)行
  這兩種方式各有特色:
  Interpreting
  啟動非??焖?,執(zhí)行性能相對較差,通常應(yīng)用于一些對性能本身不是很敏感的語言
  Binary Translation
  有一個翻譯的過程,啟動的時候會相對比較慢,但是執(zhí)行的性能非常好,有時甚至比c代碼還要快速(聽起來很科幻?)
  我們來橫向比較一下這幾個虛擬機的實現(xiàn)方式:
  虛擬機語言語言特性虛擬機實現(xiàn)方式速度
  V8JavaScript較豐富Binary Translation非常快
  TamarinActionScript 3(EcmaScript 4)較豐富Interpreting + Binary Translation非???/div>
  Lua 5.0Lua 5.0較少Interpreting較快
  CPythonPython 2.7很豐富Interpreting較慢
  從這里,我們可以看到使用Jit方式執(zhí)行的虛擬機明顯比較快,而采用解釋執(zhí)行的虛擬機明顯較慢。
  然而同樣是采用解釋執(zhí)行的虛擬機,lua也要比python更快,這不僅僅是由于語言更簡單導(dǎo)致的,同時也跟lua虛擬機的實現(xiàn)有關(guān)。
  V8是一朵奇葩
  V8虛擬機可以說是所有的虛擬機里面設(shè)計最特別的一款,所有其他的虛擬機都會首先將源代碼編譯成一種中間代碼,如:
  虛擬機中間代碼指令數(shù)
  Tamarinabc (Adobe Byte Code)200+
  LuaLua Byte Code35
  PythonPython Byte Code100+
  然而,v8虛擬機的方式很特別,它在進行jit的時候直接從ast生成目標(biāo)平臺的匯編代碼,并使用內(nèi)置的宏匯編器生成可執(zhí)行代碼,這樣就大大減少了jit過程所消耗的時間。
  Lua的指令為什么那么少?
  細心的讀者一定發(fā)現(xiàn)了,Lua虛擬機的指令要比其他的虛擬機少很多,甚至不再同一個數(shù)量級上,那為什么那么設(shè)計呢?  最近在做Python相關(guān)的一些東西,發(fā)現(xiàn)Python的性能實在是非常差,所以就深入到Python內(nèi)部,看了一下它的實現(xiàn),并對比了幾個比較流行的虛擬機的實現(xiàn),包括:
  V8 (Javascript)
  Tamarin (ActionScript 3)
  Lua 5.0
  CPython (Python 2.7.2)
  做了一定分析和比對,獲得了一些靈感,在這里寫下來作一個分享的討論。
  Ok,先從計算機是如何將一個高級語言的代碼,轉(zhuǎn)變成可以執(zhí)行的程序說起。
  計算機程序語言的機制
  眾所周知,計算機能夠執(zhí)行的代碼是機器碼,也就是所謂的二進制。那么一段高級語言的代碼要想能夠被計算機執(zhí)行,必須經(jīng)過這樣的一個過程:
  編譯 (將源代碼編譯成目標(biāo)代碼:目標(biāo)代碼是機器碼片段的集合,每一段機器碼都有一個名字,也就是這段代碼的符號)
  連接 (將多個目標(biāo)文件中的符號連接在一起,形成一個大的可執(zhí)行機器碼,這樣計算機(大部分時候是操作系統(tǒng))就可以加載、執(zhí)行代碼了)
  編譯器的設(shè)計
  在早期,編譯的過程是直譯式的,編譯器直接將源代碼解析成Token流,再將Token流分析成AST(抽象語法樹),然后直接根據(jù)抽象語法樹中的語法元素生成目標(biāo)機器的匯編代碼,最后再通過匯編器(Assembler)匯編成目標(biāo)文件。
  然而現(xiàn)代的編譯器都會有一種中間代碼,然后將編譯器分成兩半(前端和后端)。
  前端是語言相關(guān)的,負責(zé)將原始的語言編譯成中間代碼;
  后端是目標(biāo)機器相關(guān)的,負責(zé)將中間代碼翻譯成目標(biāo)機器的機器碼。
  這樣做的好處就在于,編譯器變得更加可移植了。
  當(dāng)出現(xiàn)一種新的語言時,只要實現(xiàn)一個這個語言的前端,就可以工作在不同的平臺和cpu上;
  當(dāng)出現(xiàn)一個新的平臺時,只要實現(xiàn)一個后端,就可以支持所有的語言。
  GCC就是這樣設(shè)計的一個范例。
  從上一節(jié)的內(nèi)容,我們可以看出,假設(shè)語言都實現(xiàn)到了生成中間語言這一步,那么虛擬機的實現(xiàn)可以有2種方式:
  Interpreting (解釋執(zhí)行)
  也就是通過類似while() { switch() {} }的循環(huán),分析中間語言的每條指令,動態(tài)解釋執(zhí)行
  Binary Translation (這個名詞大家可能比較陌生,它還有一個大家更加熟知的名字:JIT)
  顧名思義,就是虛擬機實現(xiàn)了從中間語言,到可執(zhí)行文件的轉(zhuǎn)換的功能,在運行時,將中間語言轉(zhuǎn)換成了可執(zhí)行文件,最終執(zhí)行
  這兩種方式各有特色:
  Interpreting
  啟動非??焖伲瑘?zhí)行性能相對較差,通常應(yīng)用于一些對性能本身不是很敏感的語言
  Binary Translation
  有一個翻譯的過程,啟動的時候會相對比較慢,但是執(zhí)行的性能非常好,有時甚至比c代碼還要快速(聽起來很科幻?)
  我們來橫向比較一下這幾個虛擬機的實現(xiàn)方式:
  虛擬機語言語言特性虛擬機實現(xiàn)方式速度
  V8JavaScript較豐富Binary Translation非???/div>
  TamarinActionScript 3(EcmaScript 4)較豐富Interpreting + Binary Translation非???/div>
  Lua 5.0Lua 5.0較少Interpreting較快
  CPythonPython 2.7很豐富Interpreting較慢
  從這里,我們可以看到使用Jit方式執(zhí)行的虛擬機明顯比較快,而采用解釋執(zhí)行的虛擬機明顯較慢。
  然而同樣是采用解釋執(zhí)行的虛擬機,lua也要比python更快,這不僅僅是由于語言更簡單導(dǎo)致的,同時也跟lua虛擬機的實現(xiàn)有關(guān)。
  V8是一朵奇葩
  V8虛擬機可以說是所有的虛擬機里面設(shè)計最特別的一款,所有其他的虛擬機都會首先將源代碼編譯成一種中間代碼,如:
  虛擬機中間代碼指令數(shù)
  Tamarinabc (Adobe Byte Code)200+
  LuaLua Byte Code35
  PythonPython Byte Code100+
  然而,v8虛擬機的方式很特別,它在進行jit的時候直接從ast生成目標(biāo)平臺的匯編代碼,并使用內(nèi)置的宏匯編器生成可執(zhí)行代碼,這樣就大大減少了jit過程所消耗的時間。
  Lua的指令為什么那么少?
  細心的讀者一定發(fā)現(xiàn)了,Lua虛擬機的指令要比其他的虛擬機少很多,甚至不再同一個數(shù)量級上,那為什么那么設(shè)計呢?

免責(zé)聲明:本文內(nèi)容由互聯(lián)網(wǎng)用戶自發(fā)貢獻自行上傳,本網(wǎng)站不擁有所有權(quán),也不承認相關(guān)法律責(zé)任。如果您發(fā)現(xiàn)本社區(qū)中有涉嫌抄襲的內(nèi)容,請發(fā)送郵件至:operations@xinnet.com進行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,本站將立刻刪除涉嫌侵權(quán)內(nèi)容。

免費咨詢獲取折扣

Loading