您好,登錄后才能下訂單哦!
RPC是一種方便的網絡通信編程模型,由于和編程語言的高度結合,大大減少了處理網絡數據的復雜度,讓代碼可讀性也有可觀的提高。但是RPC本身的構成卻比較復雜,由于受到編程語言、網絡模型、使用習慣的約束,有大量的妥協和取舍之處。本文就是通過分析幾種流行的RPC實現案例,提供大家在設計RPC系統時的參考。
由于RPC底層的網絡開發一般和具體使用環境有關,而編程實現手段也非常多樣化,但不影響使用者,因此本文基本涉及如何實現一個RPC系統。
我們在各種操作系統、編程語言生態圈中,多少都會接觸過“遠程調用”的概念。一般來說,他們指的是用簡單的一行代碼,通過網絡調用另外一個計算機上的某段程序。比如:
遠程調用本身是網絡通信的一種概念,他的特點是把網絡通信封裝成一個類似函數的調用。網絡通信在遠程調用外,一般還有其他的幾種概念:數據包處理、消息隊列、流過濾、資源拉取等待。下面比較一下他們差異:
方案 |
編程方式 |
信息封裝 |
傳輸模型 |
典型應用 |
---|---|---|---|---|
遠程調用 |
調用函數,輸入參數,獲得返回值。 |
使用編程語言的變量、類型、函數 |
發出請求,獲得響應 |
Java RMI |
數據包處理 |
調用Send()/Recv(),使用字節碼數據,編解碼,處理內容 |
把通信內容構造成二進制的協議包 |
發送/接收 |
UDP編程 |
消息隊列 |
調用Put()/Get(),使用“包”對象,處理其包含的內容 |
消息被封裝成語言可用的對象或結構 |
對某隊列,存入一個消息;取出一個消息 |
ActiveMQ |
流過濾 |
讀取一個流,或寫出一個流,對流中的單元包即刻處理 |
單元長度很小的統一數據結構 |
連接;發送/接收;處理 |
網絡視頻 |
資源拉取 |
輸入一個資源ID,獲得資源內容 |
請求或響應都包含:頭部+正文 |
請求后等待響應 |
WWW |
針對遠程調用的特點——調用函數。業界在各種語言下都開發過類似的方案,同時也有些方案是試圖做到跨語言的。盡管遠程調用在編程方式上,看起來似乎是最簡單易用的,但是也有明顯的缺點。所以了解清楚遠程調用的優勢和缺點,是決定是否要開發、或者使用遠程調用這種模型的關鍵問題。
遠程調用的優勢有:
遠程調用的缺點:
因此,遠程調用最適合的場景是:業務需求多變,網絡環境多變。
由于遠程調用的使用接口是“函數”,所以要如何構建這個“函數”,就產生了三個方面需要決策的問題:
所謂遠程,就是指網絡上另外一個位置,那么網絡地址就是必須要輸入的部分。在TCP/IP網絡下,IP地址和端口號代表了運行中程序的一個入口。所以指定IP地址和端口是發起遠程調用所必需的。
然而,一個程序可能會運行很多個功能,可以接收多個不同含義的遠程調用。這樣如何去讓用戶指定這些不同含義的遠程調用入口,就成為了另外一個問題。當然最簡單的是每個端口一種調用,但是一個IP最多支持65535個端口,而且別的網絡功能也可能需要端口,所以這種方案可能會不夠用,同時一個數字代表一個功能也不太好理解,必須要查表才能明白。
所以我們必須想別的方法。在面向對象的思想下,有些方案提出了:以不同的對象來歸納不同的功能組合,先指定對象,再指定方法。這個想法非常符合程序員的理解方式,EJB就是這種方案的。一旦你確定了用對象這種模型來定義遠程調用的地址,那么你就需要有一種指定遠程對象的方法,為了指定對象,你必須要能把對象的一些信息,從被調用方(服務器端)傳輸給調用方(客戶端)。
最簡單的方案就是客戶端輸入一串字符串作為對象的“名字”,發給服務器端,查找注冊了這個“名字”的對象,如果找到了,服務器端就會用某種技術“傳輸”這個對象給客戶端,然后客戶端就可以調用他的方法了。當然這種傳輸不可能是把整個服務器上的對象數據拷貝給客戶端,而是用一些符號或者標志的方法,來代表這個服務器上的對象,然后發給客戶端。
如果你不是使用面向對象的模型,那么遠程的一個函數,也是必須要定位和傳輸的,因為你調用的函數必須先能找到,然后成為客戶端側的一個接口,才能調用。針對“遠程對象”(這里說的對象包括面向對象的對象或者僅僅是 函數)如何表達才能在網絡上定位;以及定位成功之后以什么形式供客戶端調用,都是“遠程調用”設計方案中第一個重要的問題。
遠程調用由于受到網絡通信的約束,所以往往不能完全的支持編程語言的所有特性。比如C語言函數中的指針類型參數,就無法通過網絡傳遞出去。因此遠程調用的函數定義,能用語言中的什么特性,不能用什么特性,是需要在設計方案是規定下來的。
這種規定如果太嚴格,會影響使用者的易用性;如果太寬泛,則可能導致遠程調用的性能低下。如何去設計一種方式,把編程語言中的函數,描述成一個遠程調用的函數,也是需要考慮的問題。很多方案采用了配置文件這種通用的方式,而另外一些方案可以直接在源代碼中里面加特殊的注釋。
一般來說,編譯型語言如C/C++只能采用源代碼根據配置文件生成的方案,虛擬機型語言如C#/JAVA可以采用反射機制結合配置文件(設置是在源代碼中用特殊注釋來代替配置文件)的方案,如果是腳本語言就更簡單,有時候連配置文件都不需要,因為腳本自己就可以充當。總之遠程調用的接口要滿足怎樣的約束,也是一個需要仔細考慮的問題。
遠程調用最重要的實現細節,就是關于網絡通信。用何種通信方式來承載遠程調用的問題,細化下來就是兩個子問題:用什么樣的服務程序提供網絡功能?用什么樣的通信協議?
遠程調用系統可以自己直接對TCP/IP編程來實現通信,也可以委托一些其他軟件,比如Web服務器、消息隊列服務器等等……也可以使用不同的網絡通信框架,如Netty/Mina這些開源框架。通信協議則一般有兩層:一個是傳輸協議,比如TCP/UDP或者高層一點的HTTP,或者自己定義的傳輸協議;另外一個是編碼協議,就是如何把一個編程語言中的對象,序列化和反序列化成為二進制字節流的方案,流行的方案有JSON、Google Protocol Buffer等等,很多開發語言也有自己的序列化方案,如JAVA/C#都自帶。以上這些技術細節,應該選擇使用哪些,直接關系到遠程調用系統的性能和環境兼容性。
以上三個問題,就是遠程調用系統必須考慮的核心選型。根據每個方案所面對的約束不同,他們都會在這三個問題上做出取舍,從而適應其約束。但是現在并不存在一個“萬能”或者“通用”的方案,其原因就是:在如此復雜的一個系統中,如果要照顧的特性越多,需要付出的成本(易用性代價、性能開銷)也會越多。
下面,我們可以研究下業界現存的各種遠程調用方案,看他們是如何在這三個方面做平衡和選擇的。
CORBA是一個“古老”的,雄心勃勃的方案,他試圖在完成遠程調用的同時,還完成跨語言的通信的任務,因此其復雜程度是最高的,但是它的設計思想,也被后來更多的其他方案所學習。在通信對象的定位上,它使用URL來定義一個遠程對象,這是在互聯網時代非常容易接受的。其對象的內容則限定在C語言類型上,并且只能傳遞值,這也是非常容易理解的。為了能讓不同語言的程序通信,所以就必須要在各種編程語言之外獨立設計一種僅僅用于描述遠程接口的語言,這就是所謂的IDL:Interface Description Language 接口描述語言。
用這個方法,你就可以先用一種超然于所有語言之外的語言來定義接口,然后使用工具自動生成各種編程語言的代碼。這種方案對于編譯型語言幾乎是唯一選擇。CORBA并沒有對通信問題有任何約定,而是留給具體語言的實現者去處理,這也許是他沒有廣泛流行的原因之一。
實際上CORBA有一個非常著名的繼承者,他就是Facebook公司的Thrift框架。Thrift也是使用一種IDL編譯生成多種語言的遠程調用方案,并且用C++/JAVA等多種語言完整的實現了通信承載,所以在開源框架中是特別有號召力的一個。Thrfit的通信承載還有個特點,就是能組合使用各種不同的傳輸協議和編碼協議,比如TCP/UDP/HTTP配合JSON/BIN/PB……這讓它幾乎可以選擇任何的網絡環境。
Thrift的模型類似下圖,這里有的stub表示“樁代碼”,就是客戶端直接使用的函數形式程序;skeleton表示“骨架代碼”,是需要程序員編寫具體提供遠程服務功能的模板代碼,一般對模版做填空或者繼承(擴展)即可。這個stub-skeleton模型幾乎是所有遠程調用方案的標配。
JAVA RMI是JAVA虛擬機自帶的一個遠程調用方案。它也是可以使用URL來定位遠程對象,使用JAVA自帶的序列化編碼協議傳遞參數值。在接口描述上,由于這是一個僅限于JAVA環境下的方案,所以直接用JAVA語言的Interface類型作為定義語言。用戶通過實現這個接口類型來提供遠程服務,同時JAVA會根據這個接口文件自動生成客戶端的調用代碼供調用者使用。他的底層通信實現,還是用TCP協議實現的。在這里,Interface文件就是JAVA語言的IDL,同時也是skeleton模板,供開發者來填寫遠程服務內容。而stub代碼則由于JAVA的反射功能,由虛擬機直接包辦了。
這個方案由于JAVA虛擬機的支持,使用起來非常簡單,完全按照標志的JAVA編程方法就可以輕松解決問題,但是這也僅僅能在JAVA環境下運行,限制了其適用的范圍。魚與熊掌不可兼得,易用性和適用性往往是互相沖突的。這和CORBA/Thrift追求最大范圍的適用性有很大的差別,也導致了兩者在易用性上的不同。
Windows中對RPC支持是比較早和比較完善的。首先它通過GUID來查詢對象,然后使用C語言類型作為參數值的傳遞。由于Windows的API主要是C語言的,所以對于RPC功能來說,還是要用一種IDL來描述接口,最后生成.h和.c文件來生產RPC的stub和skeleton代碼。而通信機制,由于是操作系統自帶的,所以使用內核LPC機制承載,這一點還是對使用者來說比較方便的。但是也限制了只能用于Windows程序之間做調用。
在互聯網時代,程序需要通過互聯網來互相調用。而互聯網上最流行的協議是HTTP協議和WWW服務,因此使用HTTP協議的Web Service就順理成章的成為跨系統調用的最流行方案。由于可以使用大多數互聯網的基礎設施,所以Web Service的開發和實現幾乎是毫無難度的。一般來說,它都會使用URL來定位遠程對象,而參數則通過一系列預定義的類型(主要是C語言基礎類型),以及對象序列化方式來傳遞。接口生成方面,你可以自己直接對HTTP做解析,也可以使用諸如WSDL或者SOAP這樣的規范。在REST的方案中,則限定了只有PUT/GET/DELETE/POST四種操作函數,其他都是參數。
總結一下上面的這些RPC方案,我們發現,針對遠程調用的三個核心問題,一般業界有以下幾個選擇:
在我們確定了遠程調用系統方案幾個可行選擇后,自然就要明確一下各個方案的優缺點,這樣才能選擇真正合適需求的設計:
1. 對于遠程對象的描述: 使用URL是互聯網通行的標準,比較方便用戶理解,也容易添加日后需要擴展到內容,因為URL本身是一個由多個部分組合的字符串;而名字服務則老式一些,但是依然有他的好處,就是名字服務可以附帶負載均衡、容災擴容、自定義路由等一系列特性,對于需求復雜的定位比較容易實現。
2. 遠程調用的接口描述: 如果只限制于某個語言、操作系統、平臺上,直接利用“隱喻”方式的接口描述,或者以“注解”類型注釋手段來標注源代碼,實現遠程調用接口的定義,是最方便不過的。但是,如果需要兼容編譯型語言,如C/C++,就一定要用某種IDL來生成這些編譯語言的源代碼了。
3.通信承載: 給用戶自己定制通信模塊,能提供最好的適用性,但是也讓用戶增加了使用的復雜程度。而HTTP/消息隊列這種承載方式,在系統的部署、運維、編程上都會比較簡單,缺點就是對于性能、傳輸特性的定制空間就比較小。
分析完核心問題,我們還需要考慮一些適用性場景:
1. 面向對象還是面向過程: 如果我們只是考慮做面向過程的遠程調用,只需要定位到“函數”即可。而如果是面向對象的,則需要定位到“對象”。由于函數是無狀態的,所以其定位過程可以簡單到一個名字即可,而對象則需要動態的查找到其ID或句柄。
2.跨語言還是單一語言: 單一語言的方案中,頭文件或接口定義完全用一種語言處理即可,如果是跨語言的,就少不免要IDL
3. 混合式通信承載還是使用HTTP服務器承載: 混合式承載可能可以用到TCP/UDP/共享內存等底層技術,可以提供最優的性能,但是使用起來必然非常麻煩。使用HTTP服務器的話,則非常簡單,因為WWW服務的開源軟件、庫眾多,而且客戶端使用瀏覽器或者一些JS頁面即可調試,缺點是其性能較低。
假設我們現在要為某種業務邏輯非常多變的領域,如企業業務應用領域,或游戲服務器端領域,去設計一個遠程調用系統,我們可能應該如下選擇:
1. 使用名字服務定位遠程對象: 由于企業服務是需要高可用性的,使用名字服務能在查詢名字時識別和選擇可用性 服務對象。J2EE方案中的EJB(企業JavaBean)就是用名字服務的。
2. 使用IDL來生成接口定義: 由于企業服務或游戲服務,其開發語言可能不是統一的,又或者需要高性能的編程語言如C/C++,所以只能使用IDL。
3.使用混合式通信承載: 雖然企業服務看起來無需在很復雜的網絡下運行,但是不同的企業的網絡環境又可能是千差萬別的,所以要做一個通用的系統,最好還是不怕麻煩提供混合式的通信承載,這樣可以在TCP/UDP等各種協議中選擇。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。