您好,登錄后才能下訂單哦!
看到分布式、高并發、多線程這三個詞的時候,很多人是不是都認為分布式=高并發=多線程?
當面試官問到高并發系統可以采用哪些手段來解決,或者被問到分布式系統如何解決一致性的問題,是不是一臉懵逼?
確實,在一開始接觸的時候,不少人都會分布式、高并發、多線程將三者混淆,誤以為所謂的分布式高并發的系統就是能同時供海量用戶訪問,而采用多線程手段不就是可以提供系統的并發能力嗎?實際上,他們三個總是相伴而生,但側重點又有不同。
接下來我就看看分布式、高并發、多線程這三者之間到底有什么區別?
分布式更多的一個概念,是為了解決單個物理服務器容量和性能瓶頸問題而采用的優化手段。該領域需要解決的問題極多,在不同的技術層面上,又包括:分布式文件系統、分布式緩存、分布式數據庫、分布式計算等,一些名詞如Hadoop、zookeeper、MQ等都跟分布式有關。從理念上講,分布式的實現有兩種形式:
水平擴展:當一臺機器扛不住流量時,就通過添加機器的方式,將流量平分到所有服務器上,所有機器都可以提供相當的服務;
垂直拆分:前端有多種查詢需求時,一臺機器扛不住,可以將不同的需求分發到不同的機器上,比如A機器處理余票查詢的請求,B機器處理支付的請求。
相對于分布式來講,高并發在解決的問題上會集中一些,其反應的是同時有多少量:比如在線直播服務,同時有上萬人觀看。
高并發可以通過分布式技術去解決,將并發流量分到不同的物理服務器上。但除此之外,還可以有很多其他優化手段:比如使用緩存系統,將所有的,靜態內容放到CDN等;還可以使用多線程技術將一臺服務器的服務能力最大化。
多線程是指從軟件或者硬件上實現多個線程并發執行的技術,它更多的是解決CPU調度多個進程的問題,從而讓這些進程看上去是同時執行(實際是交替運行的)。
這幾個概念中,多線程解決的問題是最明確的,手段也是比較單一的,基本上遇到的最大問題就是線程安全。在JAVA語言中,需要對JVM內存模型、指令重排等深入了解,才能寫出一份高質量的多線程代碼。
總結一下:
分布式是從物理資源的角度去將不同的機器組成一個整體對外服務,技術范圍非常廣且難度非常大,有了這個基礎,高并發、高吞吐等系統很容易構建;
高并發是從業務角度去描述系統的能力,實現高并發的手段可以采用分布式,也可以采用諸如緩存、CDN等,當然也包括多線程;
多線程則聚焦于如何使用編程語言將CPU調度能力最大化。
下面給大家分享一些面試官常問的分布式、高并發、多線程的面試題
1、分布式系統怎么做服務治理
針對互聯網業務的特點,eg 突發的流量高峰、網絡延時、機房故障等,重點針對大規模跨機房的海量服務進行運行態治理,保障線上服務的高SLA,滿足用戶的體驗,常用的策略包括限流降級、服務嵌入遷出、服務動態路由和灰度發布等
2、對分布式事務的理解
本質上來說,分布式事務就是為了保證不同數據庫的數據一致性。
事務的ACID特性 原子性 一致性 隔離性 持久性
消息事務+最終一致性
CC提供了一個編程框架,將整個業務邏輯分為三塊:Try、Confirm和Cancel三個操作。以在線下單為例,Try階段會去扣庫存,Confirm階段則是去更新訂單狀態,如果更新訂單失敗,則進入Cancel階段,會去恢復庫存。總之,TCC就是通過代碼人為實現了兩階段提交,不同的業務場景所寫的代碼都不一樣,復雜度也不一樣,因此,這種模式并不能很好地被復用。
3、如何實現負載均衡,有哪些算法可以實現?
經常會用到以下四種算法:隨機(random)、輪訓(round-robin)、一致哈希(consistent-hash)和主備(master-slave)。
4、分布式集群下如何做到唯一序列號
Redis生成ID 這主要依賴于Redis是單線程的,所以也可以用生成全局唯一的ID。可以用Redis的原子操作 INCR和INCRBY來實現。
5. 什么是進程
進程是指運行中的應用程序,每個進程都有自己獨立的地址空間(內存空間)。
比如用戶點擊桌面的IE瀏覽器,就啟動了一個進程,操作系統就會為該進程分配獨立的地址空間。當用戶再次點擊左邊的IE瀏覽器,又啟動了一個進程,操作系統將為新的進程分配新的獨立的地址空間。目前操作系統都支持多進程。
6. 什么是線程
進程是表示自愿分配的基本單位。而線程則是進程中執行運算的最小單位,即執行處理機調度的基本單位。通俗來講:一個程序有一個進程,而一個進程可以有多個線程。
7. 線程和進程有什么區別
線程是進程的子集,一個進程可以有很多線程,每條線程并行執行不同的任務。不同的進程使用不同的內存空間,而所有的線程共享一片相同的內存空間。
8. 多線程的幾種實現方式
(1) 繼承Thread類創建線程
Thread類本質上是實現了Runnable接口的一個實例,代表一個線程的實例。啟動線程的唯一方法就是通過Thread類的start()實例方法。start()方法將啟動一個新線程,并執行run()方法。這種方式實現多線程比較簡單,通過自己的類直接繼承Thread,并重寫run()方法,就可以啟動新線程并執行自己定義的run()方法。
(2) 實現Runnable接口創建線程
如果自己的類已經繼承了兩一個類,就無法再繼承Thread,因此可以實現一個Runnable接口
(3) 實現Callable接口通過FutureTask包裝器來創建Thread線程
(4) 使用ExecutorService、Callable、Future實現有返回結果的線程
ExecutorService、Callable、Future三個接口實際上都是屬于Executor框架。返回結果的線程是在JDK1.5中引入的新特征,有了這種特征就不需要再為了得到返回值而大費周折了。
可返回值的任務必須實現Callable接口;無返回值的任務必須實現Runnabel接口。
執行Callable任務后,可以獲取一個Future對象,在該對象上調用get()方法就可以獲取到Callable任務返回的Object了。(get()方法是阻塞的,線程無返回結果,該方法就一直等待)
9. 多線程中忙循環是什么
忙循環就是程序員用循環讓一個線程等待,不像傳統方法wait()、sleep()或者yied()它們都放棄了CPU控制,而忙循環不會放棄CPU,它就是在運行一個空循環。這么做的目的是為了保留CPU緩存,在多核系統中,一個等待線程醒來的時候可能會在另一個內核運行,這樣會重建緩存。為了避免重建緩存和減少等待重建的時間就可以使用它了。
10. 什么是java內存模型
java內存模型定義了java虛擬機在計算機內存中的工作方式。JMM決定了一個線程對共享變量的寫入何時對另一個線程可見。從抽象的角度來看,JMM定義了線程和主內存之間的抽象關系:線程之間的共享變量存儲在主內存中,每一個線程都有一個私有的本地內存,本地內存中存儲了該線程以讀/寫共享變量的副本。
11. 為什么要用線程池?
線程池提供了一種限制和管理資源(包括執行一個任務)。 每個線程池還維護一些基本統計信息,例如已完成任務的數量。
這里借用《Java并發編程的藝術》提到的來說一下使用線程池的好處:
降低資源消耗。 通過重復利用已創建的線程降低線程創建和銷毀造成的消耗。
提高響應速度。 當任務到達時,任務可以不需要的等到線程創建就能立即執行。
提高線程的可管理性。 線程是稀缺資源,如果無限制的創建,不僅會消耗系統資源,還會降低系統的穩定性,使用線程池可以進行統一的分配,調優和監控。
12、什么是樂觀鎖和悲觀鎖
1)樂觀鎖:就像它的名字一樣,對于并發間操作產生的線程安全問題持樂觀狀態,樂觀鎖認為競爭不總是會發生,因此它不需要持有鎖,將比較-替換這兩個動作作為一個原子操作嘗試去修改內存中的變量,如果失敗則表示發生沖突,那么就應該有相應的重試邏輯。
2)悲觀鎖:還是像它的名字一樣,對于并發間操作產生的線程安全問題持悲觀狀態,悲觀鎖認為競爭總是會發生,因此每次對某資源進行操作時,都會持有一個獨占的鎖,就像synchronized,不管三七二十一,直接上了鎖就操作資源了。
13、高并發、任務執行時間短的業務怎樣使用線程池?并發不高、任務執行時間長的業務怎樣使用線程池?并發高、業務執行時間長的業務怎樣使用線程池?
1)高并發、任務執行時間短的業務,線程池線程數可以設置為CPU核數+1,減少線程上下文的切換
2)并發不高、任務執行時間長的業務要區分開看:
a)假如是業務時間長集中在IO操作上,也就是IO密集型的任務,因為IO操作并不占用CPU,所以不要讓所有的CPU閑下來,可以加大線程池中的線程數目,讓CPU處理更多的業務
b)假如是業務時間長集中在計算操作上,也就是計算密集型任務,這個就沒辦法了,和(1)一樣吧,線程池中的線程數設置得少一些,減少線程上下文的切換
c)并發高、業務執行時間長,解決這種類型任務的關鍵不在于線程池而在于整體架構的設計,看看這些業務里面某些數據是否能做緩存是第一步,增加服務器是第二步,至于線程池的設置,設置參考其他有關線程池的文章。最后,業務執行時間長的問題,也可能需要分析一下,看看能不能使用中間件對任務進行拆分和解耦。
歡迎大家一起交流,喜歡文章記得點個贊,感謝支持!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。