日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當(dāng)前位置:首頁(yè) > 科技  > 軟件

一文搞懂什么是JMM重排序、內(nèi)存屏障、順序一致性

來(lái)源: 責(zé)編: 時(shí)間:2024-01-10 09:35:25 232觀看
導(dǎo)讀基礎(chǔ)并發(fā)編程模型的分類在并發(fā)編程中,我們需要處理兩個(gè)關(guān)鍵問(wèn)題:線程之間如何通信及線程之間如何同步(這里的線程是指并發(fā)執(zhí)行的活動(dòng)實(shí)體)。通信是指線程之間以何種機(jī)制來(lái)交換信息。在命令式編程中,線程之間的通信機(jī)制有兩

基礎(chǔ)

并發(fā)編程模型的分類

在并發(fā)編程中,我們需要處理兩個(gè)關(guān)鍵問(wèn)題:線程之間如何通信及線程之間如何同步(這里的線程是指并發(fā)執(zhí)行的活動(dòng)實(shí)體)。通信是指線程之間以何種機(jī)制來(lái)交換信息。在命令式編程中,線程之間的通信機(jī)制有兩種:共享內(nèi)存和消息傳遞。ZCT28資訊網(wǎng)——每日最新資訊28at.com

在共享內(nèi)存的并發(fā)模型里,線程之間共享程序的公共狀態(tài),線程之間通過(guò)寫 - 讀內(nèi)存中的公共狀態(tài)來(lái)隱式進(jìn)行通信。在消息傳遞的并發(fā)模型里,線程之間沒(méi)有公共狀態(tài),線程之間必須通過(guò)明確的發(fā)送消息來(lái)顯式進(jìn)行通信。ZCT28資訊網(wǎng)——每日最新資訊28at.com

同步是指程序用于控制不同線程之間操作發(fā)生相對(duì)順序的機(jī)制。在共享內(nèi)存并發(fā)模型里,同步是顯式進(jìn)行的。程序員必須顯式指定某個(gè)方法或某段代碼需要在線程之間互斥執(zhí)行。在消息傳遞的并發(fā)模型里,由于消息的發(fā)送必須在消息的接收之前,因此同步是隱式進(jìn)行的。ZCT28資訊網(wǎng)——每日最新資訊28at.com

Java 的并發(fā)采用的是共享內(nèi)存模型,Java 線程之間的通信總是隱式進(jìn)行,整個(gè)通信過(guò)程對(duì)程序員完全透明。如果編寫多線程程序的 Java 程序員不理解隱式進(jìn)行的線程之間通信的工作機(jī)制,很可能會(huì)遇到各種奇怪的內(nèi)存可見(jiàn)性問(wèn)題。ZCT28資訊網(wǎng)——每日最新資訊28at.com

Java 內(nèi)存模型的抽象

在 java 中,所有實(shí)例域、靜態(tài)域和數(shù)組元素存儲(chǔ)在堆內(nèi)存中,堆內(nèi)存在線程之間共享(本文使用“共享變量”這個(gè)術(shù)語(yǔ)代指實(shí)例域,靜態(tài)域和數(shù)組元素)。局部變量(Local variables),方法定義參數(shù)(java 語(yǔ)言規(guī)范稱之為 formal method parameters)和異常處理器參數(shù)(exception handler parameters)不會(huì)在線程之間共享,它們不會(huì)有內(nèi)存可見(jiàn)性問(wèn)題,也不受內(nèi)存模型的影響。ZCT28資訊網(wǎng)——每日最新資訊28at.com

Java 線程之間的通信由 Java 內(nèi)存模型(本文簡(jiǎn)稱為 JMM)控制,JMM 決定一個(gè)線程對(duì)共享變量的寫入何時(shí)對(duì)另一個(gè)線程可見(jiàn)。從抽象的角度來(lái)看,JMM 定義了線程和主內(nèi)存之間的抽象關(guān)系:線程之間的共享變量存儲(chǔ)在主內(nèi)存(main memory)中,每個(gè)線程都有一個(gè)私有的本地內(nèi)存(local memory),本地內(nèi)存中存儲(chǔ)了該線程以讀 / 寫共享變量的副本。本地內(nèi)存是 JMM 的一個(gè)抽象概念,并不真實(shí)存在。它涵蓋了緩存,寫緩沖區(qū),寄存器以及其他的硬件和編譯器優(yōu)化。Java 內(nèi)存模型的抽象示意圖如下:ZCT28資訊網(wǎng)——每日最新資訊28at.com

圖片圖片ZCT28資訊網(wǎng)——每日最新資訊28at.com

從上圖來(lái)看,線程 A 與線程 B 之間如要通信的話,必須要經(jīng)歷下面 2 個(gè)步驟:ZCT28資訊網(wǎng)——每日最新資訊28at.com

  • 首先,線程 A 把本地內(nèi)存 A 中更新過(guò)的共享變量刷新到主內(nèi)存中去。
  • 然后,線程 B 到主內(nèi)存中去讀取線程 A 之前已更新過(guò)的共享變量。

下面通過(guò)示意圖來(lái)說(shuō)明這兩個(gè)步驟:ZCT28資訊網(wǎng)——每日最新資訊28at.com

圖片圖片ZCT28資訊網(wǎng)——每日最新資訊28at.com

如上圖所示,本地內(nèi)存 A 和 B 有主內(nèi)存中共享變量 x 的副本。假設(shè)初始時(shí),這三個(gè)內(nèi)存中的 x 值都為 0。線程 A 在執(zhí)行時(shí),把更新后的 x 值(假設(shè)值為 1)臨時(shí)存放在自己的本地內(nèi)存 A 中。當(dāng)線程 A 和線程 B 需要通信時(shí),線程 A 首先會(huì)把自己本地內(nèi)存中修改后的 x 值刷新到主內(nèi)存中,此時(shí)主內(nèi)存中的 x 值變?yōu)榱?1。隨后,線程 B 到主內(nèi)存中去讀取線程 A 更新后的 x 值,此時(shí)線程 B 的本地內(nèi)存的 x 值也變?yōu)榱?1。ZCT28資訊網(wǎng)——每日最新資訊28at.com

從整體來(lái)看,這兩個(gè)步驟實(shí)質(zhì)上是線程 A 在向線程 B 發(fā)送消息,而且這個(gè)通信過(guò)程必須要經(jīng)過(guò)主內(nèi)存。JMM 通過(guò)控制主內(nèi)存與每個(gè)線程的本地內(nèi)存之間的交互,來(lái)為 java 程序員提供內(nèi)存可見(jiàn)性保證。ZCT28資訊網(wǎng)——每日最新資訊28at.com

重排序

在執(zhí)行程序時(shí)為了提高性能,編譯器和處理器常常會(huì)對(duì)指令做重排序。重排序分三種類型:ZCT28資訊網(wǎng)——每日最新資訊28at.com

  • 編譯器優(yōu)化的重排序。編譯器在不改變單線程程序語(yǔ)義的前提下,可以重新安排語(yǔ)句的執(zhí)行順序。
  • 指令級(jí)并行的重排序。現(xiàn)代處理器采用了指令級(jí)并行技術(shù)(Instruction-Level Parallelism, ILP)來(lái)將多條指令重疊執(zhí)行。如果不存在數(shù)據(jù)依賴性,處理器可以改變語(yǔ)句對(duì)應(yīng)機(jī)器指令的執(zhí)行順序。
  • 內(nèi)存系統(tǒng)的重排序。由于處理器使用緩存和讀 / 寫緩沖區(qū),這使得加載和存儲(chǔ)操作看上去可能是在亂序執(zhí)行。

從 java 源代碼到最終實(shí)際執(zhí)行的指令序列,會(huì)分別經(jīng)歷下面三種重排序:ZCT28資訊網(wǎng)——每日最新資訊28at.com

圖片圖片ZCT28資訊網(wǎng)——每日最新資訊28at.com

上述的 1 屬于編譯器重排序,2 和 3 屬于處理器重排序。這些重排序都可能會(huì)導(dǎo)致多線程程序出現(xiàn)內(nèi)存可見(jiàn)性問(wèn)題。對(duì)于編譯器,JMM 的編譯器重排序規(guī)則會(huì)禁止特定類型的編譯器重排序(不是所有的編譯器重排序都要禁止)。對(duì)于處理器重排序,JMM 的處理器重排序規(guī)則會(huì)要求 java 編譯器在生成指令序列時(shí),插入特定類型的內(nèi)存屏障(memory barriers,intel 稱之為 memory fence)指令,通過(guò)內(nèi)存屏障指令來(lái)禁止特定類型的處理器重排序(不是所有的處理器重排序都要禁止)。ZCT28資訊網(wǎng)——每日最新資訊28at.com

JMM 屬于語(yǔ)言級(jí)的內(nèi)存模型,它確保在不同的編譯器和不同的處理器平臺(tái)之上,通過(guò)禁止特定類型的編譯器重排序和處理器重排序,為程序員提供一致的內(nèi)存可見(jiàn)性保證。ZCT28資訊網(wǎng)——每日最新資訊28at.com

處理器重排序與內(nèi)存屏障指令

現(xiàn)代的處理器使用寫緩沖區(qū)來(lái)臨時(shí)保存向內(nèi)存寫入的數(shù)據(jù)。寫緩沖區(qū)可以保證指令流水線持續(xù)運(yùn)行,它可以避免由于處理器停頓下來(lái)等待向內(nèi)存寫入數(shù)據(jù)而產(chǎn)生的延遲。同時(shí),通過(guò)以批處理的方式刷新寫緩沖區(qū),以及合并寫緩沖區(qū)中對(duì)同一內(nèi)存地址的多次寫,可以減少對(duì)內(nèi)存總線的占用。雖然寫緩沖區(qū)有這么多好處,但每個(gè)處理器上的寫緩沖區(qū),僅僅對(duì)它所在的處理器可見(jiàn)。這個(gè)特性會(huì)對(duì)內(nèi)存操作的執(zhí)行順序產(chǎn)生重要的影響:處理器對(duì)內(nèi)存的讀 / 寫操作的執(zhí)行順序,不一定與內(nèi)存實(shí)際發(fā)生的讀 / 寫操作順序一致!為了具體說(shuō)明,請(qǐng)看下面示例:ZCT28資訊網(wǎng)——每日最新資訊28at.com

// Processor Aa = 1; //A1  x = b; //A2// Processor Bb = 2; //B1  y = a; //B2// 初始狀態(tài):a = b = 0;處理器允許執(zhí)行后得到結(jié)果:x = y = 0

假設(shè)處理器 A 和處理器 B 按程序的順序并行執(zhí)行內(nèi)存訪問(wèn),最終卻可能得到 x = y = 0 的結(jié)果。具體的原因如下圖所示:ZCT28資訊網(wǎng)——每日最新資訊28at.com

圖片圖片ZCT28資訊網(wǎng)——每日最新資訊28at.com

這里處理器 A 和處理器 B 可以同時(shí)把共享變量寫入自己的寫緩沖區(qū)(A1,B1),然后從內(nèi)存中讀取另一個(gè)共享變量(A2,B2),最后才把自己寫緩存區(qū)中保存的臟數(shù)據(jù)刷新到內(nèi)存中(A3,B3)。當(dāng)以這種時(shí)序執(zhí)行時(shí),程序就可以得到 x = y = 0 的結(jié)果。ZCT28資訊網(wǎng)——每日最新資訊28at.com

從內(nèi)存操作實(shí)際發(fā)生的順序來(lái)看,直到處理器 A 執(zhí)行 A3 來(lái)刷新自己的寫緩存區(qū),寫操作 A1 才算真正執(zhí)行了。雖然處理器 A 執(zhí)行內(nèi)存操作的順序?yàn)椋篈1->A2,但內(nèi)存操作實(shí)際發(fā)生的順序卻是:A2->A1。此時(shí),處理器 A 的內(nèi)存操作順序被重排序了(處理器 B 的情況和處理器 A 一樣,這里就不贅述了)。ZCT28資訊網(wǎng)——每日最新資訊28at.com

這里的關(guān)鍵是,由于寫緩沖區(qū)僅對(duì)自己的處理器可見(jiàn),它會(huì)導(dǎo)致處理器執(zhí)行內(nèi)存操作的順序可能會(huì)與內(nèi)存實(shí)際的操作執(zhí)行順序不一致。由于現(xiàn)代的處理器都會(huì)使用寫緩沖區(qū),因此現(xiàn)代的處理器都會(huì)允許對(duì)寫 - 讀操做重排序。ZCT28資訊網(wǎng)——每日最新資訊28at.com

下面是常見(jiàn)處理器允許的重排序類型的列表:ZCT28資訊網(wǎng)——每日最新資訊28at.com


ZCT28資訊網(wǎng)——每日最新資訊28at.com

Load-LoadZCT28資訊網(wǎng)——每日最新資訊28at.com

Load-StoreZCT28資訊網(wǎng)——每日最新資訊28at.com

Store-StoreZCT28資訊網(wǎng)——每日最新資訊28at.com

Store-LoadZCT28資訊網(wǎng)——每日最新資訊28at.com

數(shù)據(jù)依賴ZCT28資訊網(wǎng)——每日最新資訊28at.com

sparc-TSOZCT28資訊網(wǎng)——每日最新資訊28at.com

NZCT28資訊網(wǎng)——每日最新資訊28at.com

NZCT28資訊網(wǎng)——每日最新資訊28at.com

NZCT28資訊網(wǎng)——每日最新資訊28at.com

YZCT28資訊網(wǎng)——每日最新資訊28at.com

NZCT28資訊網(wǎng)——每日最新資訊28at.com

x86ZCT28資訊網(wǎng)——每日最新資訊28at.com

NZCT28資訊網(wǎng)——每日最新資訊28at.com

NZCT28資訊網(wǎng)——每日最新資訊28at.com

NZCT28資訊網(wǎng)——每日最新資訊28at.com

YZCT28資訊網(wǎng)——每日最新資訊28at.com

NZCT28資訊網(wǎng)——每日最新資訊28at.com

ia64ZCT28資訊網(wǎng)——每日最新資訊28at.com

YZCT28資訊網(wǎng)——每日最新資訊28at.com

YZCT28資訊網(wǎng)——每日最新資訊28at.com

YZCT28資訊網(wǎng)——每日最新資訊28at.com

YZCT28資訊網(wǎng)——每日最新資訊28at.com

NZCT28資訊網(wǎng)——每日最新資訊28at.com

PowerPCZCT28資訊網(wǎng)——每日最新資訊28at.com

YZCT28資訊網(wǎng)——每日最新資訊28at.com

YZCT28資訊網(wǎng)——每日最新資訊28at.com

YZCT28資訊網(wǎng)——每日最新資訊28at.com

YZCT28資訊網(wǎng)——每日最新資訊28at.com

NZCT28資訊網(wǎng)——每日最新資訊28at.com

上表單元格中的“N”表示處理器不允許兩個(gè)操作重排序,“Y”表示允許重排序。ZCT28資訊網(wǎng)——每日最新資訊28at.com

從上表我們可以看出:常見(jiàn)的處理器都允許 Store-Load 重排序;常見(jiàn)的處理器都不允許對(duì)存在數(shù)據(jù)依賴的操作做重排序。sparc-TSO 和 x86 擁有相對(duì)較強(qiáng)的處理器內(nèi)存模型,它們僅允許對(duì)寫 - 讀操作做重排序(因?yàn)樗鼈兌际褂昧藢懢彌_區(qū))。ZCT28資訊網(wǎng)——每日最新資訊28at.com

  • ※注 1:sparc-TSO 是指以 TSO(Total Store Order) 內(nèi)存模型運(yùn)行時(shí),sparc 處理器的特性。
  • ※注 2:上表中的 x86 包括 x64 及 AMD64。
  • ※注 3:由于 ARM 處理器的內(nèi)存模型與 PowerPC 處理器的內(nèi)存模型非常類似,本文將忽略它。
  • ※注 4:數(shù)據(jù)依賴性后文會(huì)專門說(shuō)明。

為了保證內(nèi)存可見(jiàn)性,java 編譯器在生成指令序列的適當(dāng)位置會(huì)插入內(nèi)存屏障指令來(lái)禁止特定類型的處理器重排序。JMM 把內(nèi)存屏障指令分為下列四類:ZCT28資訊網(wǎng)——每日最新資訊28at.com

屏障類型ZCT28資訊網(wǎng)——每日最新資訊28at.com

指令示例ZCT28資訊網(wǎng)——每日最新資訊28at.com

說(shuō)明ZCT28資訊網(wǎng)——每日最新資訊28at.com

LoadLoad BarriersZCT28資訊網(wǎng)——每日最新資訊28at.com

Load1; LoadLoad; Load2ZCT28資訊網(wǎng)——每日最新資訊28at.com

確保 Load1 數(shù)據(jù)的裝載,之前于 Load2 及所有后續(xù)裝載指令的裝載。ZCT28資訊網(wǎng)——每日最新資訊28at.com

StoreStore BarriersZCT28資訊網(wǎng)——每日最新資訊28at.com

Store1; StoreStore; Store2ZCT28資訊網(wǎng)——每日最新資訊28at.com

確保 Store1 數(shù)據(jù)對(duì)其他處理器可見(jiàn)(刷新到內(nèi)存),之前于 Store2 及所有后續(xù)存儲(chǔ)指令的存儲(chǔ)。ZCT28資訊網(wǎng)——每日最新資訊28at.com

LoadStore BarriersZCT28資訊網(wǎng)——每日最新資訊28at.com

Load1; LoadStore; Store2ZCT28資訊網(wǎng)——每日最新資訊28at.com

確保 Load1 數(shù)據(jù)裝載,之前于 Store2 及所有后續(xù)的存儲(chǔ)指令刷新到內(nèi)存。ZCT28資訊網(wǎng)——每日最新資訊28at.com

StoreLoad BarriersZCT28資訊網(wǎng)——每日最新資訊28at.com

Store1; StoreLoad; Load2ZCT28資訊網(wǎng)——每日最新資訊28at.com

確保 Store1 數(shù)據(jù)對(duì)其他處理器變得可見(jiàn)(指刷新到內(nèi)存),之前于 Load2 及所有后續(xù)裝載指令的裝載。ZCT28資訊網(wǎng)——每日最新資訊28at.com

StoreLoad Barriers 會(huì)使該屏障之前的所有內(nèi)存訪問(wèn)指令(存儲(chǔ)和裝載指令)完成之后,才執(zhí)行該屏障之后的內(nèi)存訪問(wèn)指令。ZCT28資訊網(wǎng)——每日最新資訊28at.com

StoreLoad Barriers 是一個(gè)“全能型”的屏障,它同時(shí)具有其他三個(gè)屏障的效果。現(xiàn)代的多處理器大都支持該屏障(其他類型的屏障不一定被所有處理器支持)。執(zhí)行該屏障開銷會(huì)很昂貴,因?yàn)楫?dāng)前處理器通常要把寫緩沖區(qū)中的數(shù)據(jù)全部刷新到內(nèi)存中(buffer fully flush)。ZCT28資訊網(wǎng)——每日最新資訊28at.com

happens-before

從 JDK5 開始,java 使用新的 JSR -133 內(nèi)存模型(本文除非特別說(shuō)明,針對(duì)的都是 JSR- 133 內(nèi)存模型)。JSR-133 提出了 happens-before 的概念,通過(guò)這個(gè)概念來(lái)闡述操作之間的內(nèi)存可見(jiàn)性。如果一個(gè)操作執(zhí)行的結(jié)果需要對(duì)另一個(gè)操作可見(jiàn),那么這兩個(gè)操作之間必須存在 happens-before 關(guān)系。這里提到的兩個(gè)操作既可以是在一個(gè)線程之內(nèi),也可以是在不同線程之間。與程序員密切相關(guān)的 happens-before 規(guī)則如下:ZCT28資訊網(wǎng)——每日最新資訊28at.com

  • 程序順序規(guī)則:一個(gè)線程中的每個(gè)操作,happens- before 于該線程中的任意后續(xù)操作。
  • 監(jiān)視器鎖規(guī)則:對(duì)一個(gè)監(jiān)視器鎖的解鎖,happens- before 于隨后對(duì)這個(gè)監(jiān)視器鎖的加鎖。
  • volatile 變量規(guī)則:對(duì)一個(gè) volatile 域的寫,happens- before 于任意后續(xù)對(duì)這個(gè) volatile 域的讀。
  • 傳遞性:如果 A happens- before B,且 B happens- before C,那么 A happens- before C。

注意,兩個(gè)操作之間具有 happens-before 關(guān)系,并不意味著前一個(gè)操作必須要在后一個(gè)操作之前執(zhí)行!happens-before 僅僅要求前一個(gè)操作(執(zhí)行的結(jié)果)對(duì)后一個(gè)操作可見(jiàn),且前一個(gè)操作按順序排在第二個(gè)操作之前(the first is visible to and ordered before the second)。happens- before 的定義很微妙,后文會(huì)具體說(shuō)明 happens-before 為什么要這么定義。ZCT28資訊網(wǎng)——每日最新資訊28at.com

happens-before 與 JMM 的關(guān)系如下圖所示:ZCT28資訊網(wǎng)——每日最新資訊28at.com

圖片圖片ZCT28資訊網(wǎng)——每日最新資訊28at.com

image.pngZCT28資訊網(wǎng)——每日最新資訊28at.com

如上圖所示,一個(gè) happens-before 規(guī)則通常對(duì)應(yīng)于多個(gè)編譯器重排序規(guī)則和處理器重排序規(guī)則。對(duì)于 java 程序員來(lái)說(shuō),happens-before 規(guī)則簡(jiǎn)單易懂,它避免程序員為了理解 JMM 提供的內(nèi)存可見(jiàn)性保證而去學(xué)習(xí)復(fù)雜的重排序規(guī)則以及這些規(guī)則的具體實(shí)現(xiàn)。ZCT28資訊網(wǎng)——每日最新資訊28at.com

重排序

數(shù)據(jù)依賴性

如果兩個(gè)操作訪問(wèn)同一個(gè)變量,且這兩個(gè)操作中有一個(gè)為寫操作,此時(shí)這兩個(gè)操作之間就存在數(shù)據(jù)依賴性。數(shù)據(jù)依賴分下列三種類型:ZCT28資訊網(wǎng)——每日最新資訊28at.com

名稱ZCT28資訊網(wǎng)——每日最新資訊28at.com

代碼示例ZCT28資訊網(wǎng)——每日最新資訊28at.com

說(shuō)明ZCT28資訊網(wǎng)——每日最新資訊28at.com

寫后讀ZCT28資訊網(wǎng)——每日最新資訊28at.com

a = 1;b = a;ZCT28資訊網(wǎng)——每日最新資訊28at.com

寫一個(gè)變量之后,再讀這個(gè)位置。ZCT28資訊網(wǎng)——每日最新資訊28at.com

寫后寫ZCT28資訊網(wǎng)——每日最新資訊28at.com

a = 1;a = 2;ZCT28資訊網(wǎng)——每日最新資訊28at.com

寫一個(gè)變量之后,再寫這個(gè)變量。ZCT28資訊網(wǎng)——每日最新資訊28at.com

讀后寫ZCT28資訊網(wǎng)——每日最新資訊28at.com

a = b;b = 1;ZCT28資訊網(wǎng)——每日最新資訊28at.com

讀一個(gè)變量之后,再寫這個(gè)變量。ZCT28資訊網(wǎng)——每日最新資訊28at.com

上面三種情況,只要重排序兩個(gè)操作的執(zhí)行順序,程序的執(zhí)行結(jié)果將會(huì)被改變。ZCT28資訊網(wǎng)——每日最新資訊28at.com

前面提到過(guò),編譯器和處理器可能會(huì)對(duì)操作做重排序。編譯器和處理器在重排序時(shí),會(huì)遵守?cái)?shù)據(jù)依賴性,編譯器和處理器不會(huì)改變存在數(shù)據(jù)依賴關(guān)系的兩個(gè)操作的執(zhí)行順序。ZCT28資訊網(wǎng)——每日最新資訊28at.com

注意,這里所說(shuō)的數(shù)據(jù)依賴性僅針對(duì)單個(gè)處理器中執(zhí)行的指令序列和單個(gè)線程中執(zhí)行的操作,不同處理器之間和不同線程之間的數(shù)據(jù)依賴性不被編譯器和處理器考慮。ZCT28資訊網(wǎng)——每日最新資訊28at.com

as-if-serial 語(yǔ)義

as-if-serial 語(yǔ)義的意思指:不管怎么重排序(編譯器和處理器為了提高并行度),(單線程)程序的執(zhí)行結(jié)果不能被改變。編譯器,runtime 和處理器都必須遵守 as-if-serial 語(yǔ)義。ZCT28資訊網(wǎng)——每日最新資訊28at.com

為了遵守 as-if-serial 語(yǔ)義,編譯器和處理器不會(huì)對(duì)存在數(shù)據(jù)依賴關(guān)系的操作做重排序,因?yàn)檫@種重排序會(huì)改變執(zhí)行結(jié)果。但是,如果操作之間不存在數(shù)據(jù)依賴關(guān)系,這些操作可能被編譯器和處理器重排序。為了具體說(shuō)明,請(qǐng)看下面計(jì)算圓面積的代碼示例:ZCT28資訊網(wǎng)——每日最新資訊28at.com

double pi  = 3.14;    //Adouble r   = 1.0;     //Bdouble area = pi * r * r; //C

上面三個(gè)操作的數(shù)據(jù)依賴關(guān)系如下圖所示:ZCT28資訊網(wǎng)——每日最新資訊28at.com

圖片圖片ZCT28資訊網(wǎng)——每日最新資訊28at.com

如上圖所示,A 和 C 之間存在數(shù)據(jù)依賴關(guān)系,同時(shí) B 和 C 之間也存在數(shù)據(jù)依賴關(guān)系。因此在最終執(zhí)行的指令序列中,C 不能被重排序到 A 和 B 的前面(C 排到 A 和 B 的前面,程序的結(jié)果將會(huì)被改變)。但 A 和 B 之間沒(méi)有數(shù)據(jù)依賴關(guān)系,編譯器和處理器可以重排序 A 和 B 之間的執(zhí)行順序。下圖是該程序的兩種執(zhí)行順序:ZCT28資訊網(wǎng)——每日最新資訊28at.com

圖片圖片ZCT28資訊網(wǎng)——每日最新資訊28at.com

as-if-serial 語(yǔ)義把單線程程序保護(hù)了起來(lái),遵守 as-if-serial 語(yǔ)義的編譯器,runtime 和處理器共同為編寫單線程程序的程序員創(chuàng)建了一個(gè)幻覺(jué):?jiǎn)尉€程程序是按程序的順序來(lái)執(zhí)行的。as-if-serial 語(yǔ)義使單線程程序員無(wú)需擔(dān)心重排序會(huì)干擾他們,也無(wú)需擔(dān)心內(nèi)存可見(jiàn)性問(wèn)題。ZCT28資訊網(wǎng)——每日最新資訊28at.com

程序順序規(guī)則

根據(jù) happens- before 的程序順序規(guī)則,上面計(jì)算圓的面積的示例代碼存在三個(gè) happens- before 關(guān)系:ZCT28資訊網(wǎng)——每日最新資訊28at.com

  • A happens- before B;
  • B happens- before C;
  • A happens- before C;

這里的第 3 個(gè) happens- before 關(guān)系,是根據(jù) happens- before 的傳遞性推導(dǎo)出來(lái)的。ZCT28資訊網(wǎng)——每日最新資訊28at.com

這里 A happens- before B,但實(shí)際執(zhí)行時(shí) B 卻可以排在 A 之前執(zhí)行(看上面的重排序后的執(zhí)行順序)。在第一章提到過(guò),如果 A happens- before B,JMM 并不要求 A 一定要在 B 之前執(zhí)行。JMM 僅僅要求前一個(gè)操作(執(zhí)行的結(jié)果)對(duì)后一個(gè)操作可見(jiàn),且前一個(gè)操作按順序排在第二個(gè)操作之前。這里操作 A 的執(zhí)行結(jié)果不需要對(duì)操作 B 可見(jiàn);而且重排序操作 A 和操作 B 后的執(zhí)行結(jié)果,與操作 A 和操作 B 按 happens- before 順序執(zhí)行的結(jié)果一致。在這種情況下,JMM 會(huì)認(rèn)為這種重排序并不非法(not illegal),JMM 允許這種重排序。ZCT28資訊網(wǎng)——每日最新資訊28at.com

在計(jì)算機(jī)中,軟件技術(shù)和硬件技術(shù)有一個(gè)共同的目標(biāo):在不改變程序執(zhí)行結(jié)果的前提下,盡可能的開發(fā)并行度。編譯器和處理器遵從這一目標(biāo),從 happens- before 的定義我們可以看出,JMM 同樣遵從這一目標(biāo)。ZCT28資訊網(wǎng)——每日最新資訊28at.com

重排序?qū)Χ嗑€程的影響

現(xiàn)在讓我們來(lái)看看,重排序是否會(huì)改變多線程程序的執(zhí)行結(jié)果。請(qǐng)看下面的示例代碼:ZCT28資訊網(wǎng)——每日最新資訊28at.com

class ReorderExample {    int a = 0;    boolean flag = false;    public void writer() {        a = 1;                   //1        flag = true;             //2    }    Public void reader() {        if (flag) {                //3            int i =  a * a;        //4            ……        }    }}

flag 變量是個(gè)標(biāo)記,用來(lái)標(biāo)識(shí)變量 a 是否已被寫入。這里假設(shè)有兩個(gè)線程 A 和 B,A 首先執(zhí)行 writer() 方法,隨后 B 線程接著執(zhí)行 reader() 方法。線程 B 在執(zhí)行操作 4 時(shí),能否看到線程 A 在操作 1 對(duì)共享變量 a 的寫入?ZCT28資訊網(wǎng)——每日最新資訊28at.com

答案是:不一定能看到。ZCT28資訊網(wǎng)——每日最新資訊28at.com

由于操作 1 和操作 2 沒(méi)有數(shù)據(jù)依賴關(guān)系,編譯器和處理器可以對(duì)這兩個(gè)操作重排序;同樣,操作 3 和操作 4 沒(méi)有數(shù)據(jù)依賴關(guān)系,編譯器和處理器也可以對(duì)這兩個(gè)操作重排序。讓我們先來(lái)看看,當(dāng)操作 1 和操作 2 重排序時(shí),可能會(huì)產(chǎn)生什么效果? 請(qǐng)看下面的程序執(zhí)行時(shí)序圖:ZCT28資訊網(wǎng)——每日最新資訊28at.com

圖片圖片ZCT28資訊網(wǎng)——每日最新資訊28at.com

如上圖所示,操作 1 和操作 2 做了重排序。程序執(zhí)行時(shí),線程 A 首先寫標(biāo)記變量 flag,隨后線程 B 讀這個(gè)變量。由于條件判斷為真,線程 B 將讀取變量 a。此時(shí),變量 a 還根本沒(méi)有被線程 A 寫入,在這里多線程程序的語(yǔ)義被重排序破壞了!ZCT28資訊網(wǎng)——每日最新資訊28at.com

※注:本文統(tǒng)一用紅色的虛箭線表示錯(cuò)誤的讀操作,用綠色的虛箭線表示正確的讀操作。ZCT28資訊網(wǎng)——每日最新資訊28at.com

下面再讓我們看看,當(dāng)操作 3 和操作 4 重排序時(shí)會(huì)產(chǎn)生什么效果(借助這個(gè)重排序,可以順便說(shuō)明控制依賴性)。下面是操作 3 和操作 4 重排序后,程序的執(zhí)行時(shí)序圖:ZCT28資訊網(wǎng)——每日最新資訊28at.com

圖片圖片ZCT28資訊網(wǎng)——每日最新資訊28at.com

image.pngZCT28資訊網(wǎng)——每日最新資訊28at.com

在程序中,操作 3 和操作 4 存在控制依賴關(guān)系。當(dāng)代碼中存在控制依賴性時(shí),會(huì)影響指令序列執(zhí)行的并行度。為此,編譯器和處理器會(huì)采用猜測(cè)(Speculation)執(zhí)行來(lái)克服控制相關(guān)性對(duì)并行度的影響。以處理器的猜測(cè)執(zhí)行為例,執(zhí)行線程 B 的處理器可以提前讀取并計(jì)算 a*a,然后把計(jì)算結(jié)果臨時(shí)保存到一個(gè)名為重排序緩沖(reorder buffer ROB)的硬件緩存中。當(dāng)接下來(lái)操作 3 的條件判斷為真時(shí),就把該計(jì)算結(jié)果寫入變量 i 中。ZCT28資訊網(wǎng)——每日最新資訊28at.com

從圖中我們可以看出,猜測(cè)執(zhí)行實(shí)質(zhì)上對(duì)操作 3 和 4 做了重排序。重排序在這里破壞了多線程程序的語(yǔ)義!ZCT28資訊網(wǎng)——每日最新資訊28at.com

在單線程程序中,對(duì)存在控制依賴的操作重排序,不會(huì)改變執(zhí)行結(jié)果(這也是 as-if-serial 語(yǔ)義允許對(duì)存在控制依賴的操作做重排序的原因);但在多線程程序中,對(duì)存在控制依賴的操作重排序,可能會(huì)改變程序的執(zhí)行結(jié)果。ZCT28資訊網(wǎng)——每日最新資訊28at.com

順序一致性

數(shù)據(jù)競(jìng)爭(zhēng)與順序一致性保證

當(dāng)程序未正確同步時(shí),就會(huì)存在數(shù)據(jù)競(jìng)爭(zhēng)。java 內(nèi)存模型規(guī)范對(duì)數(shù)據(jù)競(jìng)爭(zhēng)的定義如下:ZCT28資訊網(wǎng)——每日最新資訊28at.com

  • 在一個(gè)線程中寫一個(gè)變量,
  • 在另一個(gè)線程讀同一個(gè)變量,
  • 而且寫和讀沒(méi)有通過(guò)同步來(lái)排序。

當(dāng)代碼中包含數(shù)據(jù)競(jìng)爭(zhēng)時(shí),程序的執(zhí)行往往產(chǎn)生違反直覺(jué)的結(jié)果(前一章的示例正是如此)。如果一個(gè)多線程程序能正確同步,這個(gè)程序?qū)⑹且粋€(gè)沒(méi)有數(shù)據(jù)競(jìng)爭(zhēng)的程序。ZCT28資訊網(wǎng)——每日最新資訊28at.com

JMM 對(duì)正確同步的多線程程序的內(nèi)存一致性做了如下保證:ZCT28資訊網(wǎng)——每日最新資訊28at.com

  • 如果程序是正確同步的,程序的執(zhí)行將具有順序一致性(sequentially consistent)-- 即程序的執(zhí)行結(jié)果與該程序在順序一致性內(nèi)存模型中的執(zhí)行結(jié)果相同(馬上我們將會(huì)看到,這對(duì)于程序員來(lái)說(shuō)是一個(gè)極強(qiáng)的保證)。這里的同步是指廣義上的同步,包括對(duì)常用同步原語(yǔ)(lock,volatile 和 final)的正確使用。

順序一致性內(nèi)存模型

順序一致性內(nèi)存模型是一個(gè)被計(jì)算機(jī)科學(xué)家理想化了的理論參考模型,它為程序員提供了極強(qiáng)的內(nèi)存可見(jiàn)性保證。順序一致性內(nèi)存模型有兩大特性:ZCT28資訊網(wǎng)——每日最新資訊28at.com

  • 一個(gè)線程中的所有操作必須按照程序的順序來(lái)執(zhí)行。+(不管程序是否同步)所有線程都只能看到一個(gè)單一的操作執(zhí)行順序。在順序一致性內(nèi)存模型中,每個(gè)操作都必須原子執(zhí)行且立刻對(duì)所有線程可見(jiàn)。順序一致性內(nèi)存模型為程序員提供的視圖如下:

圖片圖片ZCT28資訊網(wǎng)——每日最新資訊28at.com

在概念上,順序一致性模型有一個(gè)單一的全局內(nèi)存,這個(gè)內(nèi)存通過(guò)一個(gè)左右擺動(dòng)的開關(guān)可以連接到任意一個(gè)線程。同時(shí),每一個(gè)線程必須按程序的順序來(lái)執(zhí)行內(nèi)存讀 / 寫操作。從上圖我們可以看出,在任意時(shí)間點(diǎn)最多只能有一個(gè)線程可以連接到內(nèi)存。當(dāng)多個(gè)線程并發(fā)執(zhí)行時(shí),圖中的開關(guān)裝置能把所有線程的所有內(nèi)存讀 / 寫操作串行化。ZCT28資訊網(wǎng)——每日最新資訊28at.com

為了更好的理解,下面我們通過(guò)兩個(gè)示意圖來(lái)對(duì)順序一致性模型的特性做進(jìn)一步的說(shuō)明。ZCT28資訊網(wǎng)——每日最新資訊28at.com

假設(shè)有兩個(gè)線程 A 和 B 并發(fā)執(zhí)行。其中 A 線程有三個(gè)操作,它們?cè)诔绦蛑械捻樞蚴牵篈1->A2->A3。B 線程也有三個(gè)操作,它們?cè)诔绦蛑械捻樞蚴牵築1->B2->B3。ZCT28資訊網(wǎng)——每日最新資訊28at.com

假設(shè)這兩個(gè)線程使用監(jiān)視器來(lái)正確同步:A 線程的三個(gè)操作執(zhí)行后釋放監(jiān)視器,隨后 B 線程獲取同一個(gè)監(jiān)視器。那么程序在順序一致性模型中的執(zhí)行效果將如下圖所示:ZCT28資訊網(wǎng)——每日最新資訊28at.com

圖片圖片ZCT28資訊網(wǎng)——每日最新資訊28at.com

現(xiàn)在我們?cè)偌僭O(shè)這兩個(gè)線程沒(méi)有做同步,下面是這個(gè)未同步程序在順序一致性模型中的執(zhí)行示意圖:ZCT28資訊網(wǎng)——每日最新資訊28at.com

圖片圖片ZCT28資訊網(wǎng)——每日最新資訊28at.com

未同步程序在順序一致性模型中雖然整體執(zhí)行順序是無(wú)序的,但所有線程都只能看到一個(gè)一致的整體執(zhí)行順序。以上圖為例,線程 A 和 B 看到的執(zhí)行順序都是:B1->A1->A2->B2->A3->B3。之所以能得到這個(gè)保證是因?yàn)轫樞蛞恢滦詢?nèi)存模型中的每個(gè)操作必須立即對(duì)任意線程可見(jiàn)。ZCT28資訊網(wǎng)——每日最新資訊28at.com

但是,在 JMM 中就沒(méi)有這個(gè)保證。未同步程序在 JMM 中不但整體的執(zhí)行順序是無(wú)序的,而且所有線程看到的操作執(zhí)行順序也可能不一致。比如,在當(dāng)前線程把寫過(guò)的數(shù)據(jù)緩存在本地內(nèi)存中,且還沒(méi)有刷新到主內(nèi)存之前,這個(gè)寫操作僅對(duì)當(dāng)前線程可見(jiàn);從其他線程的角度來(lái)觀察,會(huì)認(rèn)為這個(gè)寫操作根本還沒(méi)有被當(dāng)前線程執(zhí)行。只有當(dāng)前線程把本地內(nèi)存中寫過(guò)的數(shù)據(jù)刷新到主內(nèi)存之后,這個(gè)寫操作才能對(duì)其他線程可見(jiàn)。在這種情況下,當(dāng)前線程和其它線程看到的操作執(zhí)行順序?qū)⒉灰恢隆?span style="display:none">ZCT28資訊網(wǎng)——每日最新資訊28at.com

同步程序的順序一致性效果

下面我們對(duì)前面的示例程序 ReorderExample 用監(jiān)視器來(lái)同步,看看正確同步的程序如何具有順序一致性。ZCT28資訊網(wǎng)——每日最新資訊28at.com

請(qǐng)看下面的示例代碼:ZCT28資訊網(wǎng)——每日最新資訊28at.com

class SynchronizedExample {    int a = 0;    boolean flag = false;    public synchronized void writer() {        a = 1;        flag = true;    }    public synchronized void reader() {        if (flag) {            int i = a;            ……        }    }}

上面示例代碼中,假設(shè) A 線程執(zhí)行 writer() 方法后,B 線程執(zhí)行 reader() 方法。這是一個(gè)正確同步的多線程程序。根據(jù) JMM 規(guī)范,該程序的執(zhí)行結(jié)果將與該程序在順序一致性模型中的執(zhí)行結(jié)果相同。下面是該程序在兩個(gè)內(nèi)存模型中的執(zhí)行時(shí)序?qū)Ρ葓D:ZCT28資訊網(wǎng)——每日最新資訊28at.com

圖片圖片ZCT28資訊網(wǎng)——每日最新資訊28at.com

在順序一致性模型中,所有操作完全按程序的順序串行執(zhí)行。而在 JMM 中,臨界區(qū)內(nèi)的代碼可以重排序(但 JMM 不允許臨界區(qū)內(nèi)的代碼“逸出”到臨界區(qū)之外,那樣會(huì)破壞監(jiān)視器的語(yǔ)義)。JMM 會(huì)在退出監(jiān)視器和進(jìn)入監(jiān)視器這兩個(gè)關(guān)鍵時(shí)間點(diǎn)做一些特別處理,使得線程在這兩個(gè)時(shí)間點(diǎn)具有與順序一致性模型相同的內(nèi)存視圖(具體細(xì)節(jié)后文會(huì)說(shuō)明)。雖然線程 A 在臨界區(qū)內(nèi)做了重排序,但由于監(jiān)視器的互斥執(zhí)行的特性,這里的線程 B 根本無(wú)法“觀察”到線程 A 在臨界區(qū)內(nèi)的重排序。這種重排序既提高了執(zhí)行效率,又沒(méi)有改變程序的執(zhí)行結(jié)果。ZCT28資訊網(wǎng)——每日最新資訊28at.com

從這里我們可以看到 JMM 在具體實(shí)現(xiàn)上的基本方針:在不改變(正確同步的)程序執(zhí)行結(jié)果的前提下,盡可能的為編譯器和處理器的優(yōu)化打開方便之門。ZCT28資訊網(wǎng)——每日最新資訊28at.com

未同步程序的執(zhí)行特性

對(duì)于未同步或未正確同步的多線程程序,JMM 只提供最小安全性:線程執(zhí)行時(shí)讀取到的值,要么是之前某個(gè)線程寫入的值,要么是默認(rèn)值(0,null,false),JMM 保證線程讀操作讀取到的值不會(huì)無(wú)中生有(out of thin air)的冒出來(lái)。為了實(shí)現(xiàn)最小安全性,JVM 在堆上分配對(duì)象時(shí),首先會(huì)清零內(nèi)存空間,然后才會(huì)在上面分配對(duì)象(JVM 內(nèi)部會(huì)同步這兩個(gè)操作)。因此,在以清零的內(nèi)存空間(pre-zeroed memory)分配對(duì)象時(shí),域的默認(rèn)初始化已經(jīng)完成了。ZCT28資訊網(wǎng)——每日最新資訊28at.com

JMM 不保證未同步程序的執(zhí)行結(jié)果與該程序在順序一致性模型中的執(zhí)行結(jié)果一致。因?yàn)槲赐匠绦蛟陧樞蛞恢滦阅P椭袌?zhí)行時(shí),整體上是無(wú)序的,其執(zhí)行結(jié)果無(wú)法預(yù)知。保證未同步程序在兩個(gè)模型中的執(zhí)行結(jié)果一致毫無(wú)意義。ZCT28資訊網(wǎng)——每日最新資訊28at.com

和順序一致性模型一樣,未同步程序在 JMM 中的執(zhí)行時(shí),整體上也是無(wú)序的,其執(zhí)行結(jié)果也無(wú)法預(yù)知。同時(shí),未同步程序在這兩個(gè)模型中的執(zhí)行特性有下面幾個(gè)差異:ZCT28資訊網(wǎng)——每日最新資訊28at.com

  • 順序一致性模型保證單線程內(nèi)的操作會(huì)按程序的順序執(zhí)行,而 JMM 不保證單線程內(nèi)的操作會(huì)按程序的順序執(zhí)行(比如上面正確同步的多線程程序在臨界區(qū)內(nèi)的重排序)。這一點(diǎn)前面已經(jīng)講過(guò)了,這里就不再贅述。
  • 順序一致性模型保證所有線程只能看到一致的操作執(zhí)行順序,而 JMM 不保證所有線程能看到一致的操作執(zhí)行順序。這一點(diǎn)前面也已經(jīng)講過(guò),這里就不再贅述。
  • JMM 不保證對(duì) 64 位的 long 型和 double 型變量的讀 / 寫操作具有原子性,而順序一致性模型保證對(duì)所有的內(nèi)存讀 / 寫操作都具有原子性。

第 3 個(gè)差異與處理器總線的工作機(jī)制密切相關(guān)。在計(jì)算機(jī)中,數(shù)據(jù)通過(guò)總線在處理器和內(nèi)存之間傳遞。每次處理器和內(nèi)存之間的數(shù)據(jù)傳遞都是通過(guò)一系列步驟來(lái)完成的,這一系列步驟稱之為總線事務(wù)(bus transaction)。總線事務(wù)包括讀事務(wù)(read transaction)和寫事務(wù)(write transaction)。讀事務(wù)從內(nèi)存?zhèn)魉蛿?shù)據(jù)到處理器,寫事務(wù)從處理器傳送數(shù)據(jù)到內(nèi)存,每個(gè)事務(wù)會(huì)讀 / 寫內(nèi)存中一個(gè)或多個(gè)物理上連續(xù)的字。這里的關(guān)鍵是,總線會(huì)同步試圖并發(fā)使用總線的事務(wù)。在一個(gè)處理器執(zhí)行總線事務(wù)期間,總線會(huì)禁止其它所有的處理器和 I/O 設(shè)備執(zhí)行內(nèi)存的讀 / 寫。下面讓我們通過(guò)一個(gè)示意圖來(lái)說(shuō)明總線的工作機(jī)制:ZCT28資訊網(wǎng)——每日最新資訊28at.com

圖片圖片ZCT28資訊網(wǎng)——每日最新資訊28at.com

如上圖所示,假設(shè)處理器 A,B 和 C 同時(shí)向總線發(fā)起總線事務(wù),這時(shí)總線仲裁(bus arbitration)會(huì)對(duì)競(jìng)爭(zhēng)作出裁決,這里我們假設(shè)總線在仲裁后判定處理器 A 在競(jìng)爭(zhēng)中獲勝(總線仲裁會(huì)確保所有處理器都能公平的訪問(wèn)內(nèi)存)。此時(shí)處理器 A 繼續(xù)它的總線事務(wù),而其它兩個(gè)處理器則要等待處理器 A 的總線事務(wù)完成后才能開始再次執(zhí)行內(nèi)存訪問(wèn)。假設(shè)在處理器 A 執(zhí)行總線事務(wù)期間(不管這個(gè)總線事務(wù)是讀事務(wù)還是寫事務(wù)),處理器 D 向總線發(fā)起了總線事務(wù),此時(shí)處理器 D 的這個(gè)請(qǐng)求會(huì)被總線禁止。ZCT28資訊網(wǎng)——每日最新資訊28at.com

總線的這些工作機(jī)制可以把所有處理器對(duì)內(nèi)存的訪問(wèn)以串行化的方式來(lái)執(zhí)行;在任意時(shí)間點(diǎn),最多只能有一個(gè)處理器能訪問(wèn)內(nèi)存。這個(gè)特性確保了單個(gè)總線事務(wù)之中的內(nèi)存讀 / 寫操作具有原子性。ZCT28資訊網(wǎng)——每日最新資訊28at.com

在一些 32 位的處理器上,如果要求對(duì) 64 位數(shù)據(jù)的讀 / 寫操作具有原子性,會(huì)有比較大的開銷。為了照顧這種處理器,java 語(yǔ)言規(guī)范鼓勵(lì)但不強(qiáng)求 JVM 對(duì) 64 位的 long 型變量和 double 型變量的讀 / 寫具有原子性。當(dāng) JVM 在這種處理器上運(yùn)行時(shí),會(huì)把一個(gè) 64 位 long/ double 型變量的讀 / 寫操作拆分為兩個(gè) 32 位的讀 / 寫操作來(lái)執(zhí)行。這兩個(gè) 32 位的讀 / 寫操作可能會(huì)被分配到不同的總線事務(wù)中執(zhí)行,此時(shí)對(duì)這個(gè) 64 位變量的讀 / 寫將不具有原子性。ZCT28資訊網(wǎng)——每日最新資訊28at.com

當(dāng)單個(gè)內(nèi)存操作不具有原子性,將可能會(huì)產(chǎn)生意想不到后果。請(qǐng)看下面示意圖:ZCT28資訊網(wǎng)——每日最新資訊28at.com

圖片圖片ZCT28資訊網(wǎng)——每日最新資訊28at.com

如上圖所示,假設(shè)處理器 A 寫一個(gè) long 型變量,同時(shí)處理器 B 要讀這個(gè) long 型變量。處理器 A 中 64 位的寫操作被拆分為兩個(gè) 32 位的寫操作,且這兩個(gè) 32 位的寫操作被分配到不同的寫事務(wù)中執(zhí)行。同時(shí)處理器 B 中 64 位的讀操作被拆分為兩個(gè) 32 位的讀操作,且這兩個(gè) 32 位的讀操作被分配到同一個(gè)的讀事務(wù)中執(zhí)行。當(dāng)處理器 A 和 B 按上圖的時(shí)序來(lái)執(zhí)行時(shí),處理器 B 將看到僅僅被處理器 A“寫了一半“的無(wú)效值。ZCT28資訊網(wǎng)——每日最新資訊28at.com

總結(jié)

處理器內(nèi)存模型

順序一致性內(nèi)存模型是一個(gè)理論參考模型,JMM 和處理器內(nèi)存模型在設(shè)計(jì)時(shí)通常會(huì)把順序一致性內(nèi)存模型作為參照。JMM 和處理器內(nèi)存模型在設(shè)計(jì)時(shí)會(huì)對(duì)順序一致性模型做一些放松,因?yàn)槿绻耆凑枕樞蛞恢滦阅P蛠?lái)實(shí)現(xiàn)處理器和 JMM,那么很多的處理器和編譯器優(yōu)化都要被禁止,這對(duì)執(zhí)行性能將會(huì)有很大的影響。ZCT28資訊網(wǎng)——每日最新資訊28at.com

根據(jù)對(duì)不同類型讀 / 寫操作組合的執(zhí)行順序的放松,可以把常見(jiàn)處理器的內(nèi)存模型劃分為下面幾種類型:ZCT28資訊網(wǎng)——每日最新資訊28at.com

  • 放松程序中寫 - 讀操作的順序,由此產(chǎn)生了 total store ordering 內(nèi)存模型(簡(jiǎn)稱為 TSO)。
  • 在前面 1 的基礎(chǔ)上,繼續(xù)放松程序中寫 - 寫操作的順序,由此產(chǎn)生了 partial store order 內(nèi)存模型(簡(jiǎn)稱為 PSO)。
  • 在前面 1 和 2 的基礎(chǔ)上,繼續(xù)放松程序中讀 - 寫和讀 - 讀操作的順序,由此產(chǎn)生了 relaxed memory order 內(nèi)存模型(簡(jiǎn)稱為 RMO)和 PowerPC 內(nèi)存模型。

注意,這里處理器對(duì)讀 / 寫操作的放松,是以兩個(gè)操作之間不存在數(shù)據(jù)依賴性為前提的(因?yàn)樘幚砥饕袷?as-if-serial 語(yǔ)義,處理器不會(huì)對(duì)存在數(shù)據(jù)依賴性的兩個(gè)內(nèi)存操作做重排序)。ZCT28資訊網(wǎng)——每日最新資訊28at.com

下面的表格展示了常見(jiàn)處理器內(nèi)存模型的細(xì)節(jié)特征:ZCT28資訊網(wǎng)——每日最新資訊28at.com

內(nèi)存模型名稱ZCT28資訊網(wǎng)——每日最新資訊28at.com

對(duì)應(yīng)的處理器ZCT28資訊網(wǎng)——每日最新資訊28at.com

Store-Load 重排序ZCT28資訊網(wǎng)——每日最新資訊28at.com

Store-Store 重排序ZCT28資訊網(wǎng)——每日最新資訊28at.com

Load-Load 和 Load-Store 重排序ZCT28資訊網(wǎng)——每日最新資訊28at.com

可以更早讀取到其它處理器的寫ZCT28資訊網(wǎng)——每日最新資訊28at.com

可以更早讀取到當(dāng)前處理器的寫ZCT28資訊網(wǎng)——每日最新資訊28at.com

TSOZCT28資訊網(wǎng)——每日最新資訊28at.com

sparc-TSO X64ZCT28資訊網(wǎng)——每日最新資訊28at.com

YZCT28資訊網(wǎng)——每日最新資訊28at.com


ZCT28資訊網(wǎng)——每日最新資訊28at.com


ZCT28資訊網(wǎng)——每日最新資訊28at.com


ZCT28資訊網(wǎng)——每日最新資訊28at.com

YZCT28資訊網(wǎng)——每日最新資訊28at.com

PSOZCT28資訊網(wǎng)——每日最新資訊28at.com

sparc-PSOZCT28資訊網(wǎng)——每日最新資訊28at.com

YZCT28資訊網(wǎng)——每日最新資訊28at.com

YZCT28資訊網(wǎng)——每日最新資訊28at.com


ZCT28資訊網(wǎng)——每日最新資訊28at.com


ZCT28資訊網(wǎng)——每日最新資訊28at.com

YZCT28資訊網(wǎng)——每日最新資訊28at.com

RMOZCT28資訊網(wǎng)——每日最新資訊28at.com

ia64ZCT28資訊網(wǎng)——每日最新資訊28at.com

YZCT28資訊網(wǎng)——每日最新資訊28at.com

YZCT28資訊網(wǎng)——每日最新資訊28at.com

YZCT28資訊網(wǎng)——每日最新資訊28at.com


ZCT28資訊網(wǎng)——每日最新資訊28at.com

YZCT28資訊網(wǎng)——每日最新資訊28at.com

PowerPCZCT28資訊網(wǎng)——每日最新資訊28at.com

PowerPCZCT28資訊網(wǎng)——每日最新資訊28at.com

YZCT28資訊網(wǎng)——每日最新資訊28at.com

YZCT28資訊網(wǎng)——每日最新資訊28at.com

YZCT28資訊網(wǎng)——每日最新資訊28at.com

YZCT28資訊網(wǎng)——每日最新資訊28at.com

YZCT28資訊網(wǎng)——每日最新資訊28at.com

在這個(gè)表格中,我們可以看到所有處理器內(nèi)存模型都允許寫 - 讀重排序,原因在第一章以說(shuō)明過(guò):它們都使用了寫緩存區(qū),寫緩存區(qū)可能導(dǎo)致寫 - 讀操作重排序。同時(shí),我們可以看到這些處理器內(nèi)存模型都允許更早讀到當(dāng)前處理器的寫,原因同樣是因?yàn)閷懢彺鎱^(qū):由于寫緩存區(qū)僅對(duì)當(dāng)前處理器可見(jiàn),這個(gè)特性導(dǎo)致當(dāng)前處理器可以比其他處理器先看到臨時(shí)保存在自己的寫緩存區(qū)中的寫。ZCT28資訊網(wǎng)——每日最新資訊28at.com

上面表格中的各種處理器內(nèi)存模型,從上到下,模型由強(qiáng)變?nèi)酢T绞亲非笮阅艿奶幚砥鳎瑑?nèi)存模型設(shè)計(jì)的會(huì)越弱。因?yàn)檫@些處理器希望內(nèi)存模型對(duì)它們的束縛越少越好,這樣它們就可以做盡可能多的優(yōu)化來(lái)提高性能。ZCT28資訊網(wǎng)——每日最新資訊28at.com

由于常見(jiàn)的處理器內(nèi)存模型比 JMM 要弱,java 編譯器在生成字節(jié)碼時(shí),會(huì)在執(zhí)行指令序列的適當(dāng)位置插入內(nèi)存屏障來(lái)限制處理器的重排序。同時(shí),由于各種處理器內(nèi)存模型的強(qiáng)弱并不相同,為了在不同的處理器平臺(tái)向程序員展示一個(gè)一致的內(nèi)存模型,JMM 在不同的處理器中需要插入的內(nèi)存屏障的數(shù)量和種類也不相同。下圖展示了 JMM 在不同處理器內(nèi)存模型中需要插入的內(nèi)存屏障的示意圖:ZCT28資訊網(wǎng)——每日最新資訊28at.com

圖片圖片ZCT28資訊網(wǎng)——每日最新資訊28at.com

如上圖所示,JMM 屏蔽了不同處理器內(nèi)存模型的差異,它在不同的處理器平臺(tái)之上為 java 程序員呈現(xiàn)了一個(gè)一致的內(nèi)存模型。ZCT28資訊網(wǎng)——每日最新資訊28at.com

JMM,處理器內(nèi)存模型與順序一致性內(nèi)存模型之間的關(guān)系

JMM 是一個(gè)語(yǔ)言級(jí)的內(nèi)存模型,處理器內(nèi)存模型是硬件級(jí)的內(nèi)存模型,順序一致性內(nèi)存模型是一個(gè)理論參考模型。下面是語(yǔ)言內(nèi)存模型,處理器內(nèi)存模型和順序一致性內(nèi)存模型的強(qiáng)弱對(duì)比示意圖:ZCT28資訊網(wǎng)——每日最新資訊28at.com

圖片圖片ZCT28資訊網(wǎng)——每日最新資訊28at.com

從上圖我們可以看出:常見(jiàn)的 4 種處理器內(nèi)存模型比常用的 3 中語(yǔ)言內(nèi)存模型要弱,處理器內(nèi)存模型和語(yǔ)言內(nèi)存模型都比順序一致性內(nèi)存模型要弱。同處理器內(nèi)存模型一樣,越是追求執(zhí)行性能的語(yǔ)言,內(nèi)存模型設(shè)計(jì)的會(huì)越弱。ZCT28資訊網(wǎng)——每日最新資訊28at.com

JMM 的設(shè)計(jì)

從 JMM 設(shè)計(jì)者的角度來(lái)說(shuō),在設(shè)計(jì) JMM 時(shí),需要考慮兩個(gè)關(guān)鍵因素:ZCT28資訊網(wǎng)——每日最新資訊28at.com

  • 程序員對(duì)內(nèi)存模型的使用。程序員希望內(nèi)存模型易于理解,易于編程。程序員希望基于一個(gè)強(qiáng)內(nèi)存模型來(lái)編寫代碼。
  • 編譯器和處理器對(duì)內(nèi)存模型的實(shí)現(xiàn)。編譯器和處理器希望內(nèi)存模型對(duì)它們的束縛越少越好,這樣它們就可以做盡可能多的優(yōu)化來(lái)提高性能。編譯器和處理器希望實(shí)現(xiàn)一個(gè)弱內(nèi)存模型。

由于這兩個(gè)因素互相矛盾,所以 JSR-133 專家組在設(shè)計(jì) JMM 時(shí)的核心目標(biāo)就是找到一個(gè)好的平衡點(diǎn):一方面要為程序員提供足夠強(qiáng)的內(nèi)存可見(jiàn)性保證;另一方面,對(duì)編譯器和處理器的限制要盡可能的放松。下面讓我們看看 JSR-133 是如何實(shí)現(xiàn)這一目標(biāo)的。ZCT28資訊網(wǎng)——每日最新資訊28at.com

為了具體說(shuō)明,請(qǐng)看前面提到過(guò)的計(jì)算圓面積的示例代碼:ZCT28資訊網(wǎng)——每日最新資訊28at.com

double pi  = 3.14;    //Adouble r   = 1.0;     //Bdouble area = pi * r * r; //C

上面計(jì)算圓的面積的示例代碼存在三個(gè) happens- before 關(guān)系:ZCT28資訊網(wǎng)——每日最新資訊28at.com

  • A happens- before B;
  • B happens- before C;
  • A happens- before C;

由于 A happens- before B,happens- before 的定義會(huì)要求:A 操作執(zhí)行的結(jié)果要對(duì) B 可見(jiàn),且 A 操作的執(zhí)行順序排在 B 操作之前。但是從程序語(yǔ)義的角度來(lái)說(shuō),對(duì) A 和 B 做重排序即不會(huì)改變程序的執(zhí)行結(jié)果,也還能提高程序的執(zhí)行性能(允許這種重排序減少了對(duì)編譯器和處理器優(yōu)化的束縛)。也就是說(shuō),上面這 3 個(gè) happens- before 關(guān)系中,雖然 2 和 3 是必需要的,但 1 是不必要的。因此,JMM 把 happens- before 要求禁止的重排序分為了下面兩類:ZCT28資訊網(wǎng)——每日最新資訊28at.com

  • 會(huì)改變程序執(zhí)行結(jié)果的重排序。
  • 不會(huì)改變程序執(zhí)行結(jié)果的重排序。

JMM 對(duì)這兩種不同性質(zhì)的重排序,采取了不同的策略:ZCT28資訊網(wǎng)——每日最新資訊28at.com

  • 對(duì)于會(huì)改變程序執(zhí)行結(jié)果的重排序,JMM 要求編譯器和處理器必須禁止這種重排序。
  • 對(duì)于不會(huì)改變程序執(zhí)行結(jié)果的重排序,JMM 對(duì)編譯器和處理器不作要求(JMM 允許這種重排序)。

下面是 JMM 的設(shè)計(jì)示意圖:ZCT28資訊網(wǎng)——每日最新資訊28at.com

圖片圖片ZCT28資訊網(wǎng)——每日最新資訊28at.com

從上圖可以看出兩點(diǎn):ZCT28資訊網(wǎng)——每日最新資訊28at.com

  • JMM 向程序員提供的 happens- before 規(guī)則能滿足程序員的需求。JMM 的 happens- before 規(guī)則不但簡(jiǎn)單易懂,而且也向程序員提供了足夠強(qiáng)的內(nèi)存可見(jiàn)性保證(有些內(nèi)存可見(jiàn)性保證其實(shí)并不一定真實(shí)存在,比如上面的 A happens- before B)。
  • JMM 對(duì)編譯器和處理器的束縛已經(jīng)盡可能的少。從上面的分析我們可以看出,JMM 其實(shí)是在遵循一個(gè)基本原則:只要不改變程序的執(zhí)行結(jié)果(指的是單線程程序和正確同步的多線程程序),編譯器和處理器怎么優(yōu)化都行。比如,如果編譯器經(jīng)過(guò)細(xì)致的分析后,認(rèn)定一個(gè)鎖只會(huì)被單個(gè)線程訪問(wèn),那么這個(gè)鎖可以被消除。再比如,如果編譯器經(jīng)過(guò)細(xì)致的分析后,認(rèn)定一個(gè) volatile 變量?jī)H僅只會(huì)被單個(gè)線程訪問(wèn),那么編譯器可以把這個(gè) volatile 變量當(dāng)作一個(gè)普通變量來(lái)對(duì)待。這些優(yōu)化既不會(huì)改變程序的執(zhí)行結(jié)果,又能提高程序的執(zhí)行效率。

JMM 的內(nèi)存可見(jiàn)性保證

Java 程序的內(nèi)存可見(jiàn)性保證按程序類型可以分為下列三類:ZCT28資訊網(wǎng)——每日最新資訊28at.com

  • 單線程程序。單線程程序不會(huì)出現(xiàn)內(nèi)存可見(jiàn)性問(wèn)題。編譯器,runtime 和處理器會(huì)共同確保單線程程序的執(zhí)行結(jié)果與該程序在順序一致性模型中的執(zhí)行結(jié)果相同。
  • 正確同步的多線程程序。正確同步的多線程程序的執(zhí)行將具有順序一致性(程序的執(zhí)行結(jié)果與該程序在順序一致性內(nèi)存模型中的執(zhí)行結(jié)果相同)。這是 JMM 關(guān)注的重點(diǎn),JMM 通過(guò)限制編譯器和處理器的重排序來(lái)為程序員提供內(nèi)存可見(jiàn)性保證。
  • 未同步 / 未正確同步的多線程程序。JMM 為它們提供了最小安全性保障:線程執(zhí)行時(shí)讀取到的值,要么是之前某個(gè)線程寫入的值,要么是默認(rèn)值(0,null,false)。

下圖展示了這三類程序在 JMM 中與在順序一致性內(nèi)存模型中的執(zhí)行結(jié)果的異同:ZCT28資訊網(wǎng)——每日最新資訊28at.com

圖片圖片ZCT28資訊網(wǎng)——每日最新資訊28at.com

只要多線程程序是正確同步的,JMM 保證該程序在任意的處理器平臺(tái)上的執(zhí)行結(jié)果,與該程序在順序一致性內(nèi)存模型中的執(zhí)行結(jié)果一致。ZCT28資訊網(wǎng)——每日最新資訊28at.com

JSR-133 對(duì)舊內(nèi)存模型的修補(bǔ)

JSR-133 對(duì) JDK5 之前的舊內(nèi)存模型的修補(bǔ)主要有兩個(gè):ZCT28資訊網(wǎng)——每日最新資訊28at.com

  • 增強(qiáng) volatile 的內(nèi)存語(yǔ)義。舊內(nèi)存模型允許 volatile 變量與普通變量重排序。JSR-133 嚴(yán)格限制 volatile 變量與普通變量的重排序,使 volatile 的寫 - 讀和鎖的釋放 - 獲取具有相同的內(nèi)存語(yǔ)義。
  • 增強(qiáng) final 的內(nèi)存語(yǔ)義。在舊內(nèi)存模型中,多次讀取同一個(gè) final 變量的值可能會(huì)不相同。為此,JSR-133 為 final 增加了兩個(gè)重排序規(guī)則。現(xiàn)在,final 具有了初始化安全性。

本文鏈接:http://www.www897cc.com/showinfo-26-59660-0.html一文搞懂什么是JMM重排序、內(nèi)存屏障、順序一致性

聲明:本網(wǎng)頁(yè)內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問(wèn)題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com

上一篇: 記錄一下Python不同數(shù)據(jù)對(duì)象的空值校驗(yàn)!

下一篇: 高并發(fā)扣款,如何保證結(jié)果一致性

標(biāo)簽:
  • 熱門焦點(diǎn)
Top 主站蜘蛛池模板: 娄烦县| 沧州市| 平利县| 彰化县| 永昌县| 孝昌县| 宁强县| 金塔县| 仁怀市| 闽清县| 渝中区| 永新县| 克拉玛依市| 渝北区| 阿克陶县| 许昌县| 镇安县| 鸡西市| 万州区| 广西| 苏尼特右旗| 平顶山市| 德庆县| 西和县| 毕节市| 南和县| 达拉特旗| 东阿县| 芜湖市| 乌兰察布市| 乐昌市| 漳州市| 长汀县| 台北县| 澄迈县| 明水县| 白河县| 柏乡县| 博罗县| 固原市| 义乌市|