專利名稱:利用同步開銷以改善多線程性能的機制的制作方法
技術領域:
本發(fā)明涉及處理指令序列等的處理設備和系統(tǒng)的領域以及編程該設備和/或系統(tǒng)的特定指令序列。一些實施例涉及監(jiān)視和/或響應這種處理設備中執(zhí)行資源內(nèi)的條件或事件。
背景技術:
目前使用各種機制改變處理系統(tǒng)內(nèi)的控制流(即所遵循的處理路徑或指令序列)。例如,程序序列內(nèi)的跳轉指令清楚明確地導致跳轉到新地址。該跳轉指令為控制流的明確變化的一個示例,因為該指令引導處理器跳轉到一個位置并在該點繼續(xù)執(zhí)行。傳統(tǒng)的跳轉指令是“精確的”(或同步),這是因為發(fā)生該跳轉是執(zhí)行跳轉指令的直接結果。控制流改變的另一個傳統(tǒng)示例為中斷。中斷可以是向諸如處理器的設備提供的外 部信號。處理器的響應為跳轉到中斷處理程序(handler),該處理程序為處理特殊中斷發(fā)送的事件的程序。中斷通常也是相對精確的,這是因為是由處理器在接收到該中斷后在特定的時間窗口內(nèi)對其進行識別并產(chǎn)生響應。特別地,在內(nèi)部接收到中斷之后,該中斷通常在下一個指令邊界才起作用。在一些情形中,只允許操作系統(tǒng)或工作于高優(yōu)先級別的其它軟件屏蔽中斷,因此用戶程序沒有機會啟動或者禁止這些控制流改變事件??刂屏鞲淖兊牧硪粋€傳統(tǒng)示例出現(xiàn)于對異常的響應。異常通常反映預定義的架構條件,該條件為例如數(shù)學指令滿足特定標準(非正規(guī)、下溢、溢出、非數(shù)字等)的結果。例如通過設置控制寄存器中的位,可以屏蔽一些異常。如果出現(xiàn)異常且未被屏蔽,則調用異常處理程序以處理該異常。改變處理器的控制流的另一個技術為使用斷點。通常在調試時使用斷點。可將特定的指令地址編程到斷點寄存器。在斷點啟動且到達目標地址時,該處理器采取各種措施(而不是照常繼續(xù)該程序)。斷點允許單步執(zhí)行程序等。多線程是一種通過多個不同的線程使用處理器硬件的技術。多線程處理器可由于各種原因而在各線程之間切換。例如,處理器具有在可用線程之間自動切換的算法。其它處理器使用基于事件切換的多線程(SoEMT),由此諸如緩存缺失的特定事件會引起線程切換。線程切換可以被看作是一種控制流改變,這是因為處理器切換其所執(zhí)行的指令序列或指令流。在一個現(xiàn)有技術參考中,詳細描述了一種靜止指令(見美國專利號No. 6,493,741)。在一個示例中,靜止指令停止一個線程內(nèi)的進程,直到計時器到期或者出現(xiàn)向存儲器位置進行存儲器寫入為止。因此,諸如靜止指令的指令本身可觸發(fā)包括該靜止指令的線程的進程暫時停止并切換到另一個線程。
在所附各圖中以示例的方式而非限制的方式闡述本發(fā)明。圖I闡述了可以檢測和響應執(zhí)行資源(execution resource)的處理條件的系統(tǒng)的實施例。圖2闡述了圖I的系統(tǒng)的一個實施例的工作流程圖。圖3闡述了圖I的系統(tǒng)的另一個實施例的工作流程圖。圖4闡述了能夠響應多個不同性能事件(performance event)和/或復合性能事件的系統(tǒng)的另一個實施例。圖5a闡述了可識別復合事件的監(jiān)視器的一個實施例。圖5b闡述了監(jiān)視器的另一個實施例。圖5c闡述了監(jiān)視器的另一個實施例。圖6闡述了根據(jù)一個實施例的,響應程序可定義的觸發(fā)器而啟動輔助線程 (helper thread)的用于用戶程序執(zhí)行的流程圖。圖7闡述了根據(jù)一個實施例的細化監(jiān)視器設置的過程的流程圖。圖8闡述了根據(jù)一個實施例的更新軟件的過程的流程圖。圖9a闡述了啟動多個嵌套的輔助線程以輔助處理程序的流程圖。圖9b闡述了支持虛擬線程的一個實施例的線程切換邏輯。圖IOa闡述了上下文相關的事件圖解矢量和屏蔽(mask)實現(xiàn)的一個實施例。圖IOb闡述了上下文相關的事件圖解矢量和屏蔽實現(xiàn)的一個實施例。圖11闡述了基于監(jiān)視器事件而執(zhí)行線程切換的多線程處理器的一個實施例。圖12闡述了對同步對象具有事件檢測和處理能力的系統(tǒng)的一個實施例。圖13闡述了根據(jù)多個實施例的同步事件處理的流程圖。圖14闡述了基于事件處理程序線程的鎖剖析(lock profiling)的線程調度改進的流程圖。
具體實施例方式下述闡述了可啟動其它線程的可編程事件驅動的放棄(yield)機制的實施例。在下述描述中,列出了諸如處理器類型、微架構條件、事件、啟動機制等的許多具體細節(jié),其目的是提供對本發(fā)明的更徹底的了解。然而,本領域技術人員將會了解到,不使用這些具體細節(jié)也可以實施本發(fā)明。此外,并未詳細示出一些眾所周知的結構,電路等,目的是避免不必要地使本發(fā)明變得不明確。在一些實施例中,所公開的技術允許在執(zhí)行程序時,該程序能夠積極地監(jiān)視并響應執(zhí)行該程序的執(zhí)行資源的條件。事實上,這些實施例可包括實時的執(zhí)行資源工作條件反饋以改善性能。如果執(zhí)行資源遇到執(zhí)行延遲條件,可中斷該程序執(zhí)行以做調整。在一些實施例中,可啟動一處理程序,該處理程序可產(chǎn)生輔助線程以試圖改善原始線程的執(zhí)行。在其它實施例中,可通過切換到非輔助線程的另一個程序線程而實現(xiàn)中斷。這些及其它實施例在某些情況下可有利地改善處理能力和/或優(yōu)化以適于特殊硬件。參考圖1,描述可以檢測并響應執(zhí)行資源的處理條件的系統(tǒng)的一個實施例。在圖I的實施例中,執(zhí)行資源105、監(jiān)視器110、和啟動邏輯120形成能夠執(zhí)行指令的處理器100的一部分。在某些實施例中該執(zhí)行資源包括可集成到單個元件或集成電路的硬件資源。然而,執(zhí)行資源可包括軟件或固件資源或者硬件及軟件和/或可用于執(zhí)行程序指令的固件的任意組合。例如,固件可用作提取層的一部分或者可為處理硬件增加功能,軟件亦可如此。軟件還可以用于仿真指令集的一部分或全部,或者以其它方式輔助處理。該處理器為可執(zhí)行指令的任何不同類型的處理器。例如,該處理器可以是通用處理器,例如Pentium 處理器家族或Itanium 處理器家族或來自Intel公司的其它處理器家族中的一種處理器,或者是來自其它公司的處理器。因此,該處理器可以是精簡指令集計算(RISC)處理器、復雜指令集計算(CISC)處理器、超長指令字(VLIW)處理器、或者任何混合或備選處理器類型。此外,例如網(wǎng)絡或通信處理器、協(xié)同處理器、嵌入處理器、壓縮引擎、圖像處理器等的專用處理器可以使用這里公開的技術。由于集成的趨勢仍在繼續(xù)且處理器變得更加復雜,對內(nèi)部性能指示器進行監(jiān)視并作出反應的必要性進一步增大,因此使得更加需要目前所公開的技術。然而,由于該技術領域內(nèi)的技術進展快速,難以預見所公 開的技術的所有應用,盡管其可以廣泛應用于可執(zhí)行程序序列的復雜硬件。如圖I所示,處理器100耦合到諸如存儲器的存儲介質150。存儲介質150可以為具有各種層次水平的存儲器子系統(tǒng),其包括但不限于各種水平的緩沖存儲器、諸如動態(tài)隨機訪問存儲器等的系統(tǒng)存儲器、以及諸如閃存(例如存儲棒等)、磁盤或光盤的非易失性存儲器。如圖所示,該存儲介質存儲程序160以及處理程序和/或諸如輔助線程170的其它線程。為了允許監(jiān)視器監(jiān)視預期事件,監(jiān)視器110可耦合到執(zhí)行資源的各個部分以檢測具體條件或者被告知特定的微架構事件。信號線可連接到監(jiān)視器110,或者該監(jiān)視器可以策略性地和相關資源放置或集成在一起。該監(jiān)視器可包括各種可編程邏輯或軟件或固件元件或者可以定制設計成檢測具體條件。該監(jiān)視器追蹤各種事件或條件,且如果出現(xiàn)該監(jiān)視器應檢測的事件或條件,則向執(zhí)行資源105發(fā)出信號以中斷正常的控制流,否則程序將按該正??刂屏鲌?zhí)行。如圖I所示,該中斷會導致調用事件處理程序或出現(xiàn)線程切換。特殊可檢測條件的一個示例為緩沖存儲器中的數(shù)據(jù)缺失,該數(shù)據(jù)缺失會導致出現(xiàn)緩存缺失。實際上,程序可以產(chǎn)生一種存儲器訪問方式,該方式會導致重復的緩存缺失,由此降低性能。在某一時間段內(nèi)或者在某部分代碼執(zhí)行期間出現(xiàn)特定數(shù)目的緩存缺失,這就是表示執(zhí)行該部分代碼時進展相對較慢的事件的一個示例??赡転檫M展緩慢指示器的其它可檢測事件涉及執(zhí)行資源的各種其它微架構或結構細節(jié)。監(jiān)視器可檢測涉及下述一種或多種的條件資源停止、緩存事件、報廢事件、分支或分支預計結果、異常、總線事件、或者通常受到監(jiān)視的或影響性能的各種其它事件或條件。該監(jiān)視器會計算這些事件或條件,或者對這些事件或條件計時、定量、或表征,且當出現(xiàn)和一個或多個事件或條件相關的特殊公制(metric)時可對該監(jiān)視器編程。圖2闡述了圖I的系統(tǒng)的一個實施例的工作流程圖。如圖2的區(qū)塊200所示,程序160可設置條件從而引發(fā)執(zhí)行控制流的變化。例如,啟動邏輯120可同時控制監(jiān)視器的啟動以及監(jiān)視器將要檢測的(多個)事件。備選地,啟動邏輯120可啟動和/或屏蔽各事件,監(jiān)視器110本身也是可編程的,從而在規(guī)定被追蹤的執(zhí)行資源或系統(tǒng)內(nèi)的事件或條件方面具有更大的靈活動。在任一情況下,程序160本身會規(guī)定在其自身執(zhí)行時待觀察的條件。程序160還提供在受監(jiān)視的條件出現(xiàn)時被啟動的處理程序或線程170。例如,該程序可以是這樣的程序,即,包括主線程和輔助線程或者在程序所指定的條件出現(xiàn)時試圖改善主線程的執(zhí)行的輔助例行程序(helper routine)。如區(qū)塊205所示,執(zhí)行該程序指令。該程序的執(zhí)行導致執(zhí)行資源的狀態(tài)改變。例如,在執(zhí)行該程序時會發(fā)生或者出現(xiàn)抑制向前進展的各種條件。如區(qū)塊210所示,監(jiān)視各種處理公制和/或微架構條件以確定是否出現(xiàn)區(qū)塊200中編程的觸發(fā)事件。如果在區(qū)塊210內(nèi)不出現(xiàn)觸發(fā)狀態(tài),則不觸發(fā)該監(jiān)視器且通過返回到區(qū)塊205而繼續(xù)程序的執(zhí)行。在一些情況中,該觸發(fā)狀態(tài)只表示和任一單個指令的執(zhí)行的間接關系。例如,在現(xiàn)有技術中,當指令指針到達設計地址時,斷點檢測器通常產(chǎn)生暫停。該斷點是精確的,這是因為特殊指令(例如其地址)直接觸發(fā)該暫停。同樣地,現(xiàn)有技術靜止指令本身導致線程至少暫時停止。相反,使用這里所公開的技術的一些實施例觸發(fā)一系列條件的控制流改變,不一定要由單個指令引發(fā)該改變,而是可由整個程序流和/或系統(tǒng)環(huán)境引發(fā)該改變。因此,盡管可在單個系統(tǒng)內(nèi)的同一個指令執(zhí)行狀態(tài)重復地觸發(fā)該監(jiān)視器,但其它條件、環(huán)境、系統(tǒng)等可引發(fā)相同程序的不同觸發(fā)點。就此而言,這里所公開的技術在某些情形下提供了產(chǎn)生控制流改變的不精確或不同步的機制,該機制并未和指令執(zhí)行邊界直接相關。此外,在某些實施例中,該不精確的機制會以小于各個指令的小顆粒狀(fine granularity)測試各個事 件,和/或對事件的識別會延遲一段時間,這是因為架構正確性并不取決于在任何具體時間點執(zhí)行的任何提高處理速率的輔助例行程序。當在區(qū)塊210中監(jiān)視器檢測到觸發(fā)狀態(tài)時,程序的處理被中斷,如區(qū)塊215所示。通常,該系統(tǒng)會相應地調整,這是因為該程序的處理效率比較低或者處理的方式不同于編程人員所預期的方式。例如,可以調用諸如另一個程序部分的另一個軟件例行程序。該其它的程序部分可以是和原始線程無關的另一個線程,或者可以是來自原始線程的輔助處理指令的輔助線程,例如通過預取出數(shù)據(jù)以減小緩存缺失。備選地,程序透明(例如硬件)機制可執(zhí)行一些優(yōu)化、重新配置(包括但不限于監(jiān)視器設置的重新配置)、資源的重新分配等,從而有希望改善處理。圖3闡述了調用輔助線程的一個示例。特別地,圖3的流程圖詳細描述了圖I系統(tǒng)的一個實施例的工作,其中執(zhí)行資源為多線程資源,且當出現(xiàn)特定觸發(fā)條件時該程序調用輔助線程。因此,如區(qū)塊300所示,第一線程(例如主程序)設置監(jiān)視器條件。該條件可以是這里所討論的各種條件中的一種或多種。第一線程執(zhí)行一代碼部分,如區(qū)塊310所示。如果在區(qū)塊320中測試確定未出現(xiàn)觸發(fā)條件,則繼續(xù)執(zhí)行該代碼部分,如區(qū)塊310所示。如果該觸發(fā)條件確實發(fā)生,則啟動輔助線程以輔助第一線程,如區(qū)塊330所示。可由諸如處理程序的例行程序啟動該輔助線程,或者只由線程開關啟動該輔助線程。例如,在一個實施例中,監(jiān)視器發(fā)送給執(zhí)行資源的觸發(fā)條件會導致執(zhí)行資源跳到產(chǎn)生輔助線程的事件處理程序。在另一個實施例中,該輔助線程只是其它活動線程之一。在又一個實施例中,可由處理器提供一個或者多個特殊的輔助線程執(zhí)行存儲槽(slot),該監(jiān)視器會導致切換到來自這些存儲槽之一的輔助線程。如區(qū)塊340所示,兩個線程均繼續(xù)執(zhí)行。如果順利的話,該輔助線程向前運行并清除會導致第一線程停止或低效運行的條件。圖4闡述了能夠響應多個不同性能事件和/或復合性能事件的系統(tǒng)的另一個實施例。在圖4的實施例中,執(zhí)行資源400被示成包括一組N個監(jiān)視器410-1至410-N。此外,提供了事件圖解矢量(ESV)存儲位置420和事件圖解矢量屏蔽(ESVM)存儲位置425。圖4的實施例示出了多個監(jiān)視器,其數(shù)目(N)對應于事件圖解矢量和事件圖解屏蔽矢量中的位數(shù)。在其它實施例中,監(jiān)視器的數(shù)目可能不同于這些矢量的數(shù)目,監(jiān)視器可以和該位數(shù)直接關聯(lián)或者沒有直接關聯(lián)。例如,在一些實施例中,涉及多個監(jiān)視器的條件和單個矢量位相關聯(lián)。執(zhí)行資源400可選地耦合到事件描述符表430 (EDT),可在該處理器上或者在協(xié)同處理器或系統(tǒng)存儲器內(nèi)局部地實現(xiàn)該事件描述符表??刂屏鬟壿?35耦合到監(jiān)視器410-1至410-N,并接收來自事件圖解矢量和事件圖解矢量屏蔽的值。當根據(jù)該事件圖解矢量和事件圖解矢量屏蔽來啟動一個或多個監(jiān)視器檢測到的條件時,控制流邏輯435改變處理邏輯的控制流。圖4的實施例還闡述了解碼邏輯402和一組機器或模式專用寄存器404 (MSR)。解碼邏輯402和模式專用寄存器之一或者兩者可同時用于編程和/或啟動該監(jiān)視器和事件圖解矢量和屏蔽。例如,MSR可用于編程觸發(fā)監(jiān)視器的事件的類型或數(shù)目。MSR還可用于編程事件圖解矢量和屏蔽。備選地,將被解碼器402解碼的一個或多個新的專用指令可用于編程該監(jiān)視器和事件圖解矢量及屏蔽之一或兩者。例如,當出現(xiàn)特定條件組時,可使用放棄(yield)指令啟動程序處理的中斷。可由運算數(shù)向該放棄指令指定部分或所有這些條件,或者可以在其執(zhí)行之前編程??捎山獯a器402解碼該放棄指令以觸發(fā)微碼例行程序,從而直接向信號專用邏輯產(chǎn)生相應的微操作或微指令或者微操作序列,或者啟動協(xié)同處理器或實 施該放棄功能。在一些實施例中,放棄的概念可以恰當?shù)孛枋鲞@樣的指令,即在執(zhí)行該放棄指令之后可繼續(xù)執(zhí)行某一線程,但由于另一個線程或處理程序的執(zhí)行而在某一點減緩該線程的執(zhí)行。例如大量單線程的程序可以調用額外的輔助線程并和處理器分享這些額外的輔助線程。在圖4的實施例中,存儲器440包括事件處理程序450和主線程460。在一些實施例中,事件描述符表可存儲在和主線程460及處理程序450相同的存儲器內(nèi)或相同的存儲器層次內(nèi)。如前所述,該處理程序可產(chǎn)生輔助線程以幫助有效地執(zhí)行主程序。存儲器440還可存儲更新模塊442以通過通信接口 444進行通信。更新模塊442可以是硬件模塊或者軟件例行程序,由執(zhí)行資源執(zhí)行該軟件例行程序以獲得將被編程到各個監(jiān)視器和/或啟動邏輯的新條件。更新模塊442還可獲得新的輔助線程或例行程序。例如,可使用軟件程序從軟件程序廠家下載這些模塊以提供更佳的性能。因此,網(wǎng)絡接口 444可以是允許通過通信通道傳輸信息的任何網(wǎng)絡和/或通信接口。在一些情形中,該網(wǎng)絡接口可接到因特網(wǎng)以下載新的條件和/或輔助例行程序或線程。在一個實施例中,事件圖解矢量的各位表示出現(xiàn)或不出現(xiàn)特定的事件,該特定事件可能是反映(和/或通過布爾運算進行表述的)各種條件或其它事件的復合事件。特定事件的出現(xiàn)會設置事件圖解矢量中的位。事件圖解矢量中的各位在事件圖解屏蔽矢量中具有相對應的位。如果該屏蔽位表示該特定事件被屏蔽,則控制流邏輯435忽略該事件,盡管由于該事件的出現(xiàn)使事件圖解矢量中的該位保持設定。用戶在不屏蔽事件時可以選擇是否清除該事件圖解矢量。因此,可將某一事件屏蔽一段時間而稍后處理。在一些實施例中,根據(jù)諸如事件更新、采樣、和復位(或ESV內(nèi)觸發(fā)器事件的保持時間)之間關系的各種問題,用戶可以選擇規(guī)定該觸發(fā)器為電平觸發(fā)器或邊沿觸發(fā)器。如果屏蔽位表示某一事件未被屏蔽,則在本實施例中控制流邏輯435調用該特定事件的事件處理程序。控制流邏輯435可基于事件圖解矢量中位的位置而指向事件描述符表430,因此該事件描述符表具有和事件圖解矢量中的N位相對應的N個條目。該事件描述符表可以包括一處理程序地址,該地址指示控制流邏輯435應將執(zhí)行重新定向的地址,該事件描述符表還包括在特定實施例中有用的其它信息。例如,可在該事件描述符表中保持或更新優(yōu)先水平、線程、處理、和/或其它信息。在另一個實施例中,可能不需要事件描述符表430或者其為單個條目,該條目指示單個事件處理程序處理所有事件的地址。在這種情況下,該條目可以存儲在寄存器中或者其它處理器存儲位置中。在一個實施例中,可以使用單個處理程序,且該處理程序可訪問該事件圖解矢量以確定所出現(xiàn)的事件以及該如何響應。在另一個實施例中,該事件圖解矢量可共同地定義引發(fā)控制流邏輯435調用處理程序的事件。換而言之,該事件圖解矢量可代表一起表達一個事件的各種條件。例如,該事件圖解屏蔽矢量可用于指定事件圖解矢量所指示的哪個事件必須發(fā)生以觸發(fā)處理程序的執(zhí)行。各位可代表達到可編程條件的監(jiān)視器。當所有的未屏蔽監(jiān)視器達到其各自的指定條件時,則調用處理程序。因此,整個事件圖解矢量可用于指定將觸發(fā)處理程序執(zhí)行的某些復雜的復合條件。在另一個實施例中,可以使用多個事件圖解矢量和屏蔽來指定不同的條件。這些不同的矢量可通過該事件描述符表或某些其它機制而指向不同的處理程序。在另一個實施 例中,可將一個或多個事件圖解矢量的某些位分組,從而形成觸發(fā)處理程序的調用的事件。各種其它不同的改變對本領域技術人員而言是顯而易見的。圖5a闡述了監(jiān)視器500的一個實施例,該監(jiān)視器是可編程的并能夠和各種性能監(jiān)視器連接以產(chǎn)生復合事件的信號。例如,該性能監(jiān)視器可記錄各種微架構事件或條件的出現(xiàn),例如,在緩存層次的特定水平引起的緩存缺失、分支報廢、分支預計錯誤(或錯誤預計的分支的報廢)、追蹤緩存輸送模式變化或事件、分支預計單元取出請求、存儲器請求的取消、緩存線分裂(完成分裂負載、存儲等的計數(shù))、重放事件、各種類型的總線交換(例如鎖定、瞬時讀寫、回寫、無效)、總線定序器內(nèi)的分配(或僅特定類型)、數(shù)字輔助(下溢、非正規(guī)等)、特定類型的指令或微操作(uOP)的執(zhí)行/報廢、機器清零(或清理流水線)、資源停止(寄存器重命名資源、流水線等)、處理標記的uOP、指令或uOP報廢、緩存內(nèi)線的分配(和/或為特定的狀態(tài)(例如M))、停止取出大量的周期指令、停止大量周期指令長度解碼器、取大量的緩存、分配在緩存內(nèi)(或收回)的大量的線等。只監(jiān)視微架構事件或條件的一些示例。各種其它可能性以及這些或其它條件的組合對本領域技術人員而言是顯而易見的。此外,可以使用在任一公開實施例內(nèi)所公開的任一監(jiān)視器監(jiān)視這些和/或其它條件或者事件。通常在處理器內(nèi)包括性能監(jiān)視器以對特定事件進行計數(shù)。通過制造商定義的接口,例如由知名的Intel處理器支持的RDPMC指令的專用處理器宏指令,編程人員可以讀取該性能監(jiān)視器的讀數(shù)。見 Intel Software Developers Guide for the Pentium 4Processor的卷III的附錄A。在一些實施例中,可以使用其它內(nèi)部或微指令或者微操作讀取性能計數(shù)器。因此,可以將例如性能監(jiān)視器和所公開的技術結合使用。在一些情形中,調整可編程的性能監(jiān)視器以提供產(chǎn)生事件信號的能力。在其它實施例中,可通過其它監(jiān)視器讀取性能監(jiān)視器以建立事件。在圖5a的實施例中,監(jiān)視器500可包括一組可編程條目。各個條目可包括條目號510、啟動域511、用于指定一組性能監(jiān)視器之一的性能監(jiān)視器號(EM0N#)512、以及觸發(fā)條件514。該觸發(fā)條件可以為例如到達特定的計數(shù)、落在特定范圍內(nèi)的計數(shù)、計數(shù)之差等。監(jiān)視器500可包括待讀取的邏輯或者被耦合以接收來自指定的性能監(jiān)視器的計數(shù)。當出現(xiàn)各種M條件時,監(jiān)視器500向控制流邏輯發(fā)出信號。通過選擇性地編程各個條目的啟動域,可以使用該M個條目的子集。圖5b闡述了監(jiān)視器520的另一個實施例。監(jiān)視器520代表定制的復合事件監(jiān)視器。監(jiān)視器520通過信號線528-1至528-X接收來自各種執(zhí)行資源或資源部分的一組信號,并通過組合邏輯530將其組合。如果監(jiān)視器520接收到信號的恰當組合,則該監(jiān)視器通過輸出信號線532向控制流邏輯發(fā)出信號。圖5c闡述了監(jiān)視器540的另一個實施例。監(jiān)視器540包括具有M個條目的表。各個條目包括啟動域552、條件域554、以及觸發(fā)域556。該條件域可被編程為規(guī)定待監(jiān)視的輸入信號的組合。這些條件與諸如性能監(jiān)視器的其它事件檢測結構可以相連或者不相連,因此這些條件比圖5a中討論的那些條件相比更為一般。觸發(fā)域556可規(guī)定需要向控制流邏輯發(fā)送信號的那些輸入信號的狀態(tài)。此外,可以通過啟動域552啟動或禁止各個條目。在一些實施例中,該條件和觸發(fā)域可以組合。這些或其它類型的,已知或者可獲得的,更簡單或者更復雜的監(jiān)視器的各種組合對于本領域技術人員而言是顯而易見的。
圖6闡述了根據(jù)一個實施例的,響應程序可定義的觸發(fā)器而啟動輔助線程的用戶程序執(zhí)行的流程圖。在區(qū)塊600中,程序首先測試是否具備放棄能力?!胺艞壞芰Α痹诖吮挥米骰跅l件或事件發(fā)生而中斷處理的能力的簡寫。備選地,對于放棄能力支撐的測試,該放棄能力可以使用之前定義為不工作的工作碼和/或之前未使用或未定義的MSR,故放棄能力將不會影響沒有該能力的處理器。也可以通過檢查特殊的CPU-ID而查詢是否存在該能力,其中該CPU-ID編碼產(chǎn)生表明特定處理器或者平臺上是否存在該能力的提示。類似地,諸如Itanium的PAL(處理器提取層)調用或SALE(系統(tǒng)提取層環(huán)境)的特殊指令可以用于查詢處理器具體配置信息,該處理器具體配置信息包括這種程序可定義的放棄能力的可用性。假設存在該放棄能力,則用戶程序可以讀取和/或復位各種計數(shù)器,如區(qū)塊610所示。例如,可以讀取性能監(jiān)視器計數(shù)器,使得可計算出增量(delta),或者如果存在該能力則將該值復位。如區(qū)塊620所示,用戶程序隨后設置輔助線程觸發(fā)條件。在低的優(yōu)先級別(例如用戶級別)下可以獲得該放棄能力,使得任何程序或絕大部例行程序可以使用該特征。例如,在Pentium㊣處理器家族等中,第三環(huán)的優(yōu)先水平可以獲得該放棄能力。因此,用戶程序自身能夠設置其自己的基于性能的觸發(fā)條件。如果應用命令或操作系統(tǒng)可以提供持久的監(jiān)視能力,則了解存在這種上下文相關的監(jiān)視器配置的用戶程序或操作系統(tǒng)會選擇越過線程/處理上下文開關而存儲或恢復該應用特定的監(jiān)視器配置/設置。如區(qū)塊630所示,用戶程序在編程該放棄條件之后繼續(xù)執(zhí)行。在區(qū)塊640中測試是否出現(xiàn)放棄條件。如果并未出現(xiàn)放棄條件,則該程序繼續(xù)執(zhí)行,如區(qū)塊630所示。如果出現(xiàn)該放棄條件,則輔助線程被啟動,如區(qū)塊650所示。圖6的流程表趨于暗示出現(xiàn)對各事件的同步輪詢,在一些實施例中可以使用該方法。然而,一些實施例在事件發(fā)生時對事件的響應不同步,或者在事件發(fā)生時的大量時鐘周期內(nèi)對其產(chǎn)生響應,而不是按特定間隔對事件進行輪詢。在一些實施例中,可以在一個循環(huán)或者其它代碼部分之外設置監(jiān)視器條件以檢測特殊條件。通過下述主線程和輔助線程的偽代碼示例演示這個概念。main()
{
CreaicThread(T)
WaitForEventO ii 二 NodeArray
setup Helper Trigger //intrinsic while(n and remaining)
{
work{) n~>i n->next->j + n-^iext->k + n->next->l
n = n->next
remaining-
//Every Stride Tiiuc
// global n == n
// global—r = remaining
// SetEvent()
}
disable Helper Trigger //Instrinsic
}
TO
{
Do Stride times
u->i = n->ncxl--j 十 n->next->k +
n :- n--*nexl
remaining-
權利要求
1.一種設備,包括 能夠同時執(zhí)行多個線程的執(zhí)行資源; 檢測與同步對象相關聯(lián)的緩存缺失事件的事件檢測器硬件邏輯,所述事件檢測器引發(fā)第一線程切換;以及 檢測同步對象為受爭奪的同步對象的旋轉檢測器,所述旋轉檢測器引發(fā)第二線程切換。
2.如權利要求I所述的設備,其中所述旋轉檢測器包括存儲在機器可讀取介質內(nèi)的事件檢測器編程程序,所述事件檢測器編程程序對事件檢測器邏輯進行編程以檢測所述同步對象受爭奪。
3.如權利要求I所述的設備,還包括存儲器,所述存儲器存儲利用所述同步對象的應用和將被第一線程切換啟動的未來鎖模塊,其中所述未來鎖模塊將獲得所述應用的未來鎖。
4.如權利要求3所述的設備,其中所述未來鎖模塊將獲得多個未來鎖,所述設備還包括節(jié)流模塊以防止過量的鎖預取出。
5.如權利要求3所述的設備,其中所述未來鎖模塊將通過預取出數(shù)據(jù)而獲得未來鎖。
6.如權利要求3所述的設備,還包括剖析模塊,以收集關于同步爭奪的剖析數(shù)據(jù)。
7.如權利要求6所述的設備,其中用戶線程調度模塊將所述剖析數(shù)據(jù)用于用戶線程調度。
8.如權利要求I所述的設備,其中所述受爭奪的同步對象是受爭奪的鎖,所述旋轉檢測器將檢測受爭奪的鎖。
9.如權利要求8所述的設備,還包括存儲器,所述存儲器將存儲應用,所述應用包括含有受爭奪的鎖的鎖部分以及模塊,以使用由于在所述鎖部分外部有效的受爭奪的鎖而導致的開銷延遲。
10.如權利要求I所述的設備,還包括存儲器,所述存儲器將存儲同步改進模塊,以向調度器提供重新調度提示,其中所述同步改進模塊將在生產(chǎn)者線程之前檢測調度消費者線程的線程調度低效率并提供提示以在消費者線程之前調度生產(chǎn)者線程。
11.如權利要求I所述的設備,其中所述事件檢測器被編程,以便響應于鎖部分中遇到的緩存缺失而分叉未來鎖輔助線程。
12.—種方法,包括 在第一線程內(nèi)遇到涉及鎖變量的鎖部分; 響應于嘗試取出所述鎖變量時出現(xiàn)的緩存缺失而啟動第一輔助線程來為第一線程取出未來鎖,將至少部分地并行執(zhí)行所述第一輔助線程和其它線程。
13.如權利要求12所述的方法,還包括 檢測所述鎖變量受爭奪; 啟動第二輔助線程以利用鎖同步開銷。
14.如權利要求12所述的方法,其中利用鎖同步開銷包括響應于正受爭奪的鎖變量而執(zhí)行分別同步循環(huán)的疊代。
15.如權利要求13所述的方法,其中啟動第一輔助線程包括分叉第一線程并切換到第一輔助線程,并且其中啟動第二輔助線程包括分叉第二輔助線程并切換到第二輔助線程。
16.如權利要求12所述的方法,其中利用鎖同步開銷包括收集同步剖析信息;基于該同步剖析信息而提供線程調度提示。
全文摘要
可啟動其它線程的、用于可編程事件驅動放棄機制的方法、設備、及程序工具。在一個實施例中,設備包括執(zhí)行多個指令的執(zhí)行資源以及檢測和同步對象相關的長延遲事件的事件檢測器。該事件檢測器可以響應于和該同步對象相關的長延遲事件而引發(fā)第一線程切換。該設備還包括一旋轉檢測器,該檢測器檢測該同步對象是否為受爭奪的同步對象。該旋轉檢測器可響應于檢測到受爭奪的同步對象而引發(fā)第二線程切換,從而啟動旋轉檢測響應。
文檔編號G06F9/44GK102968302SQ201210460430
公開日2013年3月13日 申請日期2006年3月1日 優(yōu)先權日2005年3月2日
發(fā)明者N.英賴特, J.科林斯, P.王, H.王, X.田, J.沈, G.肖弗, P.哈馬倫德 申請人:英特爾公司