專利名稱:不同服務器出現(xiàn)故障時調整服務器配置參數的裝置和方法
技術領域:
本發(fā)明一般地涉及聯(lián)網計算機系統(tǒng),更具體地說,涉及處理聯(lián)網計算 機系統(tǒng)中的服務器故障的裝置和方法。
背景技術:
計算機的廣泛快速增長促進了允許計算機之間相互通信的計算機網絡
的發(fā)展。隨著個人電腦(PC)的引入,計算對于很多人來說變得很容易。
允許計算機之間相互通信的個人電腦網絡快速icA起來。
計算機網絡允許稱為"客戶機"的計算機系統(tǒng)或程序從稱為"服務器" 的其他計算機系統(tǒng)或程序請求信息或服務。不同類型的服務器在本領域中
是公知的。例如,Web服務器將網頁傳送或"提供"給發(fā)出請求的客戶機。 應用服務器托管可由客戶機計算機系統(tǒng)或程序調用的軟件應用。數據庫服 務器傳送數據以響應到數據庫的數據庫請求(或查詢)。要指出的是,"Web 服務器"、"應用服務器"和"數據庫服務器"的這些標記在本領域中用 于描述服務器的特定功能,但是這些功能不是相互排斥的。因此,單個服 務器可以執(zhí)行Web服務器、應用服務器以及數據庫服務器的功能。
通常,服務器需要高可用性,這意味著提供多個服務器,并且一個服 務器出現(xiàn)故障時將導致隨后的故障轉移過程,從而在盡管出現(xiàn)故障的情況 下仍繼續(xù)處理。在此類情況下,通常使用負載平衡器來將工作分配給每個 服務器。當服務器停機時,負栽平衡器檢測到此故障并通過將所有請求路 由到其余未出現(xiàn)故障的服務器來嘗試進行補償。但是,其余服務器可能不 能處理由故障導致的額外工作負載。結果,整個系統(tǒng)速度減慢,可能提供 太慢而不能滿足指定目標的性能或太慢而不能提供足夠客戶響應的性能。 在沒有一種方式來允許服務器計算機系統(tǒng)更好地補償服務器之一的故障
時,當服務器出現(xiàn)故障時,計算機行業(yè)將繼續(xù)遭受降低的和可能不可接受 的性能。
發(fā)明內容
本發(fā)明提供了一種服務器計算機系統(tǒng)。優(yōu)選地,負載平衡器檢測服務 器故障,并且將故障通知信息發(fā)送給其余的服務器。作為響應, 一個或多 個所述剩余服務器可以自主地調整它們的配置參數,由此允許所述剩余月良 務器更好地處理因所述服務器故障而帶來的增加的負載。 一個或多個所述 服務器還可以包括性能測量裝置,該性能測量裝置在自主調整所述配置參 數之前和之后測量性能,以確定所述自主調整是否提高了系統(tǒng)性能和提高 了多少系統(tǒng)性能。以這種方式,服務器計算機系統(tǒng)可以自主地補償分擔工 作負栽的其他服務器計算機系統(tǒng)的故障。
如附圖中示出的,從本發(fā)明的優(yōu)選實施例的以下更詳細描述中,本發(fā) 明的上述和其他特征和優(yōu)點將是顯而易見的。
以下將結合
本發(fā)明的優(yōu)選實施例,其中相同的標號表示相同
的元素,這些附圖是
圖1是現(xiàn)有技術聯(lián)網計算機系統(tǒng)的方塊圖,示出了三個服務器同等分 擔負栽平衡器接收的工作負載;
圖2是圖1中的現(xiàn)有技術聯(lián)網計算機系統(tǒng)在服務器2出現(xiàn)故障后的方 塊圖,使得負載平衡器將所有網絡業(yè)務路由到兩個剩余的服務器;
圖3是根據優(yōu)選實施例的聯(lián)網計算機系統(tǒng)的方塊圖4是圖3中的聯(lián)網計算機系統(tǒng)在服務器2出現(xiàn)故障后的方塊圖,使 得負載平衡器發(fā)送故障信號給兩個剩余的服務器并將所有網絡業(yè)務路由到 兩個剩佘的服務器;
圖5是4艮據優(yōu)選實施例的裝置的方塊圖6是根據優(yōu)選實施例的在負載平衡器檢測到服務器故障時的方法的 流程圖7是根據優(yōu)選實施例在負載平衡器檢測到服務器恢復時的方法的流 程圖8是根據優(yōu)選實施例的用于動態(tài)地確定配置參數的故障級別和在故 障發(fā)生時將服務器的配置參數設置為所述故障級別的方法的流程圖9是根據優(yōu)選實施例的使用由用戶設置的配置參數的故障級別和在 故障發(fā)生時將服務器的配置參數設置為所述故障級別的方法的流程圖IO是示出了根據圖9中的方法卯0的用戶指定的配置參數故障級別 的一個特定實例的表;以及
圖11是根據優(yōu)選實施例的用于在自主調整服務器的配置參數之前和 之后測量服務器性能的方法的流程圖。
具體實施方式
1.0概述
本發(fā)明涉及在多個服務器計算機之間分擔請求。對于不熟悉多個服務 器計算機之間分擔請求的人員來說,本概述部分將提供有助于理解本發(fā)明 的背景信息。
多個月艮務器計算才幾之間的7〉知分擔
參考圖1,實例現(xiàn)有技術聯(lián)網計算機系統(tǒng)100包括連接到網絡110的 多個客戶機105,網絡110連接到負載平衡器120。注意,圖l中的客戶機 105示為105A, 105B,…,105N。負載平衡器120通過網絡110 >^戶 機105獲得請求,并將這些請求路由到圖1中示為130A、 130B、 130C的 三個服務器計算機系統(tǒng)130之一。負載平衡器120的目標是平衡三個服務 器計算機系統(tǒng)之間的負載。假定此實例中每個服務器計算機系統(tǒng)具有相同 的配置,由此允許每個服務器處理相同數目的請求。在此情況下,負栽平 衡器將33.33%的請求路由到服務器130A,將33.33%的請求路由到服務器 130B,并且將33.33%的請求路由到服務器130C。
每個服務器包括可以被設置以確定服務器的運行時性能的配置參數
132。因此,服務器130A包括相應的配置參數132A;服務器130B包括相 應的配置參數132B;并且月l務器130C包括相應的配置參數132C。這些 配置參數優(yōu)選地由系統(tǒng)管理員設置為這樣的值,該值在所有服務器正常工 作時,用于調整服務器的性能以處理在正常操作條件下每個服務器需要處 理的請求的預期負栽。
配置參數可以包括數據庫連接的最大數目、高速緩存中的預備語句的 最大數目,以及線程的最大數目。這些配置參數的值通常被選擇為在正常 操作條件下最優(yōu)化服務器的性能。因此,對于圖1中的系統(tǒng)IOO,如果每 個服務器計算機系統(tǒng)希望需要平均15個數據庫連接,且在峰值負載時需要 20個數據庫連接,則對于三個服務器中的每個服務器,數據庫連接的最大 數目可以設置為20。注意,將配置參數中的數據庫連接的指定數目調整為 這樣的值,所述值在所有三個服務器都正常工作時提供最佳性能。
現(xiàn)在假定服務器之一出現(xiàn)故障,如圖2中所示出的。假定此實例中服 務器130B出現(xiàn)故障。負載平衡器120包括檢測任一服務器何時出現(xiàn)故障 的故障檢測裝置122。一旦故障檢測裝置122檢測到服務器120B出現(xiàn)故障, 負載平衡器120現(xiàn)在就必須將請求路由到兩個剩余的服務器130A和130C。 結果是到每個剩余服務器的請求顯著增加。因為所述三個服務器用于提供 總數為60的可能的并發(fā)數據庫連接,而現(xiàn)在三個服務器之一停機,對于兩 個剩余的服務器而言,總的可能的并發(fā)數據庫連接現(xiàn)在減少到40。減少的 連接總數使客戶機在數據庫連接變得可用之前要等待一些時間,由此負面 地影響系統(tǒng)性能和響應時間。結果,雖然負載平衡器能夠檢測到服務器故 障并將網絡請求路由到剩佘的服務器,但是針對正常操作調整的配置參數 使服務器不能有效處理由于服務器之一出現(xiàn)故障而產生的增加的請求數。
2.0優(yōu)選實施例的描述
優(yōu)選實施例檢測服務器計算機系統(tǒng)何時出現(xiàn)故障,通知剩余服務器計 算機系統(tǒng)所述故障,由此允許一個或多個剩余計算機系統(tǒng)自主地將它們的 配置設置調整到反映故障模式的新的值。配置設置的自主調整允許服務器 動態(tài)地調整到故障條件,由此在不同服務器出現(xiàn)故障時提供增強的性能。此外,優(yōu)選實施例在配置參數的自主調整之前和之后測量計算機系統(tǒng)的性 能,由此確定自主調整在多大程度(如果有)上提供了幫助。
參考圖3,根據優(yōu)選實施例的聯(lián)網計算機系統(tǒng)300包括連接到網絡IIO 的多個客戶機105,網絡110連接到負載平衡器320。負載平衡器320執(zhí)行 與以上根據圖1所述的功能相同的負載平衡功能,將33.33%的請求路由到 每個服務器計算機系統(tǒng)。負載平衡器320包括如上所述的故障檢測裝置 122,并另外包括服務器故障通知裝置324。當故障檢測裝置122檢測到服 務器之一出現(xiàn)故障時,服務器故障通知裝置324將消息發(fā)送^個沒有出 現(xiàn)故障的服務器。
一個或多個服務器計算機系統(tǒng)330包括配置參數332。如此處使用的, 術語"服務器"廣義地用于任何可以被客戶機計算機系統(tǒng)或客戶機程序調 用的計算機系統(tǒng)。配置參數332可以包括前面描述的現(xiàn)有技術配置參數, 并且可以包拾沒置為影響服務器性能的不同值的其他配置參數。 一個或多 個服務器計算機系統(tǒng)330可以另外包括自主配置參數調整裝置334和性能 測量裝置336。在圖3的系統(tǒng)300中,每個服務器計算機系統(tǒng)示為包括相 應的配置參數332、自主配置參數調整裝置334以及性能測量裝置336。因 此,服務器330A包括相應的配置參數332A、自主配置參數調整裝置334A 以及性能測量裝置336A。服務器330B包括相應的配置參數332B、自主配 置參數調整裝置334B以及性能測量裝置336B。服務器330C包括相應的 配置參數332C、自主配置參數調整裝置334C以及性能測量裝置336C。
現(xiàn)在假定服務器330B出現(xiàn)故障,如圖4所示出的。故障檢測裝置122 檢測到故障,并且將所有請求路由到兩個剩余的服務器330A和330C。此 夕卜,服務器故障通知裝置324將消息發(fā)送給服務器330A和服務器330C以 指示服務器已出現(xiàn)故障。所述消息可以只是指示故障服務器的數目,或者 可替代地具體標識哪個或哪些服務器出現(xiàn)故障。此外,所述消息還可指明 服務器預期有多少額外工作。由于負載平衡器320將工作導向服務器,它 知道故障服務器正在完成多少工作,存在多少剩佘的服務器,以及因此會 將多少工作添加到每個剩余服務器。 一旦服務器330A從服務器故障通知
裝置324接收到服務器出現(xiàn)故障或服務器330B出現(xiàn)故障的消息,自主配 置參數調整裝置334A就自主地將一個或多個配置參數332A調整到這樣的 級別,所述級別允許因服務器330B的故障而更有效地進行處理。同樣地, 一旦服務器330C從服務器故障通知裝置324接收到服務器出現(xiàn)故障或服 務器330B出現(xiàn)故障的消息,自主配置參數調整裝置334C就自主地將一個 或多個配置參數332C調整到這樣的級別,所述級別允許因服務器330B的 故障而更有效地進行處理。以這種方式,負載平衡器320可以發(fā)信號通知 未出現(xiàn)故障的服務器某一服務器已出現(xiàn)故障,從而允許未出現(xiàn)故障的服務 器自主地將它們的配置參數調整為在故障環(huán)境中更有效地工作。負載平衡 器320還包括這樣的裝置,所述裝置檢測服務器330B或替代服務器何時 恢復聯(lián)機,并且將消息發(fā)送給其他服務器以指示故障已消除。作為響應, 自主配置參數調整裝置可以重新將配置參數調整回它們的正常工作值。
參考圖5,計算機系統(tǒng)330是根據本發(fā)明優(yōu)選實施例的裝置的一種適 當實施方式。計算機系統(tǒng)330是IBM eServer iSeries計算機系統(tǒng),并代表 圖3和圖4中示出的服務器計算機系統(tǒng)330的一種特定實施方式。本領域 的技術人員將理解,本發(fā)明的裝置和設備可以等同地應用到任何計算機系 統(tǒng),與計算機系統(tǒng)是否是復雜多用戶計算設備、單用戶工作站或嵌入式控 制系統(tǒng)無關。如圖5中顯示的,計算機系統(tǒng)330包括處理器510,主存儲 器520,大容量存儲裝置接口 530,顯示接口 540以及網絡接口 550。這些 系統(tǒng)組件通過使用系統(tǒng)總線560來相互連接。大容量存儲裝置接口 530用 于將大容量存儲裝置設備(如直接訪問存儲設備555)連接到計算機系統(tǒng) 330。 一種特定類型的直接訪問存儲設備555是可讀寫的CDRW驅動器, 其可以向/從CD RW595存儲/讀取數據。
根據優(yōu)選實施例的主存儲器520包含數據521,操作系統(tǒng)522,配置參 數332,自主配置參數調整裝置334以及性能測量裝置336。數據521代表 任何用作到計算機系統(tǒng)330中的任何程序的輸入或來自計算機系統(tǒng)330中 的任何程序的輸出的數據。操作系統(tǒng)522是業(yè)內已知為OS/400的多任務 操作系統(tǒng);但是,本領域的技術人員將理解,本發(fā)明的精神和范圍不限于
任何一個操作系統(tǒng)。配置參數332代表服務器計算機系統(tǒng)330中的任何可 被設置為不同值以調整服務器計算機系統(tǒng)330性能的參數。配置參數332 包括數據庫連接的最大數目、高速緩存中的預備語句的最大數目,以及線 程的最大數目。當然,配置參數332可以包括任何其他可以被設置或改變 以影響計算機系統(tǒng)330的性能的適當參數。
自主配置參數調整裝置334自主地將配置參數332調整到允許服務器 330在不同服務器出現(xiàn)故障時更有效地工作的故障值。此外, 一旦檢測到 服務器恢復,自主配置參數調整裝置334就自主地將配置參數調整回正常 級別。性能測量裝置336在故障之后、在自主配置參數調整裝置334對配 置參數332做出調整之前,然后在自主配置參數調整裝置334對配置參數 332做出調整之后測量計算機的系統(tǒng)性能。通過比較之前和之后的性能值, 性能測量裝置336可以確定調整配置參數在提高計算機系統(tǒng)330的性能方 面具有多大效果。如果提高不令人滿意,則可以嘗試配置參數的其他值以 試圖進一步提高性能。
計算機系統(tǒng)330利用公知的虛擬尋址機制,所述機制允許計算機系統(tǒng) 330的程序表現(xiàn)為好像它們只是在訪問單個大型存儲實體,而不是在訪問 如主存儲器520和DASD設備555之類的多個小型存儲實體。因此,雖然 數據521,操作系統(tǒng)522,配置參數332,自主配置參數調整裝置334,以 及性能測量裝置336示為位于主存儲器520中,但是本領域的技術人員將 認識到,這些項不必完全同時包含在主存儲器520中。還應指出的是,此 處使用的術語"存儲器"通常指計算機系統(tǒng)330的整體虛擬存儲器,并可 以包括連接到計算機系統(tǒng)330的其他計算機系統(tǒng)的虛擬存儲器。
可以從一個或多個微處理器和/或集成電路來構建處理器510。處理器 510執(zhí)行存儲在主存儲器520中的程序指令。主存儲器520存儲處理器510 可以訪問的程序和數據。當計算機系統(tǒng)330啟動時,處理器510初始地執(zhí) 行組成操作系統(tǒng)522的程序指令。操作系統(tǒng)522是管理計算機系統(tǒng)330的 資源的復雜程序。這些資源中的一些資源是處理器510,主存儲器520,大 容量存儲裝置接口 530,顯示接口 540,網^#口 550,以及系統(tǒng)總線560。
雖然計算機系統(tǒng)330示為僅包含單個處理器和單個系統(tǒng)總線,但是本 領域的技術人員將理解,本發(fā)明可以使用具有多個處理器和/或多個總線的 計算機系統(tǒng)來實現(xiàn)。此外,優(yōu)選實施例中使用的每個接口都包括單獨的完 全編程的微處理器,所述微處理器用于從處理器510卸載計算密集的處理。 但是,本領域的技術人員將理解,本發(fā)明等同地應用于只使用1/0適配器 來執(zhí)行類似功能的計算機系統(tǒng)。
顯示接口 540用于將一個或多個顯示器565直接連接到計算機系統(tǒng) 330。這些顯示器565,它們可以是非智能(即,簡易)終端或完全可編程 工作站,用于允許系統(tǒng)管理員和用戶與計算機系統(tǒng)330進行通信。但是要 指出的是,雖然提供了顯示接口 540以支持與一個或多個顯示器565的通 信,但是計算機系統(tǒng)330不是必須需要顯示器565,因為所有需要的與用 戶和其他過程的交互可以通過網落接口 550來進^f亍。
網^4妄口 550用于跨網絡570將其他計算機系統(tǒng)和/或工作站(例如, 圖5中的575 )連接到計算機系統(tǒng)330。不管如何將計算機系統(tǒng)330連接到 其他計算機系統(tǒng)和/或工作站,不管網絡連接570是4吏用現(xiàn)有的模擬和/或數 字技術還是通過某些未來的網絡機制,本發(fā)明均等同地適用。此外,可以 使用許多不同的網絡協(xié)議來實現(xiàn)網絡。這些協(xié)議是允許計算才一網絡570 通信的專用計算機程序。TCP/IP (傳輸控制協(xié)議/網絡協(xié)議)是適合的網絡 協(xié)i^的一個實例。
此刻,重要的是指出,雖然本發(fā)明已經并將繼續(xù)在完全功能的計算機 系統(tǒng)的上下文中描述,但是本領域的技術人員將理解,本發(fā)明能夠以各種 形式作為程序產品來分布,并且本發(fā)明均可等同地應用,與用于實際執(zhí)行 所述分布的計算機可讀信號承載介質的特定類型無關。適當的計算機可讀 信號承栽介質的實例包括可記錄型介質如軟盤和CD RW (例如,圖5 中的595),以及傳輸型介質如數字和模擬通信鏈路。要指出的是,優(yōu)選 的信號承載介質是有形的。
現(xiàn)在參考圖6,當負載平衡器檢測到服務器故障時,方法600開始(步 驟610)。負載平衡器通知(優(yōu)選地通過將消息發(fā)送給剩余服務器)剩余
服務器所述故障(步驟620)。 一個或多個剩余服務器然后自主地將它們 的配置參數調整到故障級別(步驟630)。在優(yōu)選實施例中,存在兩組不 同的配置參數, 一組針對正常操作來定義,另一組針對故障操作來定義。 通過將配置參數^殳置為針對故障操作定義的值來將配置參數設置為"故障 級別"。同樣,通過將配置參數i殳置為針對正常操作定義的值來將配置參 數設置為"正常級別,,。方法600顯示了如何檢測服務器中的故障,并且 響應于此,可以將一個或多個剩余服務器的配置參數自主地調整(或設置) 為故障級別,使得剩余服務器可以比配置參數保持正常級別時更有效地處 理增加的負栽。
參考圖7,當負載平衡器檢測到服務器恢復時,方法700開始(步驟 710 )。負栽平衡器通知(優(yōu)選地通過將消息發(fā)送給剩余服務器)其他服務 器所述恢復(步驟720)。 一個或多個其他服務器然后自主地將它們的配 置參數調整回正常級別(步驟730)。方法700顯示了如何檢測恢復,并 且響應于此,可以將一個或多個剩余服務器的配置參數自主地調整(或設 置)為正常級別。
優(yōu)選實施例包括兩個不同的定義配置參數的故障級別的方法。第一方 法允許服務器動態(tài)地確定配置參數的適當故障級別(步驟810)。 一旦動 態(tài)地確定了這些故障級別,就可以將服務器的配置參數設置為這些故障級 別(步驟820)。要指出的是,在步驟810中動態(tài)確定適當故障級別可以 使用任何適當的算法或試探法來完成。例如,在圖3和圖4示出的簡單實 例中, 一種動態(tài)確定配置參數的合適故障值的適當方法是應用線性伸縮因 數。在此實例中,如果三個服務器都具有最大數目為20的數據庫連接,則 當服務器330B出現(xiàn)故障時,負栽平衡器320知道已失去處理請求的能力 的1/3。結果,到每個剩余服務器330A和330C的消息可以包括每個服務 器的負載將增加50%的指示。作為響應,剩余服務器330A和330C可以 將它們最大為20的數據庫連接增加50。/。以達到每個服務器為30個數據庫 連接。在另一個實例中,每個服務器可以查看可用處理器或I/O帶寬以確 定對配置參數的適當調整,以便處理負載平衡器在消息中指定的增加負栽。
優(yōu)選實施例明確地適合動態(tài)確定一個或多個服務器的配置參數的故障級別 的任何和所有方式和方法。要指出的是,動態(tài)確定故障級別可以在故障發(fā) 生前執(zhí)行,且存儲故障級別以供將來在故障發(fā)生時使用。
定義配置參數的故障級別的第二方法允許用戶指定故障級別。然后可
以在故障發(fā)生時檢索這些用戶指定的故障級別。參考圖9,方法卯O開始 于查找配置參數的用戶指定的故障級別(步驟910)。然后將配置參數i殳 置為故障級別(步驟920)。圖IO顯示了包含三個列的表IOOO, 一列包含 配置參數的正常級別,第二列包含一組在一個故障服務器事件時的故障級 別,第三列包含另一個組在兩個故障服務器事件時的故障級別。這些級別 優(yōu)選地由用戶指定。要指出的是,用戶可以使用任何適當的工具來幫助確 定配置參數的合適級別。當用戶明確指定配置參數的正常級別和故障級別 時,如圖10中顯示的,自主配置參數調整裝置只需根據服務器是運行在正 常模式(沒有故障服務器)、在一個故障服務器的模式,還是在兩個故障 服務器的模式,將配置參數設置為表IOOO中的級別。
如圖3-5示出的,優(yōu)選實施例包括性能測量裝置336。此性能測量裝置 336允許自主配置參數調整裝置334判定調整是否具有提高服務器性能的 期望效果?,F(xiàn)在參考圖11,方法1100開始于測量配置參數處于正常級別 時的服務器性能(步驟1110)。在優(yōu)選實施方式中,在恰好檢測到服務器 之一出現(xiàn)故障之后來測量配置參數處于正常級別時的服務器性能。這允許 步驟1110中的測量代表正常配置參數時的性能(盡管已發(fā)生故障)。在自 主配置參數調整裝置334已將配置參數設置為故障級別之后,再次測量性 能(步驟1120)。然后比較兩次的性能(步驟1130)。如果提高令人滿意 (步驟1140=是),則方法1100結束。如果提高不令人滿意(步驟1140= 否),則調整(步驟1150)和應用(步驟1160)故障值??刂迫缓筠D到步 驟1120,并且方法1100繼續(xù)。性能測量裝置336因此允許判定配置參數 的故障級別是否產生了性能方面的期望增長。
性能測量裝置336測量服務器性能的一種適當方式是測量servlet響應 時間。servlet響應時間是執(zhí)行servlet (其是可以被客戶機調用的服務器上的程序)所需的時間。當然,在優(yōu)選實施例的范圍之內,可以使用其他適 當度量來測量服務器性能。
優(yōu)選實施例通過以下步驟增強了服務器處理故障的能力檢測服務器 之一的故障,發(fā)信號通知剩余服務器已發(fā)生故障, 一個或多個剩余服務器 自主地調整它們的一個或多個配置參數,以^使在故障導致增加了負載的情 況下提高性能。 一旦服務器恢復, 一個或多個服務器就可以自主地將它們 的配置參數調整回正常級別。此外,性能測量裝置允許判定配置參數的故 障級別是否如期望的那樣提高了系統(tǒng)性能。
權利要求
1.一種服務器計算機系統(tǒng),包括至少一個處理器;存儲器,所述存儲器連接到所述至少一個處理器;至少一個配置參數,可以根據所述服務器計算機系統(tǒng)的期望性能來將所述至少一個配置參數設置為不同的值;以及自主配置參數調整裝置,當所述服務器計算機系統(tǒng)接收到指示不同服務器計算機系統(tǒng)出現(xiàn)故障的消息時,所述自主配置參數調整裝置調整所述至少一個配置參數。
2,根據權利要求l的服務器計算機系統(tǒng),其中所述至少一個配置參數 包括數據庫連接的最大數目。
3. 根據權利要求l的服務器計算機系統(tǒng),其中所述至少一個配置參數 包括高速緩存中的預備語句的最大數目。
4. 根據權利要求l的服務器計算機系統(tǒng),其中所述至少一個配置參數 包括線程的最大數目。
5. —種聯(lián)網計算機系統(tǒng),包括 多個服務器計算機系統(tǒng);負載平衡器,所述負載平衡器將請求路由到所述多個計算機系統(tǒng),所述負載平衡器包括故障檢測裝置,所述故障檢測裝置檢測所述多個服務器計算機系統(tǒng)中的一個服務器計算機系統(tǒng)何時出現(xiàn)故障;以及故障通知裝置,當所述故障檢測裝置檢測到所述一個服務器計算 機系統(tǒng)出現(xiàn)故障時,所述故障通知裝置將消息發(fā)送給所述多個服務器 計算機系統(tǒng)中的至少 一個服務器計算機系統(tǒng);所述多個服務器計算機系統(tǒng)中的至少一個服務器計算機系統(tǒng)包括 自主配置參數調整裝置,當從所述故障通知裝置接收到指示所述一個 服務器計算機系統(tǒng)出現(xiàn)故障的消息時,所述自主配置參數調整裝置調 整至少一個配置參數。
6. 根據權利要求5的聯(lián)網計算機系統(tǒng),其中所述至少一個配置參數包 括數據庫連接的最大數目。
7. 根據權利要求5的聯(lián)網計算機系統(tǒng),其中所述至少一個配置參數包 括高速緩存中的預備語句的最大數目。
8. 根據權利要求5的聯(lián)網計算機系統(tǒng),其中所述至少一個配置參數包 括線程的最大數目。
9. 根據權利要求5的聯(lián)網計算機系統(tǒng),其中所述消息指示由于所述一 個服務器計算機系統(tǒng)的故障而預期有多少額外工作。
10. 根據權利要求5的聯(lián)網計算機系統(tǒng),其中所述多個服務器計算機 系統(tǒng)中的所述至少一個服務器計算機系統(tǒng)還包括性能測量裝置,所述性能 測量裝置在調整所述至少一個配置參數之前測量所述至少一個服務器計算 機系統(tǒng)的性能、在調整所述至少一個配置參數之后測量所述至少一個服務 器計算機系統(tǒng)的性能,以及判定所述至少一個配置參數的調整是否提高了 所述至少 一 個服務器計算機系統(tǒng)的性能。
11. 根據權利要求5的聯(lián)網計算機系統(tǒng),其中所述負載平衡器檢測故 障恢復,并且當所述負載平衡器檢測到所述故障恢復時,將消息發(fā)送給所 述多個服務器計算機系統(tǒng)中的至少 一個服務器計算機系統(tǒng)。
12. 根據權利要求ll的聯(lián)網計算機系統(tǒng),其中響應于來自所述負載平 衡器的指示故障恢復的消息,所述多個服務器計算機系統(tǒng)中的所述至少一 個服務器計算機系統(tǒng)將所述至少一個配置參數調整到正常級別。
13. —種用于在聯(lián)網計算機系統(tǒng)中的多個服務器計算機系統(tǒng)之一 出現(xiàn) 故障時提高性能的計算機實現(xiàn)的方法,所述聯(lián)網計算機系統(tǒng)包括將請求路 由到所述多個服務器計算機系統(tǒng)的負載平衡器,所述方法包括以下步驟檢測所述多個服務器計算機系統(tǒng)中的 一個服務器計算機系統(tǒng)的故障; 將指示所述檢測的故障的消息發(fā)送給所述多個服務器計算機系統(tǒng)中的 至少一個服務器計算機系統(tǒng);以及當接收到指示所述一個服務器計算機系統(tǒng)的故障的消息時,所述多個服務器計算機系統(tǒng)中的所述至少 一個服務器計算機系統(tǒng)自主地調整至少一 個配置參數。
14. 根據權利要求13的方法,其中所述至少一個配置參數包括數據庫 連接的最大數目。
15. 根據權利要求13的方法,其中所述至少一個配置參數包括高速緩 存中的預備語句的最大數目。
16. 根據權利要求13的方法,其中所述至少一個配置參數包括線程的 最大數目。
17. 根據權利要求13的方法,其中所述消息指示由于所述一個服務器 計算機系統(tǒng)的故障而預期有多少額外工作。
18. 根據權利要求13的方法,還包括以下步驟 在調整所述至少一個配置參數之前測量所述至少一個服務器計算機系統(tǒng)的性能;在調整所述至少一個配置參數之后測量所述至少一個服務器計算^L系 統(tǒng)的性能;以及判定所述至少一個配置參數的調整是否提高了所述至少一個服務器計 算機系統(tǒng)的性能。
19. 根據權利要求13的方法,還包括以下步驟 檢測故障恢復;當檢測到所述故障恢復時,將消息發(fā)送給所述多個服務器計算機系統(tǒng) 中的至少一個服務器計算機系統(tǒng);以及響應于所述指示故障恢復的消息,所述多個服務器計算機系統(tǒng)中的至 少一個服務器計算機系統(tǒng)自主地將所述至少一個配置參數調整到正常級 別。
20. —種程序產品,包括自主配置參數調整裝置,當服務器計算機系統(tǒng)接收到指示不同服務器 計算機系統(tǒng)故障的消息時,所述自主配置參數調整裝置調整所述服務器計 算機系統(tǒng)中的至少一個配置參數;以及 可記錄的計算機可讀信號承栽介質,其承載所述自主配置參數調整裝置。
21. 根據權利要求20的程序產品,其中所述至少一個配置參數包括數 據庫連接的最大數目。
22. 根據權利要求20的程序產品,其中所述至少一個配置參數包括高 速緩存中的預備語句的最大數目。
23. 根據權利要求20的程序產品,其中所述至少一個配置參數包括線 程的最大數目。
24. 根據權利要求20的程序產品,其中所述消息指示由于所述一個服 務器計算機系統(tǒng)的故障而預期有多少額外工作。
25. 根據權利要求20的程序產品,還包括性能測量裝置,所述性能測量裝置在調整所述至少 一個配置參數之前 測量所述服務器計算機系統(tǒng)的性能、在調整所述至少一個配置參數之后測 量所述服務器計算機系統(tǒng)的性能,以及判定所述至少一個配置參數的調整 是否提高了所述服務器計算機系統(tǒng)的性能。
全文摘要
負載平衡器檢測服務器故障,并且將故障通知信息發(fā)送給其余的服務器。作為響應,一個或多個所述剩余服務器可以自主地調整它們的配置參數,由此允許所述剩余服務器更好地處理因所述服務器故障而帶來的增加的負載。一個或多個所述服務器還可以包括性能測量裝置,該性能測量裝置在自主調整所述配置參數之前和之后測量性能,以確定所述自主調整是否提高了系統(tǒng)性能和提高了多少系統(tǒng)性能。以這種方式,服務器計算機系統(tǒng)可以自主地補償分擔工作負載的其他服務器計算機系統(tǒng)的故障。
文檔編號G06F11/34GK101176073SQ200680016586
公開日2008年5月7日 申請日期2006年5月16日 優(yōu)先權日2005年6月9日
發(fā)明者E·L·巴斯尼斯, J·M·桑托索索, M·瑪杰德 申請人:國際商業(yè)機器公司