數(shù)據(jù)通信裝置、數(shù)據(jù)發(fā)送方法以及計算機系統(tǒng)的制作方法
【專利摘要】通過具備:發(fā)送間隔計算部(11),其基于針對發(fā)送出的發(fā)送數(shù)據(jù)的響應(yīng)數(shù)據(jù)所到達的到達實際時刻與對從其他數(shù)據(jù)通信裝置發(fā)送出的響應(yīng)數(shù)據(jù)到達數(shù)據(jù)通信裝置為止所經(jīng)過的中繼裝置的個數(shù)乘以經(jīng)過一個中繼裝置時所需要的轉(zhuǎn)送延遲時間而計算出的到達預(yù)測時刻的差值、和數(shù)據(jù)的通信路徑上的中繼裝置(20)的緩沖器尺寸,來計算數(shù)據(jù)的實效轉(zhuǎn)送速度,并基于計算出的實效轉(zhuǎn)送速度來計算發(fā)送數(shù)據(jù)間的發(fā)送間隔;和發(fā)送控制部(12),其基于計算出的發(fā)送間隔來進行發(fā)送數(shù)據(jù)的發(fā)送控制,由此在構(gòu)成為規(guī)則網(wǎng)的相互耦合網(wǎng)絡(luò)中高效地實現(xiàn)擁塞控制。
【專利說明】數(shù)據(jù)通信裝置、數(shù)據(jù)發(fā)送方法以及計算機系統(tǒng)
【技術(shù)領(lǐng)域】
[0001 ] 本發(fā)明涉及數(shù)據(jù)通信裝置、數(shù)據(jù)發(fā)送方法以及計算機系統(tǒng)。
【背景技術(shù)】
[0002]在IP交換網(wǎng)、并行計算機中將節(jié)點間連接的相互耦合網(wǎng)絡(luò)一般通過轉(zhuǎn)送數(shù)據(jù)包的路由器的相互連接來構(gòu)成。在大規(guī)模的網(wǎng)絡(luò)中,由于一對一連接所有節(jié)點間的完全耦合網(wǎng)絡(luò)的導(dǎo)入成本較高,所以不被使用,另外,為了通信路徑不沖突而進行路由器的控制的機構(gòu)也由于高成本所以不被使用。
[0003]因此,在路由器中,當(dāng)分別轉(zhuǎn)送從相互不同的輸入端口輸入的多個數(shù)據(jù)包時,存在對于一個輸出端口而言在該多個數(shù)據(jù)包間發(fā)生沖突的情況。
[0004]路由器一般在發(fā)生輸出沖突的情況下選擇一個數(shù)據(jù)包進行轉(zhuǎn)送,在該期間,為了儲存沖突的其他數(shù)據(jù)包來延遲該轉(zhuǎn)送而具備緩沖器。然而,由于緩沖器量是有限的,所以若連續(xù)地發(fā)生數(shù)據(jù)包間的沖突則緩沖器耗盡。而且,若緩沖器耗盡則不得不廢棄輸入數(shù)據(jù)包。
[0005]為了避免緩沖器的耗盡,一部分的路由器具備若緩沖器余量減少則向沖突的輸入端口的連接目的地路由器請求數(shù)據(jù)包發(fā)送停止的流程控制功能。尤其在并行計算機中,一般通過進行嚴(yán)密的緩沖器余量管理來進行不發(fā)生數(shù)據(jù)包廢棄的流程控制。
[0006]在流程控制中,將因數(shù)據(jù)包間的沖突而引起的緩沖器耗盡的信息發(fā)送至流程上游的路由器。因此,對于向發(fā)生沖突的通信路徑連續(xù)發(fā)送數(shù)據(jù)包的發(fā)送源節(jié)點而言,最終連接該發(fā)送源節(jié)點的路由器的緩沖器耗盡而停止發(fā)送。
[0007]在與網(wǎng)絡(luò)連接的發(fā)送裝置向特定的目的地轉(zhuǎn)送數(shù)據(jù)的情況下,一般數(shù)據(jù)轉(zhuǎn)送持續(xù)一定時間,數(shù)據(jù)轉(zhuǎn)送持續(xù)過程中的通信路徑不變。因此,通信路徑的沖突持續(xù)一定時間,成為數(shù)據(jù)包廢棄或緩沖器耗盡的重要因素。這樣的通信路徑中的數(shù)據(jù)包的沖突引起數(shù)據(jù)轉(zhuǎn)送速度的大度降低的現(xiàn)象被稱為擁塞。
[0008]若在多個通信路徑中同時產(chǎn)生擁塞,則會大范圍引起嚴(yán)重的數(shù)據(jù)轉(zhuǎn)送速度降低現(xiàn)象。尤其在數(shù)據(jù)包廢棄的情況下,有時發(fā)生幾乎不能通信的程度的數(shù)據(jù)轉(zhuǎn)送速度降低的現(xiàn)象,這樣的現(xiàn)象被稱為擁塞崩潰。
[0009]例如在發(fā)生擁塞的期間因連續(xù)發(fā)送被廢棄的數(shù)據(jù)包,或者使到?jīng)_突點為止的通信路徑的所有緩沖器耗盡而產(chǎn)生擁塞崩潰。
[0010]為了避免像這樣的因擁塞崩潰引起的嚴(yán)重的數(shù)據(jù)轉(zhuǎn)送速度降低,進行了擁塞控制。
[0011]該擁塞控制通過擁塞檢測和抑制發(fā)送源節(jié)點處的數(shù)據(jù)發(fā)送來實現(xiàn)。由于擁塞的影響在短時間內(nèi)擴散,所以優(yōu)選能夠盡早檢測出擁塞。檢測發(fā)送源節(jié)點發(fā)生擁塞的手段一般是根據(jù)來自目的地節(jié)點的響應(yīng)數(shù)據(jù)包來進行的。例如在TCP/IP (Transmission ControlProtocol/Internet Protocol:傳輸控制協(xié)議/Internet協(xié)議)協(xié)議中,通過檢測一定時間響應(yīng)數(shù)據(jù)包未到達來檢測擁塞的產(chǎn)生。這利用了 IP交換網(wǎng)在擁塞時廢棄數(shù)據(jù)包的性質(zhì)。
[0012]另外,在面向DCB (Data Center Bridging:數(shù)據(jù)中心橋接)、CCE (ConvergedEnhanced Ethernet:融合增強型以太網(wǎng))、DCE (Data Center Ethernet:數(shù)據(jù)中心以太網(wǎng))等數(shù)據(jù)中心的以太網(wǎng)擴張標(biāo)準(zhǔn)中,在流程控制中避免數(shù)據(jù)包丟失,并且具備重新發(fā)送超時以外的擁塞檢測單元。(以太網(wǎng)是注冊商標(biāo)。)
[0013]擁塞檢測均采用利用路由器檢測擁塞的構(gòu)造,通過從該路由器對發(fā)送源節(jié)點發(fā)送專用數(shù)據(jù)包、或?qū)碜月酚善鞯捻憫?yīng)數(shù)據(jù)包標(biāo)注標(biāo)志來將擁塞通知給數(shù)據(jù)包發(fā)送源的路由
-nfrO
[0014]這里,路由器的緩沖器有時沒有在產(chǎn)生了擁塞的情況下保持?jǐn)?shù)據(jù)包的容量,產(chǎn)生擁塞的情況下的影響非常大。因此,一旦檢測出擁塞,則有可能擁塞已經(jīng)引起大范圍的數(shù)據(jù)轉(zhuǎn)送速度的降低,在擁塞控制上不是預(yù)防擁塞而要求消除擁塞。
[0015]TCP/IP的最初的擁塞控制方式是為了避免因數(shù)據(jù)包的重新發(fā)送引起擁塞的再次產(chǎn)生而使重新發(fā)送的數(shù)據(jù)轉(zhuǎn)送速度低于通常時的數(shù)據(jù)轉(zhuǎn)送速度,然后緩緩地將數(shù)據(jù)轉(zhuǎn)送速度提升到通常時的通信速度的緩慢啟動方式。
[0016]在該方式中,返回發(fā)生一旦發(fā)生擁塞則數(shù)據(jù)轉(zhuǎn)送速度暫時下降,數(shù)據(jù)轉(zhuǎn)送速度緩緩上升而再次發(fā)生擁塞的情況。因此,存在網(wǎng)絡(luò)的利用效率較低這一課題。
[0017]另外,隨著IP交換網(wǎng)的高速化、路由器在緩沖器耗盡前隨機地廢棄數(shù)據(jù)包等防止擁塞崩潰的技術(shù)的發(fā)展,更加迅速地使帶寬收斂的擁塞控制方式也被使用。
[0018]例如,在TCP/IP中的擁塞控制協(xié)議的實質(zhì)標(biāo)準(zhǔn)中,每重新發(fā)送I次則數(shù)據(jù)發(fā)送量下降到一半。以這樣的倍率使數(shù)據(jù)發(fā)送量下降的擁塞控制一般被稱為AMD (AdditiveIncrease Multiplicative Decrease:加性增,乘性減)方式。在該AIMD方式中,與上述的緩慢啟動方式相比,數(shù)據(jù)轉(zhuǎn)送速度的振幅變小而收斂。但是,在網(wǎng)絡(luò)的利用效率上依然存在損耗。
[0019]專利文獻1:日本特開平8 - 56222號公報
[0020]專利文獻2:日本特開2000 - 13391號公報
[0021]非專利文獻1:1ETF RFC2581
[0022]如上述那樣在以往的在IP交換網(wǎng)中進行的擁塞控制中,路由器進行數(shù)據(jù)包廢棄、擁塞通知,在發(fā)送源節(jié)點中進行數(shù)據(jù)轉(zhuǎn)送速度的抑制。但是,由于考慮到IP交換網(wǎng)能夠以與連接的計算機的種類、結(jié)構(gòu)獨立地設(shè)計網(wǎng)絡(luò)結(jié)構(gòu),所以網(wǎng)絡(luò)結(jié)構(gòu)是不規(guī)則的,應(yīng)該將數(shù)據(jù)轉(zhuǎn)送速度抑制到什么程度是不明確的。因此,也在使用使數(shù)據(jù)轉(zhuǎn)送速度變化來發(fā)現(xiàn)適當(dāng)?shù)臄?shù)據(jù)轉(zhuǎn)送速度的方式,但在這樣的控制方式中,存在數(shù)據(jù)轉(zhuǎn)送速度不穩(wěn)定而網(wǎng)絡(luò)的利用效率較低這一課題,而且,沒有設(shè)想構(gòu)成為規(guī)則的網(wǎng)絡(luò)網(wǎng)的相互耦合網(wǎng)絡(luò)。
【發(fā)明內(nèi)容】
[0023]在一個方面,本發(fā)明的目的在于,在構(gòu)成為規(guī)則的網(wǎng)絡(luò)網(wǎng)的相互耦合網(wǎng)絡(luò)中高效地實現(xiàn)擁塞控制。
[0024]需要說明的是,并不限于上述目的,起到由實施后述的發(fā)明用的最佳方式所示的各結(jié)構(gòu)產(chǎn)生的作用效果、即通過以往的技術(shù)不能夠得到的作用效果也能夠作為本發(fā)明的其他目的之一。
[0025]為了實現(xiàn)上述目的,該數(shù)據(jù)通信裝置是經(jīng)由中繼裝置向其他數(shù)據(jù)通信裝置發(fā)送數(shù)據(jù)的數(shù)據(jù)通信裝置,具有:發(fā)送間隔計算部,其基于針對向上述其他數(shù)據(jù)通信裝置發(fā)送的發(fā)送數(shù)據(jù)的響應(yīng)數(shù)據(jù)所到達的到達實際時刻對與從上述其他數(shù)據(jù)通信裝置發(fā)送出的響應(yīng)數(shù)據(jù)到達上述數(shù)據(jù)通信裝置為止所經(jīng)過的中繼裝置的個數(shù)乘以經(jīng)過一個中繼裝置時所需要的轉(zhuǎn)送延遲時間而計算出的到達預(yù)測時刻的差值、和上述數(shù)據(jù)的通信路徑上的中繼裝置的緩沖器尺寸,來計算上述數(shù)據(jù)的實效轉(zhuǎn)送速度,并基于上述計算出的實效轉(zhuǎn)送速度來計算發(fā)送數(shù)據(jù)間的發(fā)送間隔;和發(fā)送控制部,其基于上述計算出的發(fā)送間隔來進行發(fā)送數(shù)據(jù)的發(fā)送控制。
[0026]另外,該數(shù)據(jù)通信裝置是經(jīng)由中繼裝置向其他數(shù)據(jù)通信裝置發(fā)送數(shù)據(jù)的數(shù)據(jù)通信裝置,具有:發(fā)送控制部,其按照將針對向上述其他數(shù)據(jù)通信裝置發(fā)送出的發(fā)送數(shù)據(jù)的響應(yīng)數(shù)據(jù)未到達的發(fā)送數(shù)據(jù)的數(shù)據(jù)量相加而得到的總數(shù)據(jù)量為限制尺寸以下的方式進行數(shù)據(jù)的發(fā)送;和限制尺寸計算部,其基于針對向上述其他數(shù)據(jù)通信裝置發(fā)送出的發(fā)送數(shù)據(jù)的響應(yīng)數(shù)據(jù)所到達的到達實際時刻與對從上述其他數(shù)據(jù)通信裝置發(fā)送出的響應(yīng)數(shù)據(jù)到達上述數(shù)據(jù)通信裝置為止所經(jīng)過的中繼裝置的個數(shù)乘以經(jīng)過一個中繼裝置時所需要的轉(zhuǎn)送延遲時間而計算出的到達預(yù)測時刻的差值、和上述數(shù)據(jù)的通信路徑上的中繼裝置的緩沖器尺寸,來計算上述數(shù)據(jù)的實效轉(zhuǎn)送速度,并基于上述計算出的實效轉(zhuǎn)送速度來計算上述限制尺寸。
[0027]并且,該數(shù)據(jù)發(fā)送方法是經(jīng)由中繼裝置發(fā)送數(shù)據(jù)的數(shù)據(jù)發(fā)送方法,計算機基于針對發(fā)送出的發(fā)送數(shù)據(jù)的響應(yīng)數(shù)據(jù)所到達的到達實際時刻與對上述響應(yīng)數(shù)據(jù)到達為止所經(jīng)過的中繼裝置的個數(shù)乘以經(jīng)過一個中繼裝置時所需要的轉(zhuǎn)送延遲時間而計算出的到達預(yù)測時刻的差值、和上述數(shù)據(jù)的通信路徑上的上述中繼裝置的緩沖器尺寸,來計算上述數(shù)據(jù)的實效轉(zhuǎn)送速度,并基于上述計算出的實效轉(zhuǎn)送速度計算出發(fā)送數(shù)據(jù)間的發(fā)送間隔,基于上述計算出的發(fā)送間隔來進行發(fā)送數(shù)據(jù)的發(fā)送控制。
[0028]另外,該數(shù)據(jù)發(fā)送方法是經(jīng)由中繼裝置向其他數(shù)據(jù)通信裝置發(fā)送數(shù)據(jù)的數(shù)據(jù)發(fā)送方法,基于針對向上述其他數(shù)據(jù)通信裝置發(fā)送出的發(fā)送數(shù)據(jù)的響應(yīng)數(shù)據(jù)所到達的到達實際時刻與對從上述其他數(shù)據(jù)通信裝置發(fā)送出的響應(yīng)數(shù)據(jù)到達上述數(shù)據(jù)通信裝置為止所經(jīng)過的中繼裝置的個數(shù)乘以經(jīng)過一個中繼裝置時所需要的轉(zhuǎn)送延遲時間而計算出的到達預(yù)測時刻的差值、和上述數(shù)據(jù)的通信路徑上的上述中繼裝置的緩沖器尺寸,來計算上述數(shù)據(jù)的實效轉(zhuǎn)送速度,并基于上述計算出的實效轉(zhuǎn)送速度來計算限制尺寸,按照將針對向上述其他數(shù)據(jù)通信裝置發(fā)送出的發(fā)送數(shù)據(jù)的響應(yīng)數(shù)據(jù)未到達的發(fā)送數(shù)據(jù)的數(shù)據(jù)量相加而得到的總數(shù)據(jù)量為上述限制尺寸以下的方式來進行數(shù)據(jù)的發(fā)送。
[0029]并且,該計算機系統(tǒng)具備:具有多個中繼裝置的通信網(wǎng)、和經(jīng)由該通信網(wǎng)進行數(shù)據(jù)的收發(fā)的多個計算節(jié)點,上述計算節(jié)點具有:發(fā)送間隔計算部,其基于向上述其他計算節(jié)點發(fā)送出的發(fā)送數(shù)據(jù)的響應(yīng)數(shù)據(jù)所到達的到達實際時刻與對從上述其他計算節(jié)點發(fā)送出的響應(yīng)數(shù)據(jù)到達上述計算節(jié)點為止所經(jīng)過的中繼裝置的個數(shù)乘以經(jīng)過一個中繼裝置時所需要的轉(zhuǎn)送延遲時間而計算出的到達預(yù)測時刻的差值、和上述數(shù)據(jù)的通信路徑上的中繼裝置的緩沖器尺寸,來計算上述數(shù)據(jù)的實效轉(zhuǎn)送速度,并基于上述計算出的實效轉(zhuǎn)送速度來計算發(fā)送數(shù)據(jù)間的發(fā)送間隔;和發(fā)送控制部,其基于上述計算出的發(fā)送間隔來進行發(fā)送數(shù)據(jù)的發(fā)送控制。
[0030]另外,該計算機系統(tǒng)具備:具有中繼裝置的通信網(wǎng)、和經(jīng)由該通信網(wǎng)進行數(shù)據(jù)的收發(fā)的多個計算節(jié)點,上述計算機節(jié)點具有:發(fā)送控制部,其按照將針對向上述其他計算節(jié)點發(fā)送出的發(fā)送數(shù)據(jù)的響應(yīng)數(shù)據(jù)未到達的發(fā)送數(shù)據(jù)的數(shù)據(jù)量相加而得到的總數(shù)據(jù)量為限制尺寸以下的方式進行數(shù)據(jù)的發(fā)送;和限制尺寸計算部,其基于針對向上述其他計算節(jié)點發(fā)送出的發(fā)送數(shù)據(jù)的響應(yīng)數(shù)據(jù)所到達的到達實際時刻與對從上述其他計算節(jié)點發(fā)送出的響應(yīng)數(shù)據(jù)到達上述計算節(jié)點為止所經(jīng)過的中繼裝置的個數(shù)乘以經(jīng)過一個中繼裝置時所需要的轉(zhuǎn)送延遲時間而計算出的到達預(yù)測時刻的差值、和上述數(shù)據(jù)的通信路徑上的中繼裝置的緩沖器尺寸,來計算上述數(shù)據(jù)的實效轉(zhuǎn)送速度,并基于上述計算出的實效轉(zhuǎn)送速度來計算上述限制尺寸。
[0031]根據(jù)公開的技術(shù),起到以下的至少任意一個效果或優(yōu)點。
[0032]( I)能夠高效地實現(xiàn)擁塞控制。
[0033](2)能夠高效地使用相互耦合網(wǎng)絡(luò)。
[0034](3)能夠防止擁塞的影響范圍擴大。
【專利附圖】
【附圖說明】
[0035]圖1是示意性地表示作為第一實施方式的一個例子的并行計算機系統(tǒng)所具備的相互耦合網(wǎng)絡(luò)接口的功能結(jié)構(gòu)的圖。
[0036]圖2是例示作為第一實施方式的一個例子的并行計算機系統(tǒng)的結(jié)構(gòu)的圖。
[0037]圖3是示意性地表示作為第一實施方式的一個例子的并行計算機系統(tǒng)所具備的計算節(jié)點的硬件結(jié)構(gòu)的圖。
[0038]圖4是例示作為第一實施方式的一個例子的并行計算機系統(tǒng)中的發(fā)送時刻表的圖。
[0039]圖5是說明作為第一實施方式的一個例子的并行計算機系統(tǒng)中的消息發(fā)送時的處理的流程圖。
[0040]圖6是說明作為第一實施方式的一個例子的并行計算機系統(tǒng)中的響應(yīng)數(shù)據(jù)包的接收時的處理的流程圖。
[0041]圖7是示意性地表示作為第二實施方式的一個例子的并行計算機系統(tǒng)所具備的相互耦合網(wǎng)絡(luò)接口的功能結(jié)構(gòu)的圖。
[0042]圖8是說明作為第二實施方式的一個例子的并行計算機系統(tǒng)中的消息發(fā)送時的處理的流程圖。
[0043]圖9是說明作為第二實施方式的一個例子的并行計算機系統(tǒng)中的響應(yīng)數(shù)據(jù)包的接收時的處理的流程圖。
【具體實施方式】
[0044]以下,參照附圖對本發(fā)明的實施方式進行說明。
[0045](A)第一實施方式
[0046]圖1是示意性地表示作為第一實施方式的一個例子的并行計算機系統(tǒng)I所具備的相互耦合網(wǎng)絡(luò)接口的功能結(jié)構(gòu)的圖,圖2是例示該并行計算機系統(tǒng)I的結(jié)構(gòu)的圖。另外,圖3是示意性地表示作為第一實施方式的一個例子的并行計算機系統(tǒng)I所具備的計算節(jié)點100的硬件結(jié)構(gòu)的圖。
[0047]作為第一實施方式的一個例子并行計算機系統(tǒng)I如圖2所示,由將多個(在圖2所示的例子中是4個)計算節(jié)點100 - 1、100 - 2、100 — 3、100 — 4經(jīng)由I個以上(在圖2所
示的例子中是2個)的路由器(開關(guān)裝置)20 - 1,20 - 2以相互能夠通信的方式連接的相互耦合網(wǎng)絡(luò)(通信網(wǎng))構(gòu)成。
[0048]其中,該并行計算機系統(tǒng)I所具備的多個計算節(jié)點100 - UlOO - 2,100 一 3、100 — 4具備相互相同的結(jié)構(gòu),另外,多個路由器20 — I>20 — 2也具備相互相同的結(jié)構(gòu)。
[0049]以下,作為表示計算節(jié)點的符號,當(dāng)需要在多個計算節(jié)點中確定一個時使用符號100 — I?100 - 4,但在指任意的計算節(jié)點時使用符號100。同樣,以下作為表示路由器的符號,當(dāng)需要從多個路由器中確定一個時使用符號20 - 1,20 - 2,但在指任意的路由器時使用符號20。
[0050]路由器20是以能夠通信的方式與多個計算節(jié)點100、其他的路由器20連接,將接收到的數(shù)據(jù)包(數(shù)據(jù))發(fā)送至轉(zhuǎn)送目的地的中繼裝置。
[0051]在圖2所示的例子中,各路由器20分別具備Pl?P4這4個端口。而且,在路由器20 — I中,在端口 P1、P2連接計算節(jié)點100 - UlOO - 2,并且在端口 P3、P4分別連接路由器20 — 2的端口 P4、P3。另外,在路由器20 — 2中,在端口 P1、P2連接計算節(jié)點100 —3,100 - 4。
[0052]路由器20如圖3所示,具備收發(fā)緩沖器21以及交叉開關(guān)(crossbar switch)22。收發(fā)緩沖器21是暫時儲存被接收發(fā)送的數(shù)據(jù)的緩沖器,每個端口都具備。收發(fā)緩沖器21具備發(fā)送緩沖器212以及接收緩沖器211。
[0053]發(fā)送緩沖器212以及接收緩沖器211分別是例如FIFO (First In First Out:先入先出)型的緩沖存儲器。發(fā)送緩沖器212是儲存向計算節(jié)點100、其他的路由器20等發(fā)出的數(shù)據(jù)包的緩沖存儲器,儲存經(jīng)由交叉開關(guān)22獲得的數(shù)據(jù)包。
[0054]接收緩沖器211接收并儲存從計算節(jié)點100、其他的路由器20等發(fā)送來的數(shù)據(jù)包。該接收緩沖器211中儲存的數(shù)據(jù)包經(jīng)由交叉開關(guān)22被發(fā)出至其他計算節(jié)點100、其他的路由器20等。
[0055]在該并行計算機系統(tǒng)i中,以被分割為數(shù)據(jù)包的狀態(tài)收發(fā)從各計算節(jié)點100發(fā)送的數(shù)據(jù)(消息)。另外,該數(shù)據(jù)包的數(shù)據(jù)包長度(L)能夠適當(dāng)?shù)卦O(shè)定,另外,可作為固定長度或可變長度來適當(dāng)?shù)貙嵤?br>
[0056]另外,在該并行計算機系統(tǒng)I中,路由器20具備若在收發(fā)緩沖器21中緩沖器余量減少則對沖突的輸入端口的連接目的地路由器20、計算節(jié)點100請求數(shù)據(jù)包發(fā)送停止的流程控制功能。
[0057]計算節(jié)點100具備處理器111以及相互耦合網(wǎng)絡(luò)接口 110。
[0058]計算節(jié)點100是具備運算功能的裝置,各計算節(jié)點100經(jīng)由相互f禹合網(wǎng)絡(luò)接口 110以能夠通信的方式與路由器20連接。由此,能夠在該并行計算機系統(tǒng)I內(nèi)的任意計算節(jié)點100間收發(fā)數(shù)據(jù)包。
[0059]處理器111依次取得相互耦合網(wǎng)絡(luò)接口 110的數(shù)據(jù)包接收電路112所保持的數(shù)據(jù)包,進行數(shù)據(jù)處理。另外,處理器111在需要向其他計算節(jié)點100發(fā)送數(shù)據(jù)的情況下,將該數(shù)據(jù)分割而生成包含目的地地址的數(shù)據(jù)包,并輸出至相互耦合網(wǎng)絡(luò)接口 110的數(shù)據(jù)包發(fā)送電路113。
[0060]相互耦合網(wǎng)絡(luò)接口 110是將計算節(jié)點100與路由器20以能夠通信的方式連接的接口裝置,控制來自計算節(jié)點100的數(shù)據(jù)包的發(fā)出、接收。
[0061]S卩,由處理器111生成的數(shù)據(jù)包經(jīng)由相互耦合網(wǎng)絡(luò)接口 110被發(fā)送至路由器20,另夕卜,從路由器20發(fā)送出的數(shù)據(jù)經(jīng)由相互耦合網(wǎng)絡(luò)接口 110被送達計算節(jié)點100。
[0062]該相互耦合網(wǎng)絡(luò)接口 110如圖3所示,具備數(shù)據(jù)包發(fā)送電路113、數(shù)據(jù)包發(fā)送時刻表114、構(gòu)成信息保持部115以及數(shù)據(jù)包接收電路112。
[0063]數(shù)據(jù)包接收電路112在內(nèi)部具有FIFO型的緩沖存儲器(省略圖示)。若數(shù)據(jù)包接收電路112從路由器20獲取數(shù)據(jù)包,則將獲取的數(shù)據(jù)包儲存到緩沖存儲器的最末尾。另外,數(shù)據(jù)包接收電路112根據(jù)來自處理器111的請求,從緩沖存儲器的前端獲取數(shù)據(jù)包并交接給處理器111。
[0064]構(gòu)成信息保持部115是保持與該并行計算機系統(tǒng)I的結(jié)構(gòu)相關(guān)的信息的存儲器等保持部。
[0065]構(gòu)成該并行計算機系統(tǒng)I的相互耦合網(wǎng)絡(luò)構(gòu)成為規(guī)則耦合網(wǎng)絡(luò),在計算節(jié)點100間收發(fā)的數(shù)據(jù)通過被確定的通信路徑(傳輸路徑)。
[0066]S卩,在該并行計算機系統(tǒng)I中,若確定了發(fā)送源的計算節(jié)點100與目的地的計算節(jié)點100,則在這些計算節(jié)點100間收發(fā)的數(shù)據(jù)包所通過的路由器20等中繼設(shè)備的個數(shù)(鏈接數(shù)、公制的(metric))被確定。以下,將該并行計算機系統(tǒng)I中在通信路徑上數(shù)據(jù)包所通過的鏈接數(shù)、即路由器20等中繼裝置的個數(shù)稱為跳數(shù)(h)。
[0067]例如,在圖2所示的例子中,從計算節(jié)點100 — I向計算節(jié)點100 — 3發(fā)送的數(shù)據(jù)包在被儲存到路由器20 -1的端口 Pl的接收緩沖器211后,被輸入至交叉開關(guān)22,然后儲存至端口 P3的發(fā)送緩沖器212。而且,數(shù)據(jù)包被發(fā)送至路由器20 - 2,在被儲存到路由器20 - 2的端口 P4的接收緩沖器211后,經(jīng)由交叉開關(guān)22儲存至端口 P2的發(fā)送緩沖器212。然后,數(shù)據(jù)包被送達至作為發(fā)送目的地的計算節(jié)點100 - 4。在這樣的從計算節(jié)點100 -1發(fā)送至計算節(jié)點100 - 3的數(shù)據(jù)包的發(fā)送中,跳數(shù)(h)與通過的路由器20的臺數(shù)相等,h =2。
[0068]另外,在路由器20中,數(shù)據(jù)包通過路由器20時所花費的時間被規(guī)定為每I跳的轉(zhuǎn)送延遲時間(D)。另外,路由器20中的、數(shù)據(jù)包的I次轉(zhuǎn)送時所通過的發(fā)送緩沖器212與接收緩沖器211的緩沖器尺寸的總和被規(guī)定為每I跳的路由器緩沖器量(B)。
[0069]并且,在該并行計算機系統(tǒng)I中,對于計算節(jié)點100間的數(shù)據(jù)包的各傳遞路徑,沒有擁塞的情況下的轉(zhuǎn)送速度(T)通過計算或測定來規(guī)定。
[0070]在構(gòu)成信息保持部115中,相對于該并行計算機系統(tǒng)I中的各通信路徑,對應(yīng)記錄有跳數(shù)(h)、沒有擁塞的情況下的轉(zhuǎn)送速度(T)。另外,構(gòu)成信息保持部115所保持的構(gòu)成信息中還包含關(guān)于路由器20的、每I跳的轉(zhuǎn)送延遲時間(D)、每I跳的路由器緩沖器量(B)、數(shù)據(jù)包長度(L)。其中,這些記錄于構(gòu)成信息保持部115的構(gòu)成信息能夠在該并行計算機系統(tǒng)I的設(shè)計時求出,構(gòu)成信息例如在該系統(tǒng)設(shè)計時生成。構(gòu)成信息在未圖示的存儲器等中以后述的數(shù)據(jù)包發(fā)送電路113能夠參照的形式儲存于構(gòu)成信息保持部115。此外,儲存于構(gòu)成信息保持部115的構(gòu)成信息例如也可以以數(shù)據(jù)庫、表等形式儲存,能夠進行各種變形來實施。[0071 ] 數(shù)據(jù)包發(fā)送時刻表114對于被數(shù)據(jù)包發(fā)送電路113發(fā)送的各數(shù)據(jù)包管理其發(fā)送時刻。
[0072]圖4是例示作為第一實施方式的一個例子的并行計算機系統(tǒng)I中的數(shù)據(jù)包發(fā)送時刻表114的圖。
[0073]在該圖4所示的例子中,數(shù)據(jù)包發(fā)送時刻表114相互關(guān)聯(lián)地記錄數(shù)據(jù)包識別符P、數(shù)據(jù)包發(fā)送時刻以及消息識別符m作為記入項目。
[0074]該數(shù)據(jù)包發(fā)送時刻表114被用于從數(shù)據(jù)包被發(fā)送到響應(yīng)數(shù)據(jù)包返回為止的時間(往返時間)的測定。
[0075]數(shù)據(jù)包識別符P是為了識別各個數(shù)據(jù)包而唯一設(shè)定的識別符。數(shù)據(jù)包發(fā)送時刻是該數(shù)據(jù)包被數(shù)據(jù)包發(fā)送電路113發(fā)送的時刻。消息識別符m是為了識別該數(shù)據(jù)包所構(gòu)成的消息而設(shè)定的識別符。
[0076]這些儲存于數(shù)據(jù)包發(fā)送時刻表114的信息例如由數(shù)據(jù)包發(fā)送電路113生成,在數(shù)據(jù)包的發(fā)送時隨時儲存至數(shù)據(jù)包發(fā)送時刻表114。
[0077]另外,記錄于數(shù)據(jù)包發(fā)送時刻表114的記入項目在對應(yīng)的響應(yīng)數(shù)據(jù)包被數(shù)據(jù)包接收電路112接收的時刻,被從數(shù)據(jù)包發(fā)送時刻表114中刪除。由此,通過參照數(shù)據(jù)包發(fā)送時刻表114,能夠?qū)τ谔囟ǖ臄?shù)據(jù)包判定是否是響應(yīng)數(shù)據(jù)包未到達的狀態(tài)即發(fā)送中的數(shù)據(jù)包(消息)。
[0078]數(shù)據(jù)包發(fā)送電路113在內(nèi)部具有FIFO等緩沖存儲器。若數(shù)據(jù)包發(fā)送電路113取得作為處理器111發(fā)送的數(shù)據(jù)的消息,則將取得的消息分割為數(shù)據(jù)包,并將分割后的數(shù)據(jù)包儲存至緩沖存儲器。另外,數(shù)據(jù)包發(fā)送電路113對來自路由器20的請求進行響應(yīng),從該緩沖存儲器中取出數(shù)據(jù)包,并輸出至路由器20。
[0079]而且,數(shù)據(jù)包發(fā)送電路113如圖1所示,具備作為等待時間計算部11以及發(fā)送控制部12的功能。
[0080]等待時間計算部(發(fā)送間隔計算部)11根據(jù)形成該并行計算機系統(tǒng)I的相互耦合網(wǎng)絡(luò)的結(jié)構(gòu)來計算預(yù)想的到達預(yù)測時刻。
[0081]具體而言,若數(shù)據(jù)包接收電路112接收到響應(yīng)數(shù)據(jù)包,則等待時間計算部11從數(shù)據(jù)包發(fā)送時刻表114讀出與該響應(yīng)數(shù)據(jù)包對應(yīng)的發(fā)送數(shù)據(jù)包的數(shù)據(jù)包發(fā)送時刻。并且,等待時間計算部11從構(gòu)成信息保持部115讀出表示在通信路徑上數(shù)據(jù)包通過了的路由器等中繼裝置的個數(shù)的跳數(shù)(h)和每I跳的轉(zhuǎn)送延遲量(D),計算出跳數(shù)與延遲量相乘后的值(hXD)。
[0082]而且,等待時間計算部11通過對從數(shù)據(jù)包發(fā)送時刻表114讀出的數(shù)據(jù)包發(fā)送時刻加上計算出的hXD,來求出到達預(yù)測時刻。
[0083]另外,等待時間計算部11將計算出的到達預(yù)測時刻與響應(yīng)數(shù)據(jù)包實際到達的時刻即到達實際時刻進行比較。等待時間計算部11在到達實際時刻與計算出的到達預(yù)想時刻相比晚的情況下,進一步從到達實際時刻減去到達預(yù)測時刻來計算出到達時間的差值⑷。
[0084]并且,等待時間計算部11使用該計算出的差值(d)、和從構(gòu)成信息保持部115讀出的跳數(shù)(h)以及每I跳的路由器緩沖器量(B),來計算出通信路徑中的數(shù)據(jù)包的實效轉(zhuǎn)送速度(t)。
[0085]擁塞產(chǎn)生狀態(tài)是通信路徑上的緩沖器全部耗盡的狀態(tài),被認(rèn)為是到發(fā)送目的地為止的通信路徑上的所有緩沖器是被數(shù)據(jù)包裝滿的狀態(tài)。鑒于此,假定為與通信路徑上的總緩沖器尺寸hXB相當(dāng)?shù)臄?shù)據(jù)量被以時間d轉(zhuǎn)送,使用以下的式(I)來計算實效轉(zhuǎn)送速度⑴。
[0086]t = hXB / d...(I)
[0087]而且,等待時間計算部11為了將計算出的實效轉(zhuǎn)送速度(t)作為以后的數(shù)據(jù)發(fā)送速度而使用以下的式(2)來計算數(shù)據(jù)包發(fā)送間隔(g)。
[0088]g = (L / t) — (L / T)…(2)
[0089]其中,等待時間計算部11在該數(shù)據(jù)包發(fā)送間隔(g)的計算時,從構(gòu)成信息保持部115還讀出數(shù)據(jù)包長度(L)、沒有擁塞的情況下的轉(zhuǎn)送速度(T)。另外,等待時間計算部11也可以將計算出的數(shù)據(jù)包發(fā)送間隔(g)儲存至未圖示的存儲器等。
[0090]發(fā)送控制部12將由等待時間計算部11計算出的數(shù)據(jù)包發(fā)送間隔(g)作為連續(xù)發(fā)送多個數(shù)據(jù)包時的發(fā)送間隔來進行數(shù)據(jù)包的發(fā)送控制。具體而言,當(dāng)連續(xù)發(fā)送多個數(shù)據(jù)包時,在從發(fā)送前一個數(shù)據(jù)包起經(jīng)過數(shù)據(jù)包發(fā)送間隔(g)后,發(fā)送后續(xù)的數(shù)據(jù)包。即,數(shù)據(jù)包發(fā)送間隔(g )相當(dāng)于數(shù)據(jù)包間的等待時間。
[0091]通過在數(shù)據(jù)包間設(shè)定這樣的數(shù)據(jù)包發(fā)送間隔(g)來進行數(shù)據(jù)包發(fā)送控制,能夠以上述的實效轉(zhuǎn)送速度(t)傳輸數(shù)據(jù)包。
[0092]即,以通過上述的式(2)求出的數(shù)據(jù)包發(fā)送間隔(g)發(fā)送數(shù)據(jù)包相當(dāng)于按照產(chǎn)生擁塞的通信路徑上的轉(zhuǎn)送速度來調(diào)整數(shù)據(jù)包間隔,在產(chǎn)生擁塞的通信路徑上發(fā)送新的數(shù)據(jù)包。即,按照通信路徑上的實際的吞吐量使數(shù)據(jù)包的轉(zhuǎn)送速度降低來依次發(fā)送數(shù)據(jù)包。由此,該通信路徑上的數(shù)據(jù)包的擁擠狀況不會進一步惡化。由此,最終消除擁塞。
[0093]在該并行計算機系統(tǒng)i中,若在通信路徑上產(chǎn)生擁塞,則實效轉(zhuǎn)送速度(t)的值變大,伴隨于此,數(shù)據(jù)包發(fā)送間隔(g)的值變大。由此,發(fā)送控制部12以較大的數(shù)據(jù)包發(fā)送間隔(g)發(fā)送數(shù)據(jù)包,通信路徑上的數(shù)據(jù)包的擁擠狀況得到緩和,結(jié)果,擁塞被消除。
[0094]其中,作為上述的等待時間計算部11、發(fā)送控制部12的各功能可以通過電子電路來實現(xiàn),另外,也可以通過未圖示的處理器執(zhí)行程序來實現(xiàn)。
[0095]根據(jù)圖5所示的流程圖(步驟AlO~A50)對如上述那樣構(gòu)成的作為第一實施方式的一個例子的并行計算機系統(tǒng)I中的消息發(fā)送時的處理進行說明。
[0096]若消息的發(fā)送源的計算節(jié)點100 (發(fā)送節(jié)點)的數(shù)據(jù)包發(fā)送電路113開始消息的發(fā)送處理,則數(shù)據(jù)包發(fā)送電路113首先通過對數(shù)據(jù)包發(fā)送間隔(g)預(yù)先設(shè)定初始值來進行初始化(步驟A10)。該數(shù)據(jù)包發(fā)送間隔(g)的初始值例如g = O。
[0097]發(fā)送控制部12在經(jīng)過數(shù)據(jù)包發(fā)送間隔(g)之前進行等待(步驟A20),若經(jīng)過數(shù)據(jù)包發(fā)送間隔(g),則進行數(shù)據(jù)包的發(fā)送(步驟A30)。另外,在該被發(fā)送的數(shù)據(jù)包中,附加有消息識別符m、數(shù)據(jù)包識別符p。
[0098]數(shù)據(jù)包發(fā)送電路113隨著數(shù)據(jù)包的發(fā)送,將與發(fā)送出的數(shù)據(jù)包相關(guān)的信息記錄到數(shù)據(jù)包發(fā)送時刻表114 (步驟A40)。即,對數(shù)據(jù)包發(fā)送時刻表114記錄發(fā)送出的數(shù)據(jù)包的數(shù)據(jù)包識別符P、消息識別符m、發(fā)送時刻。
[0099]數(shù)據(jù)包發(fā)送電路113確認(rèn)形成消息的所有數(shù)據(jù)包的發(fā)送是否完成(步驟A50)。在未完成所有數(shù)據(jù)包的發(fā)送的情況下(參照步驟A50的“否”路徑),返回到步驟A20。另外,在所有數(shù)據(jù)包的發(fā)送完成了的情況下(參照步驟A50的“是”路徑),結(jié)束消息的發(fā)送處理。 [0100]接下來,根據(jù)圖6所示的流程圖(步驟BlO~MO)對作為該第一實施方式的一個例子的并行計算機系統(tǒng)I中的響應(yīng)數(shù)據(jù)包的接收時的處理進行說明。[0101]在消息的發(fā)送源的計算節(jié)點100 (發(fā)送節(jié)點)中,進行是否接收到針對發(fā)送出的數(shù)據(jù)包的響應(yīng)數(shù)據(jù)包的確認(rèn)(步驟B10),在未接收到響應(yīng)數(shù)據(jù)包的情況下(參照步驟BlO的“否”路徑),結(jié)束處理。即,數(shù)據(jù)包接收電路112進行響應(yīng)數(shù)據(jù)包的接收等待。
[0102]在接收到響應(yīng)數(shù)據(jù)包的情況下(參照步驟BlO的“是”路徑),在數(shù)據(jù)包發(fā)送電路113中確認(rèn)響應(yīng)數(shù)據(jù)包的消息識別符m是否與記錄于數(shù)據(jù)包發(fā)送時刻表114的數(shù)據(jù)包的消息識別符m —致(步驟B20)。
[0103]在響應(yīng)數(shù)據(jù)包的數(shù)據(jù)包識別符m與發(fā)送中的消息一致的情況下(參照步驟B20的“是”路徑),接下來,數(shù)據(jù)包發(fā)送電路113確認(rèn)數(shù)據(jù)包發(fā)送時刻表114中是否記錄有響應(yīng)數(shù)據(jù)包的數(shù)據(jù)包識別符P (步驟B30)。
[0104]在數(shù)據(jù)包發(fā)送時刻表114中記錄有響應(yīng)數(shù)據(jù)包的數(shù)據(jù)包識別符P的情況下(參照步驟B30的“是”路徑),等待時間計算部11進行數(shù)據(jù)包發(fā)送間隔(g)的計算。
[0105]等待時間計算部11從數(shù)據(jù)包發(fā)送時刻表114讀出與響應(yīng)數(shù)據(jù)包的數(shù)據(jù)包識別符P對應(yīng)的數(shù)據(jù)包發(fā)送時刻并進行到達預(yù)想時刻的計算,然后進行與該響應(yīng)數(shù)據(jù)包的現(xiàn)實的接收時刻、即到達實際時刻的比較。在該到達預(yù)想時刻與到達實際時刻的比較結(jié)果是到達實際時刻與計算出的到達預(yù)想時刻相比晚的情況下、即當(dāng)判斷為產(chǎn)生了擁塞時,等待時間計算部11從到達實際時刻減去到達預(yù)測時刻來計算到達時間的差值(d)。而且,等待時間計算部11使用上述的式(I)來計算實效轉(zhuǎn)送速度(t),并且,使用上述的式(2)來計算數(shù)據(jù)包發(fā)送間隔(g)。另外,在比較的結(jié)果是計算出的到達預(yù)想時刻與到達實際時刻一致的情況下、即在未產(chǎn)生擁塞的情況下,例如數(shù)據(jù)包發(fā)送間隔(g)為g = O。
[0106]數(shù)據(jù)包發(fā)送電路113利用由等待時間計算部11計算出的數(shù)據(jù)包發(fā)送間隔(g)來進行數(shù)據(jù)包發(fā)送間隔(g)的更新(步驟MO)。
[0107]而且,發(fā)送控制部12將如上述那樣由等待時間計算部11計算出的數(shù)據(jù)包發(fā)送間隔(g)作為數(shù)據(jù)包間隔來依次發(fā)送數(shù)據(jù)包。
[0108]另外,在響應(yīng)數(shù)據(jù)包的數(shù)據(jù)包識別符m與發(fā)送中的消息不一致的情況(參照步驟B20的“否”路徑)、或響應(yīng)數(shù)據(jù)包的數(shù)據(jù)包識別符P未被記錄在數(shù)據(jù)包發(fā)送時刻表114的情況(參照步驟B30的“否”路徑)下,結(jié)束處理。
[0109]這樣,根據(jù)作為第一實施方式的一個例子的并行計算機系統(tǒng)1,計算出通信路徑中的數(shù)據(jù)包的實效轉(zhuǎn)送速度(t),并使用式(2)來計算數(shù)據(jù)包發(fā)送間隔(g)。而且,發(fā)送控制部12以該計算出的數(shù)據(jù)包發(fā)送間隔(g)來發(fā)送數(shù)據(jù)包。
[0110]由此,能夠根據(jù)通信路徑上的實際的吞吐量來依次發(fā)送數(shù)據(jù)包而消除擁塞。S卩,能夠高效地實現(xiàn)與通信路徑上的實效轉(zhuǎn)送速度(t)相符的擁塞控制,可高效地使用并行計算機系統(tǒng)I中的相互耦合網(wǎng)絡(luò)。
[0111]在該第一實施方式的并行計算機系統(tǒng)I中,使用到發(fā)送目的地(目的地)為止的通信路徑上的跳數(shù)(h)來預(yù)測沒有擁塞的情況下的響應(yīng)數(shù)據(jù)包的到達時刻,并測定實際的到達時刻與預(yù)測時刻的偏差。并且,根據(jù)到達時刻的偏差與到目的地為止的總緩沖器尺寸(hXB)來計算實效轉(zhuǎn)送速度(t),并使數(shù)據(jù)包的轉(zhuǎn)送速度下降到計算出的實效轉(zhuǎn)送速度。
[0112]在作為該第一實施方式的一個例子的并行計算機系統(tǒng)I的擁塞控制方式中,若成為擁塞被消除的狀態(tài)則響應(yīng)數(shù)據(jù)包的到達時刻與預(yù)測一致,發(fā)送源的計算節(jié)點100的數(shù)據(jù)轉(zhuǎn)送速度被提高而再次發(fā)生擁塞。即,通過將網(wǎng)絡(luò)的狀態(tài)維持在擁塞消除狀態(tài)與擁塞的影響范圍較窄的狀態(tài)之間,具有不降低網(wǎng)絡(luò)(通信網(wǎng))的利用效率的效果。另外,與不進行擁塞控制的情況相比,還具有防止擁塞的影響范圍擴大的效果。
[0113]另外,根據(jù)作為該第一實施方式的一個例子的并行計算機系統(tǒng)I中的擁塞控制方式,無需例如在路由器等中繼裝置中檢測擁塞并通知給發(fā)送源的計算節(jié)點100那樣的復(fù)雜機構(gòu)。即,還具有能夠減少導(dǎo)入成本、運用成本的效果。
[0114]其中,本技術(shù)適用于進行數(shù)據(jù)包的無損轉(zhuǎn)送的網(wǎng)絡(luò)。
[0115](B)第二實施方式
[0116]圖7是示意性地表示作為第二實施方式的一個例子的并行計算機系統(tǒng)I所具備的相互耦合網(wǎng)絡(luò)接口的功能結(jié)構(gòu)的圖。
[0117]作為該第二實施方式的一個例子的并行計算機系統(tǒng)I具備圖2以及圖3所示的、與第一實施方式的并行計算機系統(tǒng)I相同的硬件結(jié)構(gòu),由相互耦合網(wǎng)絡(luò)構(gòu)成。
[0118]而且,如圖7所示,作為第二實施方式的一個例子的并行計算機系統(tǒng)I代替第一實施方式的等待時間計算部11而具備限制尺寸計算部13。另外,作為本第二實施方式的一個例子的并行計算機系統(tǒng)I代替第一實施方式的數(shù)據(jù)包發(fā)送時刻表114而具備發(fā)送數(shù)據(jù)管理信息保持部116。
[0119]并且,在作為該第二實施方式的一個例子的并行計算機系統(tǒng)I中,發(fā)送控制部12通過按照響應(yīng)數(shù)據(jù)包未到達的發(fā)送數(shù)據(jù)包的總數(shù)據(jù)量成為窗口尺寸w (限制尺寸)以下的方式進行控制的窗口控制來進行數(shù)據(jù)包的發(fā)送。
[0120]而且,這些以外的部分與第一實施方式的并行計算機系統(tǒng)I同樣構(gòu)成。其中,由于在圖中與已敘述的符號相同的符號表示相同或大致相同的部分,所以適當(dāng)?shù)厥÷云湓敿毜恼f明。
[0121]在發(fā)送控制部12中,在發(fā)送源的計算節(jié)點100中進行將未返回響應(yīng)數(shù)據(jù)包的數(shù)據(jù)量保持為一定以下的窗口控制。具體而言,在未返回響應(yīng)數(shù)據(jù)包的發(fā)送數(shù)據(jù)包的總數(shù)據(jù)量超過窗口尺寸(《)的情況下,發(fā)送控制部12停止數(shù)據(jù)包發(fā)送。
[0122]另外,在數(shù)據(jù)包發(fā)送電路113中,在發(fā)送數(shù)據(jù)包的規(guī)定位置記錄數(shù)據(jù)包發(fā)送時刻。記錄于該發(fā)送數(shù)據(jù)包的數(shù)據(jù)包發(fā)送時刻也被儲存到與該發(fā)送數(shù)據(jù)包對應(yīng)地從發(fā)送目的地的計算節(jié)點100發(fā)送的響應(yīng)數(shù)據(jù)包。由此,能夠測定從發(fā)送數(shù)據(jù)包被發(fā)送起到返回響應(yīng)數(shù)據(jù)包為止的時間即往返時間。
[0123]發(fā)送數(shù)據(jù)管理信息保持部116是保持與由數(shù)據(jù)包發(fā)送電路113發(fā)送的各數(shù)據(jù)包中的響應(yīng)數(shù)據(jù)包沒有到達的數(shù)據(jù)包相關(guān)的信息的存儲器等保持部。
[0124]具體而言,發(fā)送數(shù)據(jù)管理信息保持部116所保持的發(fā)送數(shù)據(jù)管理信息中包含與由數(shù)據(jù)包發(fā)送電路113發(fā)送出的各數(shù)據(jù)包中的響應(yīng)數(shù)據(jù)包沒有到達的數(shù)據(jù)包相關(guān)的消息識別符m和數(shù)據(jù)尺寸。而且,發(fā)送數(shù)據(jù)管理信息中包含由數(shù)據(jù)包發(fā)送電路113發(fā)送出的各數(shù)據(jù)包中的響應(yīng)數(shù)據(jù)包沒有到達的數(shù)據(jù)包的數(shù)據(jù)尺寸的總量(未響應(yīng)數(shù)據(jù)量)。
[0125]限制尺寸計算部13根據(jù)形成該并行計算機系統(tǒng)I的相互耦合網(wǎng)絡(luò)的結(jié)構(gòu)來計算預(yù)想的到達預(yù)測時刻。
[0126]具體而言,若由數(shù)據(jù)包接收電路112接收到響應(yīng)數(shù)據(jù)包,則限制尺寸計算部13讀出被記錄于該響應(yīng)數(shù)據(jù)包的數(shù)據(jù)包發(fā)送時刻。并且,限制尺寸計算部13從構(gòu)成信息保持部115中讀出表示在通信路徑中數(shù)據(jù)包通過了的路由器等中繼裝置的個數(shù)的跳數(shù)(h)和每I跳的轉(zhuǎn)送延遲量(D),并計算出將它們相乘后的值(hXD)。
[0127]而且,限制尺寸計算部13通過對從響應(yīng)數(shù)據(jù)包讀出的數(shù)據(jù)包發(fā)送時刻加上計算出的(h X D ),來求出到達預(yù)測時刻。
[0128]另外,限制尺寸計算部13對計算出的到達預(yù)測時刻和響應(yīng)數(shù)據(jù)包實際上到達的時刻(到達實際時刻)進行比較。在到達實際時刻與計算出的到達預(yù)想時刻相比晚的情況下,限制尺寸計算部13進一步從到達實際時刻減去到達預(yù)測時刻來計算出到達時間的差值⑷。
[0129]并且,限制尺寸計算部13使用該計算出的差值(d)、和從構(gòu)成信息保持部115讀出的跳數(shù)(h)以及每I跳的路由器緩沖器量(B),來近似地計算出通信路徑中的數(shù)據(jù)包的實效轉(zhuǎn)送速度(t)。即,限制尺寸計算部13與第一實施方式的等待時間計算部11同樣地使用上述的式(I)來計算實效轉(zhuǎn)送速度(t)。
[0130]而且,限制尺寸計算部13為了將計算出的實效轉(zhuǎn)送速度(t)作為以后的數(shù)據(jù)發(fā)送速度而使用以下的式(3)來計算窗口尺寸(W)。
[0131]w = 2XhXDXt...(3)
[0132]此外,限制尺寸計算部13也可以將計算出的窗口尺寸(W)儲存到未圖示的存儲器
坐寸O
[0133]另外,在作為該第二實施方式的一個例子的并行計算機系統(tǒng)I中,將窗口尺寸(W)的初始值設(shè)為w = 2XhXDXT。
[0134]該窗口尺寸w = 2 X h X D X T是用于在沒有擁塞的狀態(tài)下得到實效轉(zhuǎn)送速度(T )的值,表示窗口尺寸(w)的最大值。另外,2XhXD相當(dāng)于數(shù)據(jù)通信路徑中的往復(fù)傳輸延遲時間。
[0135]若在通信路徑上產(chǎn)生擁塞,則實效轉(zhuǎn)送速度(t)降低。在該并行計算機系統(tǒng)I中,隨著該實效轉(zhuǎn)送速度(t)的降低,窗口尺寸(W)變小。若窗口尺寸(W)變小則通過窗口控制來抑制數(shù)據(jù)包的發(fā)送。由此,未響應(yīng)數(shù)據(jù)量減小,通信路徑上的延遲(擁塞)被消除。若通信路徑上的擁塞被消除,則實效轉(zhuǎn)送速度(t)變大,窗口尺寸(W)變大。若窗口尺寸(W)變大則能夠發(fā)送的數(shù)據(jù)包數(shù)量也增多。
[0136]其中,作為上述的等待限制尺寸計算部13、發(fā)送控制部12的各功能可以通過電子電路來實現(xiàn),另外,也可以通過未圖示的處理器執(zhí)行程序來實現(xiàn)。
[0137]根據(jù)圖8所示的流程圖(步驟ClO?C40)對如上述那樣構(gòu)成的作為第二實施方式的一個例子的并行計算機系統(tǒng)I中的消息發(fā)送時的處理進行說明。
[0138]若消息的發(fā)送源的計算節(jié)點100 (發(fā)送節(jié)點)的數(shù)據(jù)包發(fā)送電路113開始消息的發(fā)送處理,則數(shù)據(jù)包發(fā)送電路113首先通過對窗口尺寸(w)設(shè)定w = 2XhXDXT來進行初始化(步驟C10)。
[0139]發(fā)送控制部12參照發(fā)送數(shù)據(jù)管理信息保持部116的發(fā)送數(shù)據(jù)管理信息,來確認(rèn)未響應(yīng)數(shù)據(jù)量是否是窗口尺寸(w)以上(步驟C20)。在未響應(yīng)數(shù)據(jù)量是窗口尺寸(w)以上的情況下(參照步驟C20的“是”路徑),進行等待直至未響應(yīng)數(shù)據(jù)量低于窗口尺寸(w)為止。
[0140]在未響應(yīng)數(shù)據(jù)量小于窗口尺寸(W)的情況下(參照步驟C20的“否”路徑),發(fā)送控制部12進行數(shù)據(jù)包的發(fā)送(步驟C30)。另外,對該發(fā)送的數(shù)據(jù)包附加消息識別符m、數(shù)據(jù)包識別符P。另外,數(shù)據(jù)包發(fā)送電路113隨著該數(shù)據(jù)包發(fā)送,進行發(fā)送數(shù)據(jù)管理信息保持部116的發(fā)送數(shù)據(jù)管理信息的更新。具體而言,登記發(fā)送出的數(shù)據(jù)包的消息識別符m、將發(fā)送出的數(shù)據(jù)包的數(shù)據(jù)尺寸加到未響應(yīng)數(shù)據(jù)量。
[0141]數(shù)據(jù)包發(fā)送電路113確認(rèn)形成消息的所有數(shù)據(jù)包的發(fā)送是否完成(步驟C40)。在未完成所有數(shù)據(jù)包的發(fā)送的情況下(參照步驟C40的“否”路徑),返回到步驟C20。另外,在所有數(shù)據(jù)包的發(fā)送完成了的情況下(參照步驟C40的“是”路徑),結(jié)束消息的發(fā)送處理。
[0142]接下來,根據(jù)圖9所示的流程圖(步驟DlO?D40)對作為本第二實施方式的一個例子的并行計算機系統(tǒng)I中的響應(yīng)數(shù)據(jù)包的接收時的處理進行說明。
[0143]在消息的發(fā)送源的計算節(jié)點100 (發(fā)送節(jié)點)中,進行是否接收到針對發(fā)送出的數(shù)據(jù)包的響應(yīng)數(shù)據(jù)包的確認(rèn)(步驟D10),在未接收到響應(yīng)數(shù)據(jù)包的情況下(參照步驟DlO的“否”路徑),結(jié)束處理。即,數(shù)據(jù)包接收電路112進行響應(yīng)數(shù)據(jù)包的接收等待。
[0144]在接收到響應(yīng)數(shù)據(jù)包的情況下(參照步驟DlO的“是”路徑),在數(shù)據(jù)包發(fā)送電路113中確認(rèn)響應(yīng)數(shù)據(jù)包的消息識別符m是否與記錄于發(fā)送數(shù)據(jù)管理信息保持部116的響應(yīng)數(shù)據(jù)包未到達的數(shù)據(jù)包的消息識別符m —致(步驟D20)。
[0145]在響應(yīng)數(shù)據(jù)包的數(shù)據(jù)包識別符m與發(fā)送中的消息一致的情況下(參照步驟D20的“是”路徑),數(shù)據(jù)包發(fā)送電路113更新發(fā)送數(shù)據(jù)管理信息保持部116的發(fā)送數(shù)據(jù)管理信息中的未響應(yīng)數(shù)據(jù)量(步驟D30)。即,從未響應(yīng)數(shù)據(jù)量中減去與接收到的響應(yīng)數(shù)據(jù)包對應(yīng)的發(fā)送數(shù)據(jù)包的數(shù)據(jù)尺寸。
[0146]另外,在數(shù)據(jù)包發(fā)送電路113中,限制尺寸計算部13讀出記錄于響應(yīng)數(shù)據(jù)包的數(shù)據(jù)包發(fā)送時刻,進行到達預(yù)想時刻的計算,并進行與該響應(yīng)數(shù)據(jù)包的接收時刻、即與到達實際時刻的比較。在該比較的結(jié)果是到達實際時刻與計算出的到達預(yù)想時刻相比晚的情況下,限制尺寸計算部13從到達實際時刻中減去到達預(yù)測時刻來計算到達時間的差值(d)。而且,限制尺寸計算部13使用上述的式(I)來計算實效轉(zhuǎn)送速度(t),并且,使用上述的式
(3)來計算窗口尺寸(W)。
[0147]數(shù)據(jù)包發(fā)送電路113利用由限制尺寸計算部13計算出的窗口尺寸(W),來進行窗口尺寸(w)的更新(步驟D40),然后結(jié)束處理。
[0148]另外,在響應(yīng)數(shù)據(jù)包的數(shù)據(jù)包識別符m與發(fā)送中的消息不一致的情況(參照步驟D20的“否”路徑)下,也結(jié)束處理。
[0149]這樣,在作為第二實施方式的一個例子的并行計算機系統(tǒng)I中,也能夠得到與第一實施方式相同的作用效果。
[0150]S卩,計算出通信路徑中的數(shù)據(jù)包的實效轉(zhuǎn)送速度(t),并使用式(3)來計算窗口尺寸(W)。而且,發(fā)送控制部12使用該計算出的窗口尺寸(W)來進行伴隨窗口控制的數(shù)據(jù)包發(fā)送。
[0151]由此,能夠根據(jù)通信路徑上的實際的吞吐量來發(fā)送數(shù)據(jù)包,消除擁塞。即,能夠?qū)崿F(xiàn)與通信路徑上的實效轉(zhuǎn)送速度(t)相符的擁塞控制,可高效地使用并行計算機系統(tǒng)I中的相互耦合網(wǎng)絡(luò)。
[0152]在本第二實施方式的并行計算機系統(tǒng)I中,也與第一實施方式同樣,使用到發(fā)送目的地(目的地)為止的通信路徑上的跳數(shù)(h)來預(yù)測沒有擁塞的情況下的響應(yīng)數(shù)據(jù)包的到達時刻,并測定實際的到達時刻與預(yù)測時刻的偏差。并且,根據(jù)到達時刻的偏差和到目的地為止的總緩沖器尺寸(hXB)來推斷實效轉(zhuǎn)送速度(t),并將數(shù)據(jù)包的轉(zhuǎn)送速度下降到實效轉(zhuǎn)送速度。
[0153]在作為該第二實施方式的一個例子的并行計算機系統(tǒng)I的擁塞控制方式中,也與第一實施方式同樣,通過將網(wǎng)絡(luò)的狀態(tài)維持在擁塞消除狀態(tài)與擁塞的影響范圍較窄的狀態(tài)之間,具有不降低網(wǎng)絡(luò)的利用效率的效果。另外,與不進行擁塞控制的情況相比,還具有防止擁塞的影響范圍擴大的效果。
[0154]另外,根據(jù)作為該第二實施方式的一個例子的并行計算機系統(tǒng)I中的擁塞控制方式,無需例如在路由器等中繼裝置中檢測擁塞并通知給發(fā)送源的計算節(jié)點100那樣的復(fù)雜機構(gòu)。即,還具有減少導(dǎo)入成本、運用成本的效果。
[0155]此外,本技術(shù)適用于進行數(shù)據(jù)包的無損轉(zhuǎn)送的網(wǎng)絡(luò)。
[0156](C)第一實施方式的變形例
[0157]在上述的第一實施方式中,等待時間計算部11基于通信路徑上的跳數(shù)(h)來計算實效轉(zhuǎn)送速度(t),但在本變形例中,基于通信路徑上的產(chǎn)生了擁塞的路由器20 (以下稱為擁塞路由器20)的個數(shù)來計算實效轉(zhuǎn)送速度(t)。
[0158]在該第一實施方式的變形例中,在數(shù)據(jù)包內(nèi)追加擁塞路由器通過次數(shù)c作為新的字段。該擁塞路由器通過次數(shù)c是每次通過擁塞路由器20時,由該擁塞路由器20自加I的計數(shù)器值。該擁塞路由器通過次數(shù)c例如一般能夠通過路由器20挪用作為向終端節(jié)點通知網(wǎng)絡(luò)的擁塞狀態(tài)的擁塞信息通知功能而使用的ECN(Explicit Congestion Notification:顯式擁塞通知)的字段來容易地實現(xiàn)。
[0159]S卩,在路由器20等中繼裝置中,代替在ECN字段中設(shè)立位(bit)而安裝進行擁塞路由器通過次數(shù)c的自加I的功能。具體而言,在路由器20中,當(dāng)轉(zhuǎn)送數(shù)據(jù)包時,在緩沖器211、212中產(chǎn)生了等待的情況下,被記錄在數(shù)據(jù)包內(nèi)的擁塞路由器通過次數(shù)c加上I。此外,使數(shù)據(jù)包內(nèi)的特定的值自加I的方法能夠使用已知的各種方法來實現(xiàn)。
[0160]另外,在發(fā)送源的計算節(jié)點100中,當(dāng)從數(shù)據(jù)包發(fā)送電路113發(fā)出數(shù)據(jù)包時,將該擁塞路由器通過次數(shù)c初始化為O。
[0161]并且,在發(fā)送目的地的計算節(jié)點100中,向針對接收到的發(fā)送數(shù)據(jù)包的響應(yīng)數(shù)據(jù)包復(fù)寫擁塞路由器通過次數(shù)C,返回包含該擁塞路由器通過次數(shù)c的響應(yīng)數(shù)據(jù)包。
[0162]而且,在發(fā)送源的計算節(jié)點100中,使用記錄于響應(yīng)數(shù)據(jù)包的擁塞路由器通過次數(shù)c來計算實效轉(zhuǎn)送速度(t)以及數(shù)據(jù)包發(fā)送間隔(g)。
[0163]S卩,等待時間計算部11對計算出的到達預(yù)測時刻與響應(yīng)數(shù)據(jù)包實際上到達的時亥IJ(到達實際時刻)進行比較,在到達實際時刻與計算出的到達預(yù)想時刻相比晚的情況下,進一步從到達實際時刻中減去到達預(yù)測時刻來計算到達時間的差值(d)。
[0164]而且,等待時間計算部11使用該計算出的差值(d)、從響應(yīng)數(shù)據(jù)包讀出的擁塞路由器通過次數(shù)c以及每I跳的路由器緩沖器量(B),來近似地計算通信路徑中的數(shù)據(jù)包的實效轉(zhuǎn)送速度(t)。
[0165]在本變形例中,判斷為數(shù)據(jù)包的通信路徑上的擁塞路由器20的緩沖器是耗盡的狀態(tài),并認(rèn)為到發(fā)送目的地為止的通信路徑上的擁塞路由器20的緩沖器是被數(shù)據(jù)包裝滿的狀態(tài)。即,假定為以時間d轉(zhuǎn)送與擁塞路由器20的總緩沖器尺寸cXB相當(dāng)?shù)臄?shù)據(jù)量,使用以下的式(4)來計算實效轉(zhuǎn)送速度(t)。
[0166]t = cXB / d...(4)[0167]而且,等待時間計算部11為了將計算出的實效轉(zhuǎn)送速度(t)作為以后的數(shù)據(jù)發(fā)送速度而使用上述的式(2)來計算數(shù)據(jù)包發(fā)送間隔(g)。
[0168]這樣,根據(jù)作為第一實施方式的變形例的一個例子的并行計算機系統(tǒng)1,除了能夠得到與上述的第一實施方式相同的作用效果以外,通過基于實際產(chǎn)生了擁塞的中繼裝置的個數(shù)來計算實效轉(zhuǎn)送速度(t),還能夠計算出與并行計算機系統(tǒng)I的狀態(tài)相符的數(shù)據(jù)包發(fā)送間隔(g)而提高可靠性。
[0169](D)第二實施方式的變形例
[0170]在上述的第二實施方式中,限制尺寸計算部13基于通信路徑上的跳數(shù)(h)來計算實效轉(zhuǎn)送速度(t),但在本第二實施方式的變形例中,也與第一實施方式的變形例同樣地基于通信路徑上的擁塞路由器20的個數(shù)來計算實效轉(zhuǎn)送速度(t)。
[0171]g卩,在該第二實施方式的變形例中,也與第一實施方式的變形例相同,在數(shù)據(jù)包內(nèi)追加擁塞路由器通過次數(shù)c作為新的字段,每次通過擁塞路由器20,該擁塞路由器通過次數(shù)c在該擁塞路由器20中被自力口 I。
[0172]另外,在發(fā)送源的計算節(jié)點100中,當(dāng)從數(shù)據(jù)包發(fā)送電路113發(fā)出數(shù)據(jù)包時,將該擁塞路由器通過次數(shù)c初始化為O。
[0173]并且,在發(fā)送源的計算節(jié)點100中,對針對接收到的發(fā)送數(shù)據(jù)包的響應(yīng)數(shù)據(jù)包復(fù)寫擁塞路由器通過次數(shù)C,返回包含該擁塞路由器通過次數(shù)c的響應(yīng)數(shù)據(jù)包。
[0174]而且,在發(fā)送源的計算節(jié)點100中,使用被記錄于響應(yīng)數(shù)據(jù)包的擁塞路由器通過次數(shù)C,來計算實效轉(zhuǎn)送速度(t)以及數(shù)據(jù)包發(fā)送間隔(g)。
[0175]即,限制尺寸計算部13對計算出的到達預(yù)測時刻與響應(yīng)數(shù)據(jù)包實際上到達的時亥IJ(到達實際時刻)進行比較,在到達實際時刻與計算出的到達預(yù)想時刻相比晚的情況下,進一步從到達實際時刻中減去到達預(yù)測時刻來計算到達時間的差值(d)。
[0176]而且,限制尺寸計算部13使用該計算出的差值(d)、和從響應(yīng)數(shù)據(jù)包讀出的擁塞路由器通過次數(shù)c以及每I跳的路由器緩沖器量(B),來近似地計算通信路徑中的數(shù)據(jù)包的實效轉(zhuǎn)送速度(t)。
[0177]在本變形例中,限制尺寸計算部13也使用上述的式(4)來計算實效轉(zhuǎn)送速度(t)。
[0178]而且,限制尺寸計算部13為了將計算出的實效轉(zhuǎn)送速度(t)作為以后的數(shù)據(jù)發(fā)送速度而使用上述的式(3)來計算窗口尺寸(W)。
[0179]這樣,根據(jù)作為第二實施方式的變形例的一個例子的并行計算機系統(tǒng)1,除了能夠得到與上述的第二實施方式相同的作用效果以外,通過基于實際產(chǎn)生了擁塞的路由器20的個數(shù)來計算實效轉(zhuǎn)送速度(t),還能夠計算與并行計算機系統(tǒng)I的狀態(tài)相符的數(shù)據(jù)包發(fā)送間隔(g)而提高可靠性。
[0180](E)其他
[0181]而且,本發(fā)明并不限于上述的實施方式,在不脫離本發(fā)明主旨的范圍內(nèi)能夠進行各種變形來實施。
[0182]例如,在上述的各實施方式以及變形例中,并行計算機系統(tǒng)I構(gòu)成為具備4臺計算節(jié)點100和2臺路由器20的相互耦合網(wǎng)絡(luò),但并不限于此。即,在相互耦合網(wǎng)絡(luò)中,也可以具備3臺以下或5臺以上的計算節(jié)點100,另外,也可以具備3臺以上的路由器20。并且,也可以具備開關(guān)、中繼器等路由器20以外的中繼裝置。另外,在具備3臺以上的路由器20等來構(gòu)成相互耦合網(wǎng)絡(luò)的情況下,這些中繼裝置、計算節(jié)點100的連接方式能夠適當(dāng)?shù)刈兏鼇韺嵤?br>
[0183]另外,在上述的第一實施方式以及其變形例中,具備數(shù)據(jù)包發(fā)送時刻表114,通過參照該數(shù)據(jù)包發(fā)送時刻表114來實現(xiàn)往返時間的測定,但并不限于此。SM列如也可以與第二實施方式的并行計算機系統(tǒng)I同樣,在數(shù)據(jù)包發(fā)送電路113中通過在發(fā)送數(shù)據(jù)包的規(guī)定位置記錄數(shù)據(jù)包發(fā)送時刻來實現(xiàn)往返時間的測定。
[0184]同樣,在上述的第二實施方式及其變形例中,在數(shù)據(jù)包發(fā)送電路113中通過在發(fā)送數(shù)據(jù)包的規(guī)定位置記錄數(shù)據(jù)包發(fā)送時刻,實現(xiàn)了往返時間的測定,但并不限于此。即,例如也可以與第一實施方式的并行計算機系統(tǒng)I同樣地具備數(shù)據(jù)包發(fā)送時刻表114。
[0185]另外,在上述的各實施方式及其變形例中,測定實際的到達時刻與預(yù)測時刻的偏差,在檢測出擁塞產(chǎn)生時,為了使數(shù)據(jù)包的轉(zhuǎn)送速度符合實效轉(zhuǎn)送速度而決定、更新數(shù)據(jù)包發(fā)送間隔(g)、窗口尺寸(W),但并不限于此。例如,也可以在檢測出擁塞產(chǎn)生時暫時以規(guī)定期間抑制數(shù)據(jù)包發(fā)送,然后為了使數(shù)據(jù)包的轉(zhuǎn)送速度符合實效轉(zhuǎn)送速度而決定、更新數(shù)據(jù)包發(fā)送間隔(g)、窗口尺寸(W)。
[0186]在檢測出擁塞產(chǎn)生時,通過暫時以規(guī)定期間抑制數(shù)據(jù)包發(fā)送,能夠盡早消除擁塞。而且,之后通過為了使數(shù)據(jù)包的轉(zhuǎn)送速度符合實效轉(zhuǎn)送速度而決定、更新數(shù)據(jù)包發(fā)送間隔(g)、窗口尺寸(W),能夠高效地進行數(shù)據(jù)包的發(fā)送。
[0187]附圖標(biāo)記說明:1…并行計算機系統(tǒng)(計算機系統(tǒng));11…等待時間計算部(發(fā)送間隔計算部);12…發(fā)送控制部;13...限制尺寸計算部;20、20 - 1,20 一 2…路由器(中繼裝置);21…收發(fā)緩沖器;22…交叉開關(guān);100、100 — UlOO — 2,100 — 3,100 — 4…計算節(jié)點;110…相互耦合網(wǎng)絡(luò)接口(發(fā)送裝置);11L...處理器;112…數(shù)據(jù)包接收電路;113…數(shù)據(jù)包發(fā)送電路;114…數(shù)據(jù)包發(fā)送時刻表;115…構(gòu)成信息保持部;116…發(fā)送數(shù)據(jù)管理信息保持部;211、212…緩沖器;P1~ P4…端口。
【權(quán)利要求】
1.一種數(shù)據(jù)通信裝置,是經(jīng)由中繼裝置向其他數(shù)據(jù)通信裝置發(fā)送數(shù)據(jù)的數(shù)據(jù)通信裝置,其特征在于,具有: 發(fā)送間隔計算部,其基于到達實際時刻與到達預(yù)測時刻的差值、和所述數(shù)據(jù)的通信路徑上的中繼裝置的緩沖器尺寸,來計算所述數(shù)據(jù)的實效轉(zhuǎn)送速度,并基于所述計算出的實效轉(zhuǎn)送速度來計算發(fā)送數(shù)據(jù)間的發(fā)送間隔,其中,所述到達實際時刻是針對向所述其他數(shù)據(jù)通信裝置發(fā)送出的發(fā)送數(shù)據(jù)的響應(yīng)數(shù)據(jù)所到達的時刻,所述到達預(yù)測時刻是對從所述其他數(shù)據(jù)通信裝置發(fā)送出的響應(yīng)數(shù)據(jù)到達所述數(shù)據(jù)通信裝置為止所經(jīng)過的中繼裝置的個數(shù)乘以經(jīng)過一個中繼裝置時所需要的轉(zhuǎn)送延遲時間而計算出的時刻;和 發(fā)送控制部,其基于所述計算出的發(fā)送間隔來進行發(fā)送數(shù)據(jù)的發(fā)送控制。
2.根據(jù)權(quán)利要求1所述的數(shù)據(jù)通信裝置,其特征在于, 所述發(fā)送間隔計算部計算出從將所述數(shù)據(jù)的數(shù)據(jù)長度除以所述實效轉(zhuǎn)送速度而得到的值中減去將所述數(shù)據(jù)長度除以未產(chǎn)生擁塞的情況下的實效數(shù)據(jù)轉(zhuǎn)送速度而得到的值后的值作為所述發(fā)送間隔。
3.一種數(shù)據(jù)通信裝置,是經(jīng)由中繼裝置向其他數(shù)據(jù)通信裝置發(fā)送數(shù)據(jù)的數(shù)據(jù)通信裝置,其特征在于,具有: 發(fā)送控制部,其按照將針對向所述其他數(shù)據(jù)通信裝置發(fā)送出的發(fā)送數(shù)據(jù)的響應(yīng)數(shù)據(jù)未到達的發(fā)送數(shù)據(jù)的數(shù) 據(jù)量相加而得到的總數(shù)據(jù)量為限制尺寸以下的方式進行數(shù)據(jù)的發(fā)送;和 限制尺寸計算部,其基于到達實際時刻與到達預(yù)測時刻的差值、和所述數(shù)據(jù)的通信路徑上的中繼裝置的緩沖器尺寸,來計算所述數(shù)據(jù)的實效轉(zhuǎn)送速度,并基于所述計算出的實效轉(zhuǎn)送速度來計算所述限制尺寸,其中,所述到達實際時刻是針對向所述其他數(shù)據(jù)通信裝置發(fā)送出的發(fā)送數(shù)據(jù)的響應(yīng)數(shù)據(jù)所到達的時刻,所述到達預(yù)測時刻是對從所述其他數(shù)據(jù)通信裝置發(fā)送出的響應(yīng)數(shù)據(jù)到達所述數(shù)據(jù)通信裝置為止所經(jīng)過的中繼裝置的個數(shù)乘以經(jīng)過一個中繼裝置時所需要的轉(zhuǎn)送延遲時間而計算出的時刻。
4.根據(jù)權(quán)利要求3所述的數(shù)據(jù)通信裝置,其特征在于, 設(shè)定對往復(fù)傳輸延遲時間乘以未產(chǎn)生擁塞的情況下的實效數(shù)據(jù)轉(zhuǎn)送速度而計算出的值作為所述限制尺寸的初始值,其中,該往復(fù)傳輸延遲時間通過對所述響應(yīng)數(shù)據(jù)到達為止所經(jīng)過的中繼裝置的個數(shù)乘以經(jīng)過一個中繼裝置時所需要的轉(zhuǎn)送延遲時間而得到的值并將該得到的值乘以2倍來計算。
5.根據(jù)權(quán)利要求4所述的數(shù)據(jù)通信裝置,其特征在于, 所述限制尺寸計算部計算出通過對所述往復(fù)傳輸延遲時間乘以所述實效轉(zhuǎn)送速度而計算出的值作為所述限制尺寸。
6.一種數(shù)據(jù)發(fā)送方法,是經(jīng)由中繼裝置發(fā)送數(shù)據(jù)的數(shù)據(jù)發(fā)送方法,其特征在于, 計算機基于到達實際時刻與到達預(yù)測時刻的差值、和所述數(shù)據(jù)的通信路徑上的所述中繼裝置的緩沖器尺寸,來計算所述數(shù)據(jù)的實效轉(zhuǎn)送速度,其中,所述到達實際時刻是針對發(fā)送出的發(fā)送數(shù)據(jù)的響應(yīng)數(shù)據(jù)所到達的時刻,所述到達預(yù)測時刻是對所述響應(yīng)數(shù)據(jù)到達為止所經(jīng)過的中繼裝置的個數(shù)乘以經(jīng)過一個中繼裝置時所需要的轉(zhuǎn)送延遲時間而計算出的時刻, 基于所述計算出的實效轉(zhuǎn)送速度來計算發(fā)送數(shù)據(jù)間的發(fā)送間隔,基于所述計算出的發(fā)送間隔來進行發(fā)送數(shù)據(jù)的發(fā)送控制。
7.根據(jù)權(quán)利要求6所述的數(shù)據(jù)發(fā)送方法,其特征在于, 計算出從將所述數(shù)據(jù)的數(shù)據(jù)長度除以所述實效轉(zhuǎn)送速度而得到的值中減去將所述數(shù)據(jù)長度除以未產(chǎn)生擁塞的情況下的實效數(shù)據(jù)轉(zhuǎn)送速度而得到的值后的值作為所述發(fā)送間隔。
8.一種數(shù)據(jù)發(fā)送方法,是經(jīng)由中繼裝置向其他數(shù)據(jù)通信裝置發(fā)送數(shù)據(jù)的數(shù)據(jù)發(fā)送方法,其特征在于, 基于到達實際時刻與到達預(yù)測時刻的差值、和所述數(shù)據(jù)的通信路徑上的所述中繼裝置的緩沖器尺寸,來計算所述數(shù)據(jù)的實效轉(zhuǎn)送速度,其中,所述到達實際時刻是針對向所述其他數(shù)據(jù)通信裝置發(fā)送出的發(fā)送數(shù)據(jù)的響應(yīng)數(shù)據(jù)所到達的時刻,所述到達預(yù)測時刻是對從所述其他數(shù)據(jù)通信裝置發(fā)送出的響應(yīng)數(shù)據(jù)到達所述數(shù)據(jù)通信裝置為止所經(jīng)過的中繼裝置的個數(shù)乘以經(jīng)過一個中繼裝置時所需要的轉(zhuǎn)送延遲時間而計算出的時刻, 基于所述計算出的實效轉(zhuǎn)送速度來計算限制尺寸, 按照將針對向所述其他數(shù)據(jù)通信裝置發(fā)送出的發(fā)送數(shù)據(jù)的響應(yīng)數(shù)據(jù)未到達的發(fā)送數(shù)據(jù)的數(shù)據(jù)量相加而得到的總數(shù)據(jù)量為所述限制尺寸以下的方式來進行數(shù)據(jù)的發(fā)送。
9.根據(jù)權(quán)利要求8所述的數(shù)據(jù)發(fā)送方法,其特征在于, 設(shè)定對往復(fù)傳輸 延遲時間乘以未產(chǎn)生擁塞的情況下的實效數(shù)據(jù)轉(zhuǎn)送速度而計算出的值作為所述限制尺寸的初始值,其中,該往復(fù)傳輸延遲時間通過對所述響應(yīng)數(shù)據(jù)到達為止所經(jīng)過的中繼裝置的個數(shù)乘以經(jīng)過一個中繼裝置時所需要的轉(zhuǎn)送延遲時間而得到的值并將該得到的值乘以2倍來計算。
10.根據(jù)權(quán)利要求9所述的數(shù)據(jù)發(fā)送方法,其特征在于, 計算出通過對所述往復(fù)傳輸延遲時間乘以所述實效轉(zhuǎn)送速度而計算出的值作為所述限制尺寸。
11.一種計算機系統(tǒng),具備:具有多個中繼裝置的通信網(wǎng)、和經(jīng)由該通信網(wǎng)進行數(shù)據(jù)的收發(fā)的多個計算節(jié)點,其特征在于, 所述計算機節(jié)點具有: 發(fā)送間隔計算部,其基于到達實際時刻與到達預(yù)測時刻的差值、和所述數(shù)據(jù)的通信路徑上的中繼裝置的緩沖器尺寸,來計算所述數(shù)據(jù)的實效轉(zhuǎn)送速度,并基于所述計算出的實效轉(zhuǎn)送速度來計算發(fā)送數(shù)據(jù)間的發(fā)送間隔,其中,所述到達實際時刻是針對向所述其他計算節(jié)點發(fā)送出的發(fā)送數(shù)據(jù)的響應(yīng)數(shù)據(jù)所到達的時刻,所述到達預(yù)測時刻是對從所述其他計算節(jié)點發(fā)送出的響應(yīng)數(shù)據(jù)到達所述計算節(jié)點為止所經(jīng)過的中繼裝置的個數(shù)乘以經(jīng)過一個中繼裝置時所需要的轉(zhuǎn)送延遲時間而計算出的時刻;和 發(fā)送控制部,其基于所述計算出的發(fā)送間隔來進行發(fā)送數(shù)據(jù)的發(fā)送控制。
12.根據(jù)權(quán)利要求11所述的計算機系統(tǒng),其特征在于, 所述發(fā)送間隔計算部計算出從將所述數(shù)據(jù)的數(shù)據(jù)長度除以所述實效轉(zhuǎn)送速度而得到的值中減去將所述數(shù)據(jù)長度除以在未產(chǎn)生擁塞的情況下的實效數(shù)據(jù)轉(zhuǎn)送速度而得到的值后的值作為所述發(fā)送間隔。
13.一種計算機系統(tǒng),具備:具有中繼裝置的通信網(wǎng)、和經(jīng)由該通信網(wǎng)進行數(shù)據(jù)的收發(fā)的多個計算節(jié)點,其特征在于,所述計算機節(jié)點具有: 發(fā)送控制部,其按照將針對向所述其他計算節(jié)點發(fā)送出的發(fā)送數(shù)據(jù)的響應(yīng)數(shù)據(jù)未到達的發(fā)送數(shù)據(jù)的數(shù)據(jù)量相加而得到的總數(shù)據(jù)量為限制尺寸以下的方式進行數(shù)據(jù)的發(fā)送;和
限制尺寸計算部,其基于到達實際時刻與到達預(yù)測時刻的差值、和所述數(shù)據(jù)的通信路徑上的中繼裝置的緩沖器尺寸,來計算所述數(shù)據(jù)的實效轉(zhuǎn)送速度,并基于所述計算出的實效轉(zhuǎn)送速度來計算所述限制尺寸,其中,所述到達實際時刻是針對向所述其他計算節(jié)點發(fā)送出的發(fā)送數(shù)據(jù)的響應(yīng)數(shù)據(jù)所到達的時刻,所述到達預(yù)測時刻是對從所述其他計算節(jié)點發(fā)送出的響應(yīng)數(shù)據(jù)到達所述計算節(jié)點為止所經(jīng)過的中繼裝置的個數(shù)乘以經(jīng)過一個中繼裝置時所需要的轉(zhuǎn)送延遲時間而計算出的時刻。
14.根據(jù)權(quán)利要求13所述的計算機系統(tǒng),其特征在于, 設(shè)定對往復(fù)傳輸延遲時間乘以未產(chǎn)生擁塞的情況下的實效數(shù)據(jù)轉(zhuǎn)送速度而計算出的值作為所述限制尺寸的初始值,其中,該往復(fù)傳輸延遲時間通過對所述響應(yīng)數(shù)據(jù)到達為止所經(jīng)過的中繼裝置的個數(shù)乘以經(jīng)過一個中繼裝置時所需要的轉(zhuǎn)送延遲時間而得到的值并將該得到的值乘以2倍來計算。
15.根據(jù)權(quán)利要求14所述的計算機系統(tǒng),其特征在于, 所述限制尺寸計算部計算出通過對所述往復(fù)傳輸延遲時間乘以所述實效轉(zhuǎn)送速度而計算出的值作為所述限制尺寸。
【文檔編號】H04L29/08GK103814563SQ201180073556
【公開日】2014年5月21日 申請日期:2011年9月21日 優(yōu)先權(quán)日:2011年9月21日
【發(fā)明者】安島雄一郎, 井上智宏, 平本新哉 申請人:富士通株式會社