本公開涉及芯片對芯片(chip-to-chip)互連,并且尤其涉及利用分層通信架構(gòu)的芯片對芯片互連。
背景技術(shù):
1、數(shù)據(jù)中心是容納諸如計算系統(tǒng)、數(shù)據(jù)存儲系統(tǒng)以及其它相關(guān)聯(lián)部件等計算機系統(tǒng)和部件的設(shè)施?,F(xiàn)代應(yīng)用(例如對人工智能(artificial?intelligence,ai)模型的訓(xùn)練)推動了對數(shù)據(jù)中心的高網(wǎng)絡(luò)能力、存儲能力和計算能力的需求。經(jīng)常將大量處理單元連接以用于大規(guī)模計算任務(wù)。然而,這些處理單元經(jīng)常以涉及繁瑣的通信協(xié)議、和/或不會隨網(wǎng)絡(luò)速度增長而很好地擴縮(scale)的方式而被連接。因此,開發(fā)面向靈活且可擴縮的芯片對芯片互連的技術(shù)將是有益的。
2、本公開尋求至少部分地解決上述缺點和缺陷中的任何或全部缺點和缺陷。
技術(shù)實現(xiàn)思路
1、根據(jù)本公開的第一方面,提供了一種系統(tǒng),該系統(tǒng)包括:第一集成電路封裝,該第一集成電路封裝包括第一組一個或多個人工智能處理單元以及第一芯片對芯片互連通信單元;第二集成電路封裝,該第二集成電路封裝包括第二組一個或多個人工智能處理單元以及第二芯片對芯片互連通信單元;以及第一集成電路封裝與第二集成電路封裝之間的互連,其中,第一芯片對芯片互連通信單元和第二芯片對芯片互連通信單元使用支持基于信用的數(shù)據(jù)流控制以及重傳數(shù)據(jù)流控制的分層通信架構(gòu),經(jīng)由該互連來管理基于以太網(wǎng)的通信。
2、在一些實施例中,第一組一個或多個人工智能處理單元和第二組一個或多個人工智能處理單元可以被配置為處理人工智能工作負載,該人工智能工作負載包括訓(xùn)練一個或多個神經(jīng)網(wǎng)絡(luò)。
3、在一些實施例中,第一芯片對芯片互連通信單元和第二芯片對芯片互連通信單元可以包括被配置為支持物理層網(wǎng)絡(luò)通信協(xié)議的電子電路系統(tǒng)邏輯。
4、在一些實施例中,物理層網(wǎng)絡(luò)通信協(xié)議可以包括以太網(wǎng)通信協(xié)議。
5、在一些實施例中,第一芯片對芯片互連通信單元和第二芯片對芯片互連通信單元可以包括被配置為支持除物理層網(wǎng)絡(luò)通信協(xié)議之外的多個通信協(xié)議的電子電路系統(tǒng)邏輯。
6、在一些實施例中,第一芯片對芯片互連通信單元和第二芯片對芯片互連通信單元可以包括硬件緩沖區(qū),該硬件緩沖區(qū)被配置為存儲通信數(shù)據(jù)。
7、在一些實施例中,互連可以包括第一集成電路封裝與第二集成電路封裝之間的物理互連。
8、在一些實施例中,物理互連可以包括電線互連。
9、在一些實施例中,分層通信架構(gòu)可以包括應(yīng)用層。
10、在一些實施例中,分層通信架構(gòu)可以進一步包括物理網(wǎng)絡(luò)層。
11、在一些實施例中,分層通信架構(gòu)可以進一步包括可靠性層(reliability?layer)。
12、在一些實施例中,分層通信架構(gòu)可以進一步包括消息分發(fā)和重組層。
13、在一些實施例中,應(yīng)用層可以被配置為訪問高帶寬存儲器。
14、在一些實施例中,基于信用的數(shù)據(jù)流控制可以被配置為基于第一集成電路封裝的接收緩沖區(qū)大小和第二集成電路封裝的接收緩沖區(qū)大小,在第一集成電路封裝與第二集成電路封裝之間傳送信用限額。
15、在一些實施例中,基于信用的數(shù)據(jù)流控制可以被配置為傳送和存儲在第一集成電路封裝與第二集成電路封裝之間交換的數(shù)據(jù)包的計數(shù)。
16、在一些實施例中,重傳數(shù)據(jù)流控制可以被配置為確認接收到無誤數(shù)據(jù)包以及更新計數(shù)器,該計數(shù)器記錄接收到的無誤數(shù)據(jù)包的連續(xù)數(shù)量。
17、在一些實施例中,重傳數(shù)據(jù)流控制可以被配置為傳達接收到有誤數(shù)據(jù)包,以及使得重傳有誤數(shù)據(jù)包。
18、根據(jù)本公開的第二方面,提供了一種方法,該方法包括:配置第一集成電路封裝,該第一集成電路封裝包括第一組一個或多個人工智能處理單元以及第一芯片對芯片互連通信單元;配置第二集成電路封裝,該第二集成電路封裝包括第二組一個或多個人工智能處理單元以及第二芯片對芯片互連通信單元;以及建立第一集成電路封裝與第二集成電路封裝之間的互連,其中,第一芯片對芯片互連通信單元和第二芯片對芯片互連通信單元使用支持基于信用的數(shù)據(jù)流控制以及重傳數(shù)據(jù)流控制的分層通信架構(gòu),經(jīng)由該互連來管理基于以太網(wǎng)的通信。
19、根據(jù)本公開的第三方面,提供了一種系統(tǒng),該系統(tǒng)包括:第一集成電路封裝,該第一集成電路封裝包括第一組一個或多個人工智能處理單元以及第一芯片對芯片互連通信單元;第二集成電路封裝,該第二集成電路封裝包括第二組一個或多個人工智能處理單元以及交換機通信單元,其中,交換機通信單元被配置為在第一集成電路封裝與至少第三集成電路封裝之間提供中間連接點;以及第一集成電路封裝與第二集成電路封裝之間的互連,其中,第一芯片對芯片互連通信單元和交換機通信單元使用支持基于信用的數(shù)據(jù)流控制以及重傳數(shù)據(jù)流控制的分層通信架構(gòu),經(jīng)由該互連來管理基于以太網(wǎng)的通信。
20、在一些實施例中,第三集成電路封裝可以包括第三組一個或多個人工智能處理單元以及第二芯片對芯片互連通信單元。
21、將理解的是,本文中描述為適合于結(jié)合到本公開的一個或多個方面或?qū)嵤├械娜魏翁卣髦荚诳赏茝V到本公開的任何和所有的方面和實施例。本領(lǐng)域技術(shù)人員可以根據(jù)本公開的說明書、權(quán)利要求書以及附圖理解本公開的其它方面。前述概括性描述和以下詳細描述僅是示例性和說明性的,并且不是對權(quán)利要求的限制。
1.一種系統(tǒng),包括:
2.根據(jù)權(quán)利要求1所述的系統(tǒng),其中,所述第一組一個或多個人工智能處理單元和所述第二組一個或多個人工智能處理單元被配置為處理人工智能工作負載,所述人工智能工作負載包括訓(xùn)練一個或多個神經(jīng)網(wǎng)絡(luò)。
3.根據(jù)權(quán)利要求1或2所述的系統(tǒng),其中,所述第一芯片對芯片互連通信單元和所述第二芯片對芯片互連通信單元包括被配置為支持物理層網(wǎng)絡(luò)通信協(xié)議的電子電路系統(tǒng)邏輯;并且優(yōu)選地,其中,所述物理層網(wǎng)絡(luò)通信協(xié)議包括以太網(wǎng)通信協(xié)議。
4.根據(jù)前述權(quán)利要求中任一項所述的系統(tǒng),其中,所述第一芯片對芯片互連通信單元和所述第二芯片對芯片互連通信單元包括被配置為支持除物理層網(wǎng)絡(luò)通信協(xié)議之外的多個通信協(xié)議的電子電路系統(tǒng)邏輯。
5.根據(jù)前述權(quán)利要求中任一項所述的系統(tǒng),其中,所述第一芯片對芯片互連通信單元和所述第二芯片對芯片互連通信單元包括硬件緩沖區(qū),所述硬件緩沖區(qū)被配置為存儲通信數(shù)據(jù)。
6.根據(jù)前述權(quán)利要求中任一項所述的系統(tǒng),其中,所述互連包括所述第一集成電路封裝與所述第二集成電路封裝之間的物理互連;并且優(yōu)選地,其中,所述物理互連包括電線互連。
7.根據(jù)前述權(quán)利要求中任一項所述的系統(tǒng),其中,所述分層通信架構(gòu)包括應(yīng)用層;并且優(yōu)選地,其中,所述應(yīng)用層被配置為訪問高帶寬存儲器。
8.根據(jù)前述權(quán)利要求中任一項所述的系統(tǒng),其中,所述分層通信架構(gòu)進一步包括:
9.根據(jù)前述權(quán)利要求中任一項所述的系統(tǒng),其中,所述基于信用的數(shù)據(jù)流控制被配置為基于所述第一集成電路封裝的接收緩沖區(qū)大小和所述第二集成電路封裝的接收緩沖區(qū)大小,在所述第一集成電路封裝與所述第二集成電路封裝之間傳送信用限額。
10.根據(jù)前述權(quán)利要求中任一項所述的系統(tǒng),其中,所述基于信用的數(shù)據(jù)流控制被配置為傳送和存儲在所述第一集成電路封裝與所述第二集成電路封裝之間交換的數(shù)據(jù)包的計數(shù)。
11.根據(jù)前述權(quán)利要求中任一項所述的系統(tǒng),其中,所述重傳數(shù)據(jù)流控制被配置為確認接收到無誤數(shù)據(jù)包以及更新計數(shù)器,所述計數(shù)器記錄接收到的無誤數(shù)據(jù)包的連續(xù)數(shù)量。
12.根據(jù)前述權(quán)利要求中任一項所述的系統(tǒng),其中,所述重傳數(shù)據(jù)流控制被配置為傳達接收到有誤數(shù)據(jù)包,以及使得重傳所述有誤數(shù)據(jù)包。
13.一種方法,包括:
14.一種系統(tǒng),包括:
15.根據(jù)權(quán)利要求14所述的系統(tǒng),其中,所述第三集成電路封裝包括第三組一個或多個人工智能處理單元以及第二芯片對芯片互連通信單元。