一種基于演化博弈論的動(dòng)態(tài)無(wú)線網(wǎng)絡(luò)選擇方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于異構(gòu)無(wú)線網(wǎng)絡(luò)移動(dòng)性管理技術(shù)領(lǐng)域,更具體地,涉及一種基于演化博 弈論的動(dòng)態(tài)無(wú)線網(wǎng)絡(luò)選擇方法。
【背景技術(shù)】
[0002] 無(wú)線通信網(wǎng)絡(luò)消耗的能量占信息通信產(chǎn)業(yè)的大部分。由于能量消耗,不僅所排放 的二氧化碳等污染氣體對(duì)自然環(huán)境造成了重大傷害,而且也增加了網(wǎng)絡(luò)運(yùn)營(yíng)商的運(yùn)營(yíng)成 本。隨著移動(dòng)互聯(lián)網(wǎng)的迅猛發(fā)展,移動(dòng)用戶數(shù)量呈爆炸式增長(zhǎng),將使這一問題變得更加嚴(yán) 重。另一方面,無(wú)線通信的設(shè)備主要是便攜的移動(dòng)設(shè)備,其主要供能方式是電池,而電池儲(chǔ) 存的能量是有限的,這也將極大影響移動(dòng)通信的發(fā)展。當(dāng)前的無(wú)線網(wǎng)絡(luò)在最初架構(gòu)設(shè)計(jì)時(shí) 沒有將能量消耗作為重要的考慮因素,以致很多無(wú)線網(wǎng)絡(luò)的能量消耗偏高,例如WIFI。同 時(shí),蜂窩網(wǎng)絡(luò)在最初架構(gòu)時(shí)對(duì)能量的考慮也不夠周全,導(dǎo)致能量消耗高,造成巨大的能量和 經(jīng)濟(jì)損失。
[0003] 異構(gòu)無(wú)線網(wǎng)絡(luò)選擇是異構(gòu)無(wú)線網(wǎng)絡(luò)移動(dòng)性管理方面的重要內(nèi)容之一。不同的無(wú)線 通信系統(tǒng)具有不同的優(yōu)勢(shì),多模移動(dòng)終端設(shè)備可以根據(jù)不同的衡量標(biāo)準(zhǔn),例如服務(wù)質(zhì)量、價(jià) 格、能量效率等,進(jìn)行無(wú)線接入網(wǎng)絡(luò)選擇。
[0004] 因此,如何在異構(gòu)無(wú)線網(wǎng)絡(luò)中充分利用不同無(wú)線網(wǎng)絡(luò)的優(yōu)勢(shì),合理調(diào)度無(wú)線資源、 降低能量消耗、提升能量效率,是異構(gòu)無(wú)線網(wǎng)絡(luò)接入中的一個(gè)非常重要的問題。
[0005] 國(guó)內(nèi)外許多研究小組已經(jīng)致力于異構(gòu)無(wú)線網(wǎng)絡(luò)關(guān)鍵技術(shù)的研究,異構(gòu)融合網(wǎng)絡(luò)技 術(shù)研究是國(guó)內(nèi)外二十世紀(jì)九十年代至今的研究熱點(diǎn)。近年來(lái)開展的相關(guān)研究項(xiàng)目和課題有 中國(guó)國(guó)家863計(jì)劃通信主題的重大項(xiàng)目未來(lái)通信通用環(huán)境future、歐洲電信標(biāo)準(zhǔn)協(xié)會(huì)的寬 帶無(wú)線接入網(wǎng)標(biāo)準(zhǔn)項(xiàng)目ETSI RAN、歐盟1ST的框架結(jié)構(gòu)中的WINE GLASS和BRAIN/MIND項(xiàng) 目以及日本的e-Japan計(jì)劃下的MIRAI項(xiàng)目等。國(guó)內(nèi)外一系列研究已經(jīng)取得了很多成果, 但是還有很多問題需要繼續(xù)研究。
[0006] 盡管全球很多研究機(jī)構(gòu)都在探索異構(gòu)無(wú)線網(wǎng)絡(luò)方面的研究,并且取得了很多成 果,但是面對(duì)日益增長(zhǎng)的無(wú)線網(wǎng)絡(luò)用戶數(shù)目以及未來(lái)多種無(wú)線網(wǎng)絡(luò)與移動(dòng)終端共存的通信 環(huán)境,異構(gòu)無(wú)線網(wǎng)絡(luò)選擇研究仍是一個(gè)有價(jià)值的課題。并且,異構(gòu)無(wú)線網(wǎng)絡(luò)中基于能量效率 的網(wǎng)絡(luò)選擇研究較少,很多研究沒有考慮能量因素或者只是把能量因素看作一個(gè)常量。因 此,在異構(gòu)無(wú)線網(wǎng)絡(luò)中研究基于能量效率的無(wú)線網(wǎng)絡(luò)接入技術(shù)非常有必要。
【發(fā)明內(nèi)容】
[0007] 針對(duì)現(xiàn)有技術(shù)的以上缺陷或改進(jìn)需求,本發(fā)明提供一種基于演化博弈論的動(dòng) 態(tài)無(wú)線網(wǎng)絡(luò)選擇方法,保證用戶在異構(gòu)無(wú)線網(wǎng)絡(luò)中獲得總是最好連接(Always Best Connected,ABC)服務(wù)的基礎(chǔ)上,能夠提高異構(gòu)無(wú)線網(wǎng)絡(luò)的能量效率。
[0008] 本發(fā)明提供一種基于演化博弈論的動(dòng)態(tài)無(wú)線網(wǎng)絡(luò)選擇方法,包括以下步驟:
[0009] 步驟1建立基于IP核心網(wǎng)絡(luò)的松耦合異構(gòu)無(wú)線網(wǎng)絡(luò)架構(gòu),設(shè)定該異構(gòu)無(wú)線網(wǎng)絡(luò)中 的信號(hào)傳輸模型,并針對(duì)所述信號(hào)傳輸模型定義能量模型;
[0010] 步驟2針對(duì)所述步驟1建立的網(wǎng)絡(luò)架構(gòu),建立演化博弈模型,包括定義收益模型和 所述演化博弈模型參數(shù)設(shè)定,其中:
[0011] 所述收益模型定義為:Uj(n) = f (CjOiD-gbjOl)),其中,η表示選擇無(wú)線網(wǎng)絡(luò)j的 用戶數(shù)量;f (C](n))和g(P](n))分別表示收益函數(shù)和代價(jià)函數(shù);C](n)表示無(wú)線網(wǎng)絡(luò)j的數(shù) 據(jù)率; ρ] (η)表示無(wú)線網(wǎng)絡(luò)j的能量消耗;
[0012] 所述演化博弈模型參數(shù)包括:
[0013] (1)區(qū)域h的群體的策略選擇比例用向量々=?,?,心…,·^丨表示,其中Xh^ 示區(qū)域h中選擇無(wú)線網(wǎng)絡(luò)j的用戶占區(qū)域h總用戶數(shù)的比例;S n表示可供選擇的無(wú)線網(wǎng)絡(luò) 總數(shù),并且滿足關(guān)系式:
[0014] (2)區(qū)域h的總用戶數(shù)定義為Nh,其中選擇無(wú)線網(wǎng)絡(luò)j的總用戶數(shù)定義為N h],并且 滿足關(guān)系式:Nhj = Nh · xhj; B
[0015] (3)假設(shè)無(wú)線網(wǎng)絡(luò)j分配給每個(gè)用戶的帶寬為馬=#,分配給每個(gè)用戶的數(shù)據(jù)率 ''J C 為£廣]^,其中,Bp C,分別表示無(wú)線網(wǎng)絡(luò)j的總帶寬和總數(shù)據(jù)率,N ,表示選擇無(wú)線網(wǎng)絡(luò)j 的用戶數(shù);
[0016] 步驟3針對(duì)所述演化博弈論模型,通過復(fù)制動(dòng)態(tài)來(lái)求解演化博弈的均衡點(diǎn),使得 演化博弈達(dá)到的穩(wěn)定狀態(tài);
[0017] 步驟4不斷調(diào)整用戶選擇的網(wǎng)絡(luò)以獲得最好的收益,直至所有用戶都達(dá)到了所述 步驟3的演化博弈穩(wěn)定狀態(tài),整個(gè)流程結(jié)束。
[0018] 總體而言,通過本發(fā)明所構(gòu)思的以上技術(shù)方案與現(xiàn)有技術(shù)相比,具有以下有益效 果:
[0019] (1)建立能量效率模型,通過香農(nóng)公式推導(dǎo)出無(wú)線信道傳輸?shù)哪芰肯哪P?,而?還綜合考慮了用戶的接收功率。能量效率定義為數(shù)據(jù)率和能量消耗的函數(shù),用戶根據(jù)收益 選擇最優(yōu)的網(wǎng)絡(luò),使得用戶的網(wǎng)絡(luò)選擇綜合考慮了用戶的服務(wù)質(zhì)量和能量消耗;
[0020] (2)應(yīng)用演化博弈理論對(duì)異構(gòu)融合網(wǎng)絡(luò)的動(dòng)態(tài)網(wǎng)絡(luò)選擇建模,異構(gòu)系統(tǒng)中的一個(gè) 覆蓋區(qū)域模擬為生物演化論中的一個(gè)群體,用戶之間通過相互競(jìng)爭(zhēng)來(lái)選擇網(wǎng)絡(luò),并且不斷 調(diào)整網(wǎng)絡(luò)選擇,淘汰效益低的網(wǎng)絡(luò),使整個(gè)異構(gòu)系統(tǒng)各區(qū)域的用戶收益達(dá)到平衡;
[0021 ] (3)改進(jìn)的Q-Learning算法,把控制理論里的基礎(chǔ)Q-Learning算法運(yùn)用到 異構(gòu)無(wú)線網(wǎng)絡(luò)選擇中來(lái),把網(wǎng)絡(luò)選擇過程模擬為一個(gè)多Agent的馬爾可夫過程,然后用 Q-Learning算法實(shí)現(xiàn)用戶的網(wǎng)絡(luò)選擇過程。
【附圖說(shuō)明】
[0022] 圖1為本發(fā)明基于演化博弈論的動(dòng)態(tài)無(wú)線網(wǎng)絡(luò)選擇方法的流程圖;
[0023] 圖2為本發(fā)明異構(gòu)無(wú)線網(wǎng)絡(luò)架構(gòu)示意圖;
[0024] 圖3為本發(fā)明異構(gòu)無(wú)線網(wǎng)絡(luò)傳輸模型示意圖。
【具體實(shí)施方式】
[0025] 為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白,以下結(jié)合附圖及實(shí)施例,對(duì) 本發(fā)明進(jìn)行進(jìn)一步詳細(xì)說(shuō)明。應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅僅用以解釋本發(fā)明,并 不用于限定本發(fā)明。此外,下面所描述的本發(fā)明各個(gè)實(shí)施方式中所涉及到的技術(shù)特征只要 彼此之間未構(gòu)成沖突就可以相互組合。
[0026] 圖1所示為基于演化博弈論的動(dòng)態(tài)無(wú)線網(wǎng)絡(luò)選擇方法的流程圖,具體包括以下步 驟:
[0027] 步驟1建立基于IP核心網(wǎng)絡(luò)的松耦合異構(gòu)無(wú)線網(wǎng)絡(luò)架構(gòu),設(shè)定該異構(gòu)無(wú)線網(wǎng)絡(luò)中 的信號(hào)傳輸模型,并針對(duì)該傳輸模型定義本發(fā)明的能量模型。
[0028] 在本發(fā)明實(shí)施例中,信號(hào)傳輸模型具體表示為:44),其中,^和^ 分別表示用戶i與無(wú)線網(wǎng)絡(luò)j的基站通信的發(fā)送功率和接受功率;Ch1,表示用戶i和無(wú)線 網(wǎng)絡(luò)j的基站的信道參數(shù)。
[0029] 在本發(fā)明實(shí)施例中,能量模型為基于上述信號(hào)傳輸模型中雙方通信數(shù)據(jù)發(fā)送和接 收所產(chǎn)生的發(fā)送功率和接收功率之和,表示為如下公式:
[0030] Pa= P tx+Prx (1)
[0031] 其中,Ptx、P"分別表示發(fā)送功率和接收功率。根據(jù)香農(nóng)公式,在高斯白噪聲干擾信 道中,傳輸速率可以表示為:
[0032]
(2)
[0033] 其中,C表示傳輸速率;B表示信道帶寬;〇2表示噪聲功率;g表示信道增益,因此 發(fā)送功率可以表示為:
[0034]
(3)
[0035] 根據(jù)發(fā)送功率和接收功率的關(guān)系,可以得到接收功率為:
[0036] Prx=Kd λ WPtx (4)
[0037] 其中,d、λ分別表示傳輸距離、路徑損耗指數(shù);隨機(jī)變量Ψ表示衰落過程;在本發(fā) 明實(shí)施例中,系數(shù)K可以表示為:
[0038] K = UVff (5)
[0039] 其中,變量U表示基站和移動(dòng)終端的因素,例如天線高度、載波頻率、傳播條件等; 變量V、W表示天線模式參數(shù)等信息。
[0040] 步驟2針對(duì)步驟1建立的網(wǎng)絡(luò)架構(gòu),對(duì)動(dòng)態(tài)網(wǎng)絡(luò)運(yùn)用演化博弈論的方法建立演化 博弈模型,該模型建立過程包括定義收益模型和模型參數(shù)設(shè)定兩部分。
[0041] 在本發(fā)明實(shí)施例中,收益模型包括:用戶收益(即數(shù)據(jù)傳輸?shù)墨@得的數(shù)據(jù)率)和代 價(jià)(即數(shù)據(jù)傳輸對(duì)應(yīng)的能量消耗)。具體的,本發(fā)明將收益模型定義為用戶選擇無(wú)線網(wǎng)絡(luò)j 時(shí)所獲得的收益和代價(jià)的凹函數(shù),定義如下:
[0042] U j (n) = f (c j (η)) -g (p s (η)) (6)
[0043] 其中,η表示選擇無(wú)線網(wǎng)絡(luò)j的用戶數(shù)量;f(C](n))和g(P](n))分別表示用戶獲 得的數(shù)據(jù)率和消耗的能量,即收益函數(shù)和代價(jià)函數(shù); c] (η)表示無(wú)線網(wǎng)絡(luò)j的數(shù)據(jù)率;ρ] (η) 表示無(wú)線網(wǎng)絡(luò)j的能量消耗。
[0044] 收益函數(shù)f (Cj (η))定義為:
[0045] f (c j (n)) = α · c j (n) (7)
[0046] 其中,α是調(diào)整系數(shù)。
[0047] 代價(jià)函數(shù)g (P j (η))定義為:
[0048] g (p j (η)) = β · P j (η)⑶
[0049] 其中,β也是調(diào)整系數(shù)。α和β分別是用來(lái)規(guī)格化收益函數(shù)和代價(jià)函數(shù)(根據(jù) 實(shí)際函數(shù)進(jìn)行取值)。
[0050] 在本發(fā)明實(shí)施例中,演化博弈模型參數(shù)定義如下:本發(fā)明將一個(gè)區(qū)域里面的所有 用戶定義為一個(gè)群體,每個(gè)群體可選擇的網(wǎng)絡(luò)集合為一個(gè)策略集,由于地理位置的限制,每 個(gè)群體能夠選擇的策略集不同。
[0051] 幾個(gè)與演化博