![博弈学习通信抗干扰理论与方法](https://wfqqreader-1252317822.image.myqcloud.com/cover/414/44819414/b_44819414.jpg)
3.2.2 博弈均衡分析与求解
1.下层子博弈
在3.2.1节建模的抗干扰Stackelberg功率控制博弈中,干扰作为跟随者需要估计用户的发射功率策略,不精确的估计可能产生观测误差。与文献[25]类似,干扰的观测误差可定义为ε=|P~-P|/P,其中P~表示干扰对用户发射功率的观测值。干扰追求自身效用的最大化,考虑到发射链路信道增益α和干扰功率代价Cj的不确定性,干扰的优化问题可建模为
![](https://epubservercos.yuewen.com/07EB73/23949980909652506/epubprivate/OEBPS/Images/43063_40_5.jpg?sign=1739315148-SYez45YXMKT1b3jEPkikaUcUv25tb7Qh-0-a0ffdd3e9d37b82b11a456f8547fc0e3)
式中, JM为干扰的最大干扰功率。根据上述优化问题,最佳干扰功率为
![](https://epubservercos.yuewen.com/07EB73/23949980909652506/epubprivate/OEBPS/Images/43063_40_6.jpg?sign=1739315148-4pbQMX2HBB13Oafe1smGlK7VrHQtc74m-0-163d91bf5b6af01e6e1dc3b8671e9cd6)
对于干扰来说,假设随机变量α和Cj相互独立。随机变量α的 M 个状态分别是α1,…,αm,…,αM,其概率分布为φ1,…,φm,…,φM,并满足。随机变量Cj的W个状态分别是Cj1,…,Cjw,…,CjW,其概率分布为к1,…,кw,…,кW,并满足
。
通过求解式(3-5)和式(3-6)构成的优化问题,干扰可以获得推论3.1所示的最佳功率策略。
推论3.1:干扰的最佳功率策略为
![](https://epubservercos.yuewen.com/07EB73/23949980909652506/epubprivate/OEBPS/Images/43063_41_1.jpg?sign=1739315148-pQe08YIhcJdcqmrjfZWq4pNVo8LVRQNz-0-d724451ca216c2dcbba5e8a2494e2e3b)
其中,(.)+□max(.,0)。如果用户的发射功率太小(例如,,那么干扰功率为0,不再进行干扰。
证明:根据文献[24-25]中的论述,由于满足
![](https://epubservercos.yuewen.com/07EB73/23949980909652506/epubprivate/OEBPS/Images/43063_41_3.jpg?sign=1739315148-5Uthdb2h6SlTocWhEfg7nazrxwaKCJaJ-0-23fed8cf87f3d3e7083cf9f30b3da171)
因此,干扰的效用函数是干扰功率J的凹函数,式(3-5)和式(3-6)组成的优化问题为一个凸优化问题。基于对偶优化理论[46-147-149],可以得到最佳干扰策略。首先,通过引入非负对偶变量λ,式(3-5)和式(3-6)所组成优化问题的拉格朗日函数为
![](https://epubservercos.yuewen.com/07EB73/23949980909652506/epubprivate/OEBPS/Images/43063_41_4.jpg?sign=1739315148-sgNusiCTJNZ3S0HnZ4ctPolInVBQyiAk-0-1c6a7322fff62767fde0b5c494a11652)
拉格朗日对偶函数为
![](https://epubservercos.yuewen.com/07EB73/23949980909652506/epubprivate/OEBPS/Images/43063_41_5.jpg?sign=1739315148-Lz4ZIHs7pR8WvfPG43fatMOSzS5IrmYY-0-95aa49c64f33e601a0f18369b651f19a)
相应的对偶问题为
![](https://epubservercos.yuewen.com/07EB73/23949980909652506/epubprivate/OEBPS/Images/43063_41_6.jpg?sign=1739315148-m5Adyy4QnzD13TGtqaSbEmWDcgNe3xS9-0-de6bee2fb5c70dc7af38bdeb70d64da1)
根据库恩-塔克(Karush-Kuhn-Tucker,KKT)条件,可得
![](https://epubservercos.yuewen.com/07EB73/23949980909652506/epubprivate/OEBPS/Images/43063_41_7.jpg?sign=1739315148-p6Tspy1vFc711jI8gqDTm9Fv4dzhNNyx-0-94e6509ef2ddd6b6d584d1d93ebb05b4)
根据式(3-13),可以得到。由于式(3-5)和式(3-6)组成的优化问题是一个凸优化问题,强对偶条件成立。因此,对偶间隙为零,对偶问题的最优解即为原问题的最优解。
证毕。
2.上层子博弈
考虑到干扰链路信道增益β和用户发射功率代价Cs的不确定性,用户的最佳功率策略可以通过求解下面的优化问题得到。
![](https://epubservercos.yuewen.com/07EB73/23949980909652506/epubprivate/OEBPS/Images/43063_42_1.jpg?sign=1739315148-ty1PNQL4Z6W6TEO55jQwxV5Jsr3nMlA6-0-39224378d7087544044cbec766de3cdc)
其中, PM表示用户的最大发射功率, J (P)如式(3-8)所示。用户的最佳发射功率为
![](https://epubservercos.yuewen.com/07EB73/23949980909652506/epubprivate/OEBPS/Images/43063_42_2.jpg?sign=1739315148-P1la8AhHxQtfNVZUFhD3hXw0rOiPQ2Yd-0-b5c421ccd07f604f6e0d4c63c9300bdd)
对于用户来说,假设随机变量β和Cs相互独立。随机变量β的 R 个状态分别为β1,…,βr,…,βR,其概率分布为ρ1,…,ρr,…,ρR,并满足。随机变量Cs的H个状态分别为Cs1,…,Csh,…,CsH,其概率分布为g1,…,gh,…,gH,并满足
。
推论3.2:用户的最佳功率策略为
![](https://epubservercos.yuewen.com/07EB73/23949980909652506/epubprivate/OEBPS/Images/43063_42_5.jpg?sign=1739315148-PhX2dpbX3uCEsDqxcr4WH8g98Vchuo5z-0-1ac2805d07fa00ffab1830052e10280a)
其中,。
证明:将式(3-8)代入式(3-3),可以得到
![](https://epubservercos.yuewen.com/07EB73/23949980909652506/epubprivate/OEBPS/Images/43063_42_7.jpg?sign=1739315148-3sUZbFUIT7icNl3aGVCXUSqXbEEkNqSV-0-77850f2ff9e048803b69aeeb57bf6f0c)
其中,。
根据式(3-18),当满足条件P≤Λ时,用户的效用函数是发射功率P的线性函数。当满足条件P>Λ时,由于满足
![](https://epubservercos.yuewen.com/07EB73/23949980909652506/epubprivate/OEBPS/Images/43063_43_1.jpg?sign=1739315148-rAeQQaYibYfApVFoiHyVIqXtLfvhSPv3-0-336e29c1112c2c02151d01eadeacb8fc)
因此,用户的效用函数是发射功率P的凹函数。
通过引入非负对偶变量μ,式(3-14)和式(3-15)所组成优化问题的拉格朗日函数为
![](https://epubservercos.yuewen.com/07EB73/23949980909652506/epubprivate/OEBPS/Images/43063_43_2.jpg?sign=1739315148-wbly8UUiP2kx2UvySsGKquoAki0RJ6cj-0-d231c9ed099a485c5e25ffa82dfefc56)
类似于下层子博弈的分析过程,可得用户的最佳发射功率为
![](https://epubservercos.yuewen.com/07EB73/23949980909652506/epubprivate/OEBPS/Images/43063_43_3.jpg?sign=1739315148-aSKFe0hqNpOVngmF61l5ufLL4NmdyFpZ-0-9c629e2c05c4e34474bf6876e2db5bc2)
根据式(3-18),可分以下几种情况进行讨论:
情况1:。
在这种情况下,满足条件Λ≤Popt。用户效用函数时获得最大值。
情况2:。
在这种情况下,满足条件Λ>Popt。用户效用函数时获得最大值。
情况3:。
在这种情况下,满足条件P≤Λ,用户效用函数是发射功率P的单调递减函数。用户效用函数
时获得最大值。
证毕。
对偶变量λ和μ可通过次梯度法进行更新。
![](https://epubservercos.yuewen.com/07EB73/23949980909652506/epubprivate/OEBPS/Images/43063_43_11.jpg?sign=1739315148-w8ND9I8wLpYABHJWkBr1KXVwUTDLOnE5-0-3a2549fa18540db7d3539e3590cdaca9)
式中,n为迭代次数;和
均为迭代步长。
3.Stackelberg均衡分析
根据文献[44],Stackelberg均衡可定义如下。
定义3.1:如果对于P≥0和J≥0,满足条件
![](https://epubservercos.yuewen.com/07EB73/23949980909652506/epubprivate/OEBPS/Images/43063_44_1.jpg?sign=1739315148-9oZhDSCMxOUqCw5gAGHhkF6nGxLMRudP-0-35e91403d2a0128941355b347601b5f7)
那么最佳策略集合( P*, J*)构成所提博弈的 Stackelberg 均衡(Stackelberg Equilibrium,SE)。
推论3.3:所提抗干扰贝叶斯Stackelberg博弈总是存在一个SE解。
证明:给定一个用户的发射功率策略P,则有以下两种情况。
(1)干扰的策略空间{J∶0≤J≤J M}是欧式空间上的非空凸紧子集。
(2)效用函数是干扰功率J的连续凹函数。
基于文献[150]中的论述,在下层子博弈中存在一个 NE 解,NE(P)表示在给定用户发射功率P时的最佳响应。定义3.1中的SE可等价定义为
![](https://epubservercos.yuewen.com/07EB73/23949980909652506/epubprivate/OEBPS/Images/43063_44_3.jpg?sign=1739315148-69Y5CFbazdnnNskPbw1jaKVSSgoP0Q98-0-bc9af8c5c33ddaabcf6e2327c5a7e37a)
因此,存在P*满足
![](https://epubservercos.yuewen.com/07EB73/23949980909652506/epubprivate/OEBPS/Images/43063_44_4.jpg?sign=1739315148-3oUpFQT4psrc4tebJs3ConIHJWziScwc-0-699633276a0777b705e6d0f3af80e4ac)
因而,所提抗干扰贝叶斯Stackelberg博弈总是存在SE解。
证毕。
推论3.4:所提抗干扰贝叶斯Stackelberg博弈存在唯一的SE解。
证明:根据式(3-9),满足条件。在给定用户发射功率 P 的条件下,干扰的效用函数
是干扰功率J的凹函数。因此,干扰存在唯一的最佳策略NE(P*)。
根据推论 3.2,用户存在唯一的最佳发射功率策略P*。因此,所提的抗干扰贝叶斯Stackelberg博弈存在唯一的SE解。
证毕。