![博弈学习通信抗干扰理论与方法](https://wfqqreader-1252317822.image.myqcloud.com/cover/414/44819414/b_44819414.jpg)
3.3 离散策略条件下的分层功率控制抗干扰
3.3.1 问题描述
在离散功率策略条件下,假设用户的可用功率策略集为P={p1 , p2 ,…, pm,…, pM},干扰功率策略集为J={φ1 ,φ2 ,…,φn,…,φN}。根据文献[24-25],基于信干噪比(SINR),用户的效用函数可定义为
![](https://epubservercos.yuewen.com/07EB73/23949980909652506/epubprivate/OEBPS/Images/43063_44_7.jpg?sign=1739396552-PWwTIDm3eYwE6bcy2CGl3zW1SG4mLELg-0-303e65b622910d7c2286ac24bb860e70)
式中,为噪声功率;cs为用户单位发射功率代价;pm和φn分别为用户和干扰的发射功率。相应地,干扰的效用函数可定义为[24-25]
![](https://epubservercos.yuewen.com/07EB73/23949980909652506/epubprivate/OEBPS/Images/43063_45_2.jpg?sign=1739396552-fOMeWOZC99uXiHoJ10iOtIqE5oTh5Tku-0-d3a14c53b49dd9a258c3ed76d32d14d9)
式中, c j为单位干扰功率代价。与 3.2 节分析类似,在离散功率策略条件下,也可将功率控制抗干扰问题建模为一个 Stackelberg 博弈问题。其中,通信用户假设为领导者,干扰为跟随者。为了叙述方便,下面叙述中用1和2分别表示用户和干扰的标志编号。构建的Stackelberg博弈可以表示为G={N,P, J,μs,μj},其中, N={1,2}表示参与者的集合, P和J 分别表示用户和干扰的策略空间,μs和μj分别表示通信用户和干扰的效用函数。
在一个 Stackelberg 博弈中,考虑到跟随者的不精确观测和有限理性,跟随者会偏离它的最佳策略。为了表征跟随者的不精确观测,引入观测因子γ∈[0,1],γ越大,表示精确观测的概率越大。当γ=1时,表示跟随者可以完美观测领导者的行为。观测误差矩阵可以建模为
![](https://epubservercos.yuewen.com/07EB73/23949980909652506/epubprivate/OEBPS/Images/43063_45_3.jpg?sign=1739396552-JyBYDzriaI5VLMZl05woRwpfvGg1eKk1-0-7fdbecf6afa45025b040a099116507e6)
式中,φm,l为将功率pm看作pl的概率。当满足条件m=l时,φm,m=γ表示干扰可以精确观测用户发射功率pm的概率;否则,有φm,l=(1-γ)/(M-1),其中M表示用户发射功率策略的个数。
考虑到干扰的不精确观测特性,式(3-29)所示的干扰效用函数可改写为
![](https://epubservercos.yuewen.com/07EB73/23949980909652506/epubprivate/OEBPS/Images/43063_45_4.jpg?sign=1739396552-sbYaFVTQeBcIZTqfOTQGoLv0Nzo5aA2L-0-b758d3ec77cdb315ad6d99e718cc8eaa)
对于干扰来说,给定一个用户的功率策略pm∈P,干扰的优化问题可建模为
![](https://epubservercos.yuewen.com/07EB73/23949980909652506/epubprivate/OEBPS/Images/43063_45_5.jpg?sign=1739396552-9mUTWGqt0nySSNW9KEhpTHX94diGCIKO-0-9e56f748aa8e4045c697200fc3cdbc3a)
由于跟随者的有限理性,即跟随者不是严格地追求效用最大化。受文献[152]的启发,为了表征有限理性的不确定度,引入理性因子η∈[0,1]来表征干扰的理性度。理性因子η越大,表示理性度越高。如果η=1,就表示跟随者是完全理性的。为了分析方便,理性矩阵可定义为
![](https://epubservercos.yuewen.com/07EB73/23949980909652506/epubprivate/OEBPS/Images/43063_45_6.jpg?sign=1739396552-Bs5NXptRWMP3fVCTSosjUHNpXIwes1RH-0-0495e0539b40d512e498164843f7e43b)
式中,Ψw,k为功率φw被看作功率φk的概率。如果满足w=k,Ψw,w=η表示干扰的理性度;否则,有Ψw,k=(1-η)/(N-1),其中N表示干扰功率策略的个数。考虑到干扰的有限理性,式(3-28)所示的用户效用函数可改写为
![](https://epubservercos.yuewen.com/07EB73/23949980909652506/epubprivate/OEBPS/Images/43063_45_7.jpg?sign=1739396552-Vh90HB83MFO8TVuASxz6VJBpP1sRgvva-0-43b1ee3d6223eb3f05f241a69a4eef77)
相应地,用户的优化问题可表示为
![](https://epubservercos.yuewen.com/07EB73/23949980909652506/epubprivate/OEBPS/Images/43063_45_8.jpg?sign=1739396552-RP29mWOjku6jTfOr2PBEbLvepSP4Idmk-0-d5716400a9867997f85f56c4fc8ba770)