论文研究-基于辩论的社会性Agent间的谈判模型.pdf

所需积分/C币:5 2019-09-06 22:28:45 786KB .PDF

通过对Agent间存在的有关社会性的关键元素进行分析,建立了基于辩论的社会性Agent间的谈判模型,并建立了相关的决策函数;然后通过一个存在于多Agent社会中而具有社会性的Agent间的谈判实例,在假设了相关数据的基础上对模型和决策函数进行了举例计算,分析验证了其有效性,并在对相关的谈判原语作出定义的基础上对此谈判实例的辩论对话过程进行了模拟。
伍京华,蒋国瑞,黄梯云:基于辩论的社会性 Agent间的谈判模型 2007,43(12) 表示,需要注意的是,由于是惩罚,所以这里取其负值相加。具 表2E(R)和E(O)值 体计算如公式(11): R 评价值 E(a)=E(R1,Roa)=入1×A2 老师奖励家长奖励老师批评家长批评E(R。)E(O B 权重0.7 0.4 0.6 E(B)=E(RL, Rod=AiXA3 (10) 5.7 值 6.0 5.0 6.0 4.0 E(Ru, =E(R, -E(Od )=Benefit(d)-Penalty(d) aeB 表3A1、A2A3及、U值 人×E(R1)-U×E(O4) (11) Ar A2 A3 uv 其中,A1、A2、A3及μ、U分别表示就β自身有关谈判的知识来 B0.40.40.70.50.5 C0.60.60.60.40.6 看,R、RO、RO所占权重及E(R)、E(O)所占权重。 综上,可将此决策函数D(d)视为以行为d为变量的函数 式(12)中,可计算出相应的D()、D(h)值: D(j)=0.4+(1+0.4)×(0.440.7)+2×(0.5×54-0.5×4.3)=3.04 其值可通过公式(12)计算得到 D(h)=0.6+(1+06)×(0.6+06)+2×(0.4×57-06×4.8)=1.32(15) D(d)=E(a)+E(B)+e(RL, )+E(Rod )+E(Ro,)+ 因此,A会选择接受B提出的辩论,即完成工作j,而拒绝 E(Ru +E(R-E(0,) C提出的辩论,即拒绝完成作业h。 通过定义 Agent间谈判所使用的一些通讯原语(表4),可 A+(1+A)×X+入)+2××E(R)-XE(O)(12)得到A、B、C有关此谈判的第一轮辩论的对话模拟,如图2。此 外,A、B、C之间还可根据同样的原理以反辩论的方式进行更 5模型及决策函数的举例计算和辩论对话模拟 多轮的谈判。 为便于计算和说明,以下假设数据中权重的取值范围均为 表4 agent间通讯原语表示 0至1之间的一位小数,值的取值范围均为1至10之间的 原语 表示 位整数,谈判中只考虑辩论,且以谈判只进行一轮辩论为例进 PROPOSE(do()) 提议完成工作j 行举例和模拟。 reJECT(do(i)) 拒绝提议,不完成工作j 考虑图1所示的例子,假设B、C分别要求A同时完成工 START-NEGOTIATION 谈判开始 作j和作业h,由于时间冲突,A都不能接受,表示拒绝,B和C END-NEGOTIATION 谈判结束 为说服A同时向其提出相关的辩论,根据以上模型可分别表 Conflict(do(),do(h))同时完成工作j和作业h冲突 示为式(13)、(14) DECESION(dog)) 做出决策,决定完成工作j DECESION(ηdo())做出决策,决定不完成工作j Argl(B-A)=B, A, WorkRl, Manager, Worker B→A CompanyRu.R. 0 3) B: PROPOSE(do(i)) C: PROPOSE(do(/)) A: reJECT(do(i)) A: reJECT(do(h)) Arghh(CA)=(C, A, TeachRl, Teacher, Student B: START-NEGOTIATION C: START-NEGOTIATION SchoolruR (14) A START-NEGOTIATION A: START-NEGOTIATION B: WHY? C: WHY? 在这个时候,A需要对以上两个辩论做出评价,以做出决 A: Conflict( do(i), do(h)) A: Conflict(do(), dogi)) 策。假设A只具有工作和学校关系这两个社会关系,首先计算 B:ARG√(B→+4)) C:ARG(h(C→A) E(R1)、E(O)、E(R)、E(O1)的值,为简化计算,分别 A: DECESION (do(j)) A: DECESION( do(h)) 将其对有关B的权利的评价即相应的利益函数只分解为对可 B. END-NEGOTIATION C. END-NEGOTIATION A. END-NEGOTIATION A END-NEGOTIATION 能得到的奖金和升职这两个指标的综合评价,将其对有关B 的义务的评价即相应的惩罚函数只分解为对可能扣除的工资 图2A、B、C三者之间有关谈判的辩论对话模拟 和降职这两个指标的综合评价,给出假设的权重和值并计算得 出相应的值,如表1;其次,将其对有关C的权利的评价即相应5结论 与传统的提议——反提议的谈判方式相比,基丁辩论的谈 的利益函数只分解为对可能得到的老师奖励和家长奖励这两 判方式由于能给谈判各方带来其在信息不对称条件下可能忽 个指标的综合评价,将其对有关C的义务的评价即相应的惩 略的信息,因而应用于 agent间的谈判显得更为有效。而作为 罚函数只分解为对可能受到的老师批评和家长批评这两个指 人工智能的 agent来说,其处于一定的多 Agent社会之中时也 标的综合评价,给出假设的权重和值并计算得出相应的值,如 类似的具有人类在社会生活中所具有的各项社会属性。因此, 表2 文中提出的模型和决策函数试图将这些方面进行有机结合,研 表1E(R,)和E(O,)值 究一种使智能 agent之间的谈判和决策比传统谈判都更加理 R→4 忍→A R 评价值 性和有效的方法,并通过最后的算例和模拟说明了这种方法不 奖金升职扣资降职E(R)E(O 仅可行而且有效。(收稿日期:2006年11月) 权重0.6040.30.7 5.4 4.3 值5060504.0 参考文献: 在以上基础上,分别给出A有关B和C的相应的假设的1]黄梯云智能决策支持系统M北京:电子工业出版社,201 A1A2A3及A、U值,具体如表3 2] Fatima SS, Wooldridge M, Jennings N R An agenda based frame 将表1、2中的评价值和表3中给出的假设数据应用于公 (下转39页)

...展开详情
img
  • 至尊王者

    成功上传501个资源即可获取

关注 私信 TA的资源

上传资源赚积分,得勋章
    最新推荐