- 邓亚男;王秋红;李俊杰;顾晶晶;
在多智能体系统中,智能体通常只能观察到部分状态信息,导致每个智能体在作决策时缺乏对其他智能体行为和环境动态的完整理解,进而增加了协作的难度。虽然基于值函数分解的多智能体强化学习方法对解决局部可观测性问题有一定的优势,但由于状态-动作空间维度高、模型结构复杂等问题,多智能体系统中仍然存在着协作不确定性的影响,从而导致奖励分配不公平的问题。提出了一种基于隐式通信的值分解多智能体强化学习方法(VFRL-IC),通过挖掘智能体之间的局部关系,缓解环境不确定性问题带来的影响:提出隐式通信框架,在训练阶段使智能体共享局部观测信息以训练局部策略;基于局部观测信息构建全局影响的评估模型,求解智能体间影响值;设计了一种类多头注意力机制的网络结构,融合智能体间影响值,求解包含全局信息的局部动作值模型。在星际争霸环境中进行实验验证,结果表明,VFRL-IC在各场景中的平均成功率优于基线算法15~40个百分点,效率提高18%。
2025年07期 v.19;No.202 1878-1887页 [查看摘要][在线阅读][下载 1939K] [下载次数:163 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:5 ] - 宁美玲;齐佳音;梁快;张洵;陈凯帆;
针对语音情绪识别领域中语音模型缺乏大量带标签的训练数据和语音模型无法持续学习的问题,提出了一种面向语音情感识别的持续特征解耦生成方法,该方法能够有效地提取数据情感信息并能较好地进行持续学习分类。构建并行选择解耦器,利用频谱选择模块和内容选择模块将语音的频谱特征和内容特征建立联系,通过计算情绪相关系数,赋予解耦数据相关权重,生成融合特征数据。构建二阶知识流情绪分类器,充分挖掘利用生成的语音情绪数据,引入自定义L2归一化层,构建自定义持续语音情绪分类网络(CL-SER),利用多层卷积结构处理语音情绪数据,减少模型误差损失。利用任务蒸馏损失和任务平滑损失优化持续语音情感网络CL-SER,实现跨任务的知识迁移,提高模型持续分类准确率。在IEMOCAP数据集上,进行了生成数据性能、模型防止灾难性遗忘性能和情绪分类性能测试。实验结果表明,提出的持续语音情感数据生成方法在多组持续学习方法和语音情感识别方法中均展现出了在准确率、遗忘率和未加权平均召回率等方面的良好性能,相较于其他经典的持续学习方法和情绪识别方法更具优势。
2025年07期 v.19;No.202 1888-1898页 [查看摘要][在线阅读][下载 1829K] [下载次数:390 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:5 ] - 崔健;汪永伟;李飞扬;李强;苏北荣;张小健;
生成是自然语言处理领域的主要研究方向之一。针对当前中文摘要模型语义提取能力弱、大模型生成质量不稳定、部署资源要求高等问题,提出了结合知识蒸馏的中文文本摘要生成方法。采取多线程调用大模型接口的方式对训练数据进行增强,引入提示工程,对齐摘要质量并生成参考标签;利用蒸馏技术在知识迁移方面的优势,采取离线知识蒸馏方法,将大模型输出作为知识传授给学生网络,提升学生网络摘要准确性和可读性,同时降低训练成本和资源消耗;对学生网络进行改进,使用复制机制缓解未登录词问题,并对输出结果进行双向相似度计算以优化损失函数,进一步提升模型稳定性。在NLPCC2017数据集上的实验表明,所提方法在ROUGE评价指标上的综合性能优于现有主流的摘要生成方法。在摘要生成质量方面,提出的方法在中文摘要过程中提高了准确率,提升了流畅度;在模型部署要求方面,所提方法具备较小参数量,能够满足轻量级低开销离线部署。
2025年07期 v.19;No.202 1899-1908页 [查看摘要][在线阅读][下载 1722K] [下载次数:469 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:3 ] - 冯勇;栾超杰;王嵘冰;徐红艳;张永刚;
知识图谱的不完整性严重影响了下游任务的应用与发展,因此,有必要对其进行改进以补充缺失值,即知识图谱补全。现有的知识图谱补全模型大多重组实体关系嵌入表示以捕获局部交互。但这种方法破坏了三元组的原有结构,只能利用单一的局部交互而忽略了实体关系间全局交互的影响。为此,提出一种聚合全局交互与局部交互的知识图谱补全方法AGILI。该方法首先引入自注意力机制获取头实体和关系间的信息关联程度,生成融入全局交互信息的嵌入表示,再采用卷积神经网络从新嵌入表示中提取局部交互信息,设计基于关系权重的可学习交互聚合器,在将全局交互与局部交互进行特征融合时,可以根据关系类别自适应地调整两种交互的重要程度,提高方法在多关系知识图谱上的表达能力。在公开数据集FB15k-237、WN18RR和Kinship上通过链接预测任务进行实验验证,实验结果表明,与最新的基于卷积神经网络的模型ConvD相比,所提出的方法在FB15k-237数据集上Hits@1、Hits@3指标分别提高了6.9%、5.3%,证明了所提出方法的优越性。
2025年07期 v.19;No.202 1909-1917页 [查看摘要][在线阅读][下载 1556K] [下载次数:230 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:4 ] - 韩竹轩;卜凡亮;侯智文;齐彬廷;曹恩奇;
当前,恐怖主义已成为影响世界和平与发展的重要因素。分析恐怖袭击事件以提取有用信息,并预测恐怖组织的空间行为成为当下研究的热点之一。虽然已经有较多对于恐怖袭击空间预测的研究,但大多数方法在构建恐怖组织空间行为关系网络并显示提取高阶关系方面仍有提升空间。为解决这一问题,将恐怖组织空间行为预测问题建模为由恐怖组织-袭击地点交互网络和袭击地点知识图构成的恐怖组织空间行为协同知识图,提出了一种基于改进KGAT的恐怖组织空间行为预测方法KGCE。该方法根据恐怖组织与袭击地点之间的交互关系及袭击地点的知识图谱,分别构建了恐怖组织-袭击地点交互网络及袭击地点知识图,通过将这两种网络结合,提出了一种基于社会-空间关系的恐怖组织空间行为协同知识图;改进了KGAT结构,在嵌入层中引入TransE模型以缓解模型过拟合问题,同时整体模型以端到端的方式,有效地对恐怖组织空间行为协同知识图中的高阶关系进行了建模。在公开数据集上通过与五个主流竞争基线进行对比,实验结果和分析表明,KGCE在恐怖组织空间行为预测准确度方面高于现有基线,其召回率最高提升7.14%,验证了该框架的有效性与正确性。
2025年07期 v.19;No.202 1918-1930页 [查看摘要][在线阅读][下载 1713K] [下载次数:204 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:7 ] - 孟祥福;徐永杰;翁雪;
交通流量预测是智能交通系统的核心组成部分,对高效的交通管理和规划至关重要。针对现有方法在动态时空依赖建模和特征表示方面存在的不足,提出了一种时空交叉注意力特征融合的交通流量预测模型。通过构建动态多特征嵌入模块,融合原始数据、周期性、空间和时空自适应嵌入,生成交通流量数据内在的时空特征表示,提升了模型对多样化交通模式的适应能力。基于Transformer编码器架构,设计并行的时空自注意力模块,高效提取时间和空间特征,为深度的特征融合提供了基础。创新性地引入时空交叉注意力特征融合机制,在时间和空间维度分别使用多头交叉注意力机制,使时间特征能够自适应地学习关键节点的空间信息,同时空间特征也能选择性地聚焦于重要的时间信息,以实现时间和空间特征的深度融合,从而更全面地理解和捕捉交通流量中的动态时空依赖关系。在四个真实交通数据集上的实验结果表明,与最优基线模型相比,所提模型的MAE、RMSE和MAPE指标分别平均降低了1.56%、1.91%和2.58%。
2025年07期 v.19;No.202 1931-1944页 [查看摘要][在线阅读][下载 1937K] [下载次数:1083 ] |[网刊下载次数:0 ] |[引用频次:1 ] |[阅读次数:5 ]