- 王扬;陈智斌;吴兆蕊;高远;
组合最优化问题(COP)的求解方法已经渗透到人工智能、运筹学等众多领域。随着数据规模的不断增大、问题更新速度的变快,运用传统方法求解COP问题在速度、精度、泛化能力等方面受到很大冲击。近年来,强化学习(RL)在无人驾驶、工业自动化等领域的广泛应用,显示出强大的决策力和学习能力,故而诸多研究者尝试使用RL求解COP问题,为求解此类问题提供了一种全新的方法。首先简要梳理常见的COP问题及其RL的基本原理;其次阐述RL求解COP问题的难点,分析RL应用于组合最优化(CO)领域的优势,对RL与COP问题结合的原理进行研究;然后总结近年来采用RL求解COP问题的理论方法和应用研究,对各类代表性研究所解决COP问题的关键要点、算法逻辑、优化效果进行对比分析,以突出RL模型的优越性,并对不同方法的局限性及其使用场景进行归纳总结;最后提出了四个RL求解COP问题的潜在研究方向。
2022年02期 v.16;No.161 261-279页 [查看摘要][在线阅读][下载 2801K] [下载次数:3006 ] |[网刊下载次数:0 ] |[引用频次:74 ] |[阅读次数:1 ] - 王春喻;马志强;杜宝祥;贾文超;王洪彬;宝财吉拉呼;
人机对话作为人工智能的重要研究内容,受到了学术界和工业界的广泛关注。受到深度学习在自然语言处理成功应用的启发,越来越多的神经网络模型被研究者关注。其中基于端到端的神经网络模型能够从大规模语料中学习到有价值的规律和特征,生成有意义且多样性的回复,被广泛地应用于情感对话生成研究中。面向基于端到端模型的情感对话生成研究展开综述。首先,针对现有的研究成果,梳理并介绍了当前情感对话生成研究面向的任务和主要解决的问题,并且做出了详细的定义,整理并介绍了情感对话生成模型建模所需的数据集。其次,对端到端的神经网络模型的原理进行了简单的概述,并且分析和总结了情感对话生成研究在每个基础模型中的改进、研究现状、模型涉及的评价指标以及模型的性能。再次,对现阶段涉及到的模型评价方式按照自动评价以及人工评价方式进行了总结。最后,对未来情感对话生成研究的发展方向进行了展望。
2022年02期 v.16;No.161 280-295页 [查看摘要][在线阅读][下载 2633K] [下载次数:857 ] |[网刊下载次数:0 ] |[引用频次:17 ] |[阅读次数:1 ] - 赵山;罗睿;蔡志平;
中文命名实体识别(NER)任务是信息抽取领域内的一个子任务,其任务目标是给定一段非结构文本后,从句子中寻找、识别和分类相关实体,例如人名、地名和机构名称。中文命名实体识别是一个自然语言处理(NLP)领域的基本任务,在许多下游NLP任务中,包括信息检索、关系抽取和问答系统中扮演着重要角色。全面回顾了现有的基于神经网络的单词-字符晶格结构的中文NER模型。首先介绍了中文NER相比英语NER难度更大,存在着中文文本相关实体边界难以确定和中文语法结构复杂等难点及挑战。然后调研了在不同神经网络架构下(RNN、CNN、GNN和Transformer)最具代表性的晶格结构的中文NER模型。由于单词序列信息可以给基于字符的序列学习更多边界信息,为了显式地利用每个字符所相关的词汇信息,过去的这些工作提出通过词-字符晶格结构将单词信息整合到字符序列中。这些在中文NER任务上基于神经网络的单词-字符晶格结构的性能要明显优于基于单词或基于字符的方法。最后介绍了中文NER的数据集及评价标准。
2022年02期 v.16;No.161 296-304页 [查看摘要][在线阅读][下载 2628K] [下载次数:2963 ] |[网刊下载次数:0 ] |[引用频次:109 ] |[阅读次数:1 ] - 裴利沈;刘少博;赵雪专;
行为识别是计算机视觉领域意义重大的热点研究问题,它经历了从手工设计特征表征到深度学习特征表达的发展过程。从传统行为识别模型和深度学习模型两方面,对行为识别发展历程中产生的主流算法进行了归类梳理。传统行为识别模型主要包括基于轮廓剪影、时空兴趣点、人体关节点、运动轨迹的特征描述方法。其中改进的密集轨迹方式拥有良好的鲁棒性和可靠性;深度学习网络架构主要有双流网络、3D卷积网络和混合网络。首先,重点阐述了各行为识别算法的主要研究思路与创新点,并介绍了每类算法的模型架构、算法特色、适用情境等。然后,对广泛使用的公共行为数据库进行了分类阐述,着重对HMDB51和UCF101数据集进行了详细介绍,比较分析了传统方法和深度学习算法在各数据集上的识别效果。通过对比分析发现,传统方法不适用于高精细行为的识别,且不易实现跨数据库或跨场景的推广;深度架构中,双流网络和3D卷积网络获得了比较好的行为识别效果且被广泛使用。最后,对行为识别的未来发展进行了展望,指出了若干将来可行的研究方向。
2022年02期 v.16;No.161 305-322页 [查看摘要][在线阅读][下载 3081K] [下载次数:2159 ] |[网刊下载次数:0 ] |[引用频次:75 ] |[阅读次数:0 ] - 阮晨钊;张祥森;刘科;赵增顺;
人-物体交互检测(HOI),就是把图像作为输入,检测出图像中存在交互行为的人和物体以及他们之间的交互动词。它是计算机视觉范畴里继目标检测、图像分割和目标跟踪之后又一新任务,旨在对图像进行更深层的理解。针对目前基于深度学习的HOI检测综述性文章的空白,以HOI检测方法的发展历程为主线,对基于深度学习的HOI检测方法进行了分类与分析。首先简要总结了早期的技术方法,然后根据模型结构将现有算法分为两阶段方法和一阶段方法并对一些代表性算法进行分析介绍。将两阶段方法分为融入注意力、图模型以及姿势和身体部位三类进行重点论述,总结了每类方法的基本思想与优缺点。此外,还详细介绍了HOI检测任务的实验评价指标、基准数据集和大多数现有方法的实验结果,对不同类别的方法取得的结果进行说明。最后对该技术面临的主要挑战进行总结分析并对未来发展趋势进行展望。
2022年02期 v.16;No.161 323-336页 [查看摘要][在线阅读][下载 1820K] [下载次数:558 ] |[网刊下载次数:0 ] |[引用频次:26 ] |[阅读次数:0 ]
- 赵恒泰;赵宇海;袁野;季航旭;乔百友;王国仁;
分布式环境下大规模维表关联技术是当前在线大数据分析的关键技术之一,其广泛应用于实时推荐、实时分析等领域。维表关联是指将流数据和离线存储的维表数据进行关联,并根据这种关联进行数据处理。首先,对已有的维表连接技术方案进行了研究,调研了相关的优化技术和主流分布式引擎的设计路线,主要通过优化维表数据查询提高性能,但传统的优化方式受到维表规模和数据流速的限制。其次,针对已有优化技术在分布式环境下对集群整体考虑使用的不足,提出了适用于对离线的批数据和实时的流数据进行混合计算的计算模型,然后提出了一种单点读取维表数据,切分后进行分发和计算的维表关联数据方式,并优化了维表关联计算逻辑,使之能适应更高的维表规模,且不再局限于对数据的连接。最后,在流计算引擎Apache Flink上实现了提出的维表关联技术和传统维表关联技术,通过实验在阿里巴巴"双十一"产生的数据上对吞吐量和延迟进行了对比,证明了对面向分布式流计算的维表关联技术的优化的有效性。
2022年02期 v.16;No.161 337-347页 [查看摘要][在线阅读][下载 2242K] [下载次数:226 ] |[网刊下载次数:0 ] |[引用频次:5 ] |[阅读次数:0 ] - 蒋祎莹;张丽平;金飞虎;郝晓红;
现有的组最近邻查询方法主要将空间中数据对象抽象为点或线段进行处理。但在现实应用中,仅仅将空间对象抽象为点或者线段,往往会影响查询的精度及效率。针对现有的组最近邻查询方法无法直接有效地处理混合数据组最近邻查询的不足,提出空间数据库中混合数据组最近邻查询方法。首先提出了混合数据Voronoi图的概念和性质。接着基于混合数据Voronoi图对混合数据集进行剪枝,针对查询对象数量为1和查询对象数量大于1的情况分别给出了相应的剪枝算法。利用所提的剪枝算法能有效去除不可能成为结果的数据对象,得到候选集合。在精炼过程中根据各个数据对象之间的位置关系给出相应的距离计算方法,通过比较候选集中数据对象到各个查询对象的距离之和,最终得到正确的查询结果。理论研究和实验表明,所提算法能够准确、有效地处理混合数据组最近邻查询问题。
2022年02期 v.16;No.161 348-358页 [查看摘要][在线阅读][下载 2661K] [下载次数:283 ] |[网刊下载次数:0 ] |[引用频次:10 ] |[阅读次数:0 ]
- 韩刚;吕英泽;罗维;王嘉乾;
2020年,新冠肺炎在全球爆发,全球医疗系统受到巨大考验,新冠肺炎患者隐私数据安全是医疗信息系统中极其重要的一环。疫情期间,中国新冠肺炎患者隐私数据泄露的案例层出不穷,给患者带来巨大的困扰。采用委托拜占庭容错机制(dBFT)提出了结合区块链的重大疫情患者隐私数据保护方案。方案以联盟链为基础,将政府机构、医疗机构和民众等不同角色分布在主侧双链模型中,采用侧链技术在主、侧链之间进行信息交互,对患者数据进行安全共享;提出了链上分级数据加密方案(HDES),采用分级加密技术对链上的患者隐私数据进行细粒度保护。最后,对主侧双链模型的请求数据吞吐量和HDES方案的加解密效率进行了实验分析,并与现有的区块链电子医疗病例方案进行比较。通过比较可得该方案具有一定的高效性、较强的安全性和较高的针对性。
2022年02期 v.16;No.161 359-371页 [查看摘要][在线阅读][下载 3600K] [下载次数:1264 ] |[网刊下载次数:0 ] |[引用频次:15 ] |[阅读次数:0 ] - 官铮;胡扬;杨志军;何敏;
针对分布式无线局域网络带内全双工接入过程的链路调度公平性问题,提出一种基于节点调度权重的全双工链路调度算法(W-FD)。通过节点调度权重实现链路负载均衡,从而提升全双工链路的吞吐量,减小节点接入时延。算法基于分布式网络结构,节点按自组织方式获取网络拓扑及邻居节点状态信息,依据节点间数据量、互扰关系和链路调度间隔等参数计算调度权重,邻域内具有较高调度权重的节点作为链路发起对象,建立全双工链路。结果表明:与传统半双工链路调度(RTS/CTS)相比,该算法在确保节点接入公平性的条件下,减小了链路调度间隔,改善了网络的吞吐量和时延性能;与现有全双工链路调度相比,该算法在业务量非均衡网络中有效改善时延尾部特性,在保证网络吞吐量的同时具有较好的调度公平性。
2022年02期 v.16;No.161 372-383页 [查看摘要][在线阅读][下载 1880K] [下载次数:114 ] |[网刊下载次数:0 ] |[引用频次:1 ] |[阅读次数:0 ]
- 李朝阳;李琳;陶晓辉;
准确的交通流预测能够为管理部门提供合理的决策依据,为驾驶员提供实时的道路状况预警,是交通领域至关重要的问题。近年来,相关研究利用图卷积神经网络(GCN)处理非欧式空间结构的特点,对来自复杂路网的交通流数据进行空间相关性建模。然而,现有基于图卷积的交通流预测方法未能充分考虑空间相关性的有向性和动态性这两个重要特点。考虑到动态交通流呈现出由固定道路结构约束的稳定空间相关性和受交通环境变化影响的动态空间相关性,提出了一种用于动态交通流预测的端到端双流图卷积网络(TSGCN)。首先,将实时交通流数据分解为具有不同空间相关性的稳定分量和动态分量。其中,稳定分量表示受路网约束和交通习惯影响的部分,动态分量则代表因交通状况变化(如交通拥堵和恶劣天气)引起的波动。然后,通过双流图卷积层提取稳定和动态的空间相关性。最后,使用参数化跳过连接方法来融合时空相关性以获得最终的预测结果。在两个公开的真实交通数据集上的实验结果表明,提出的模型优于对比的交通流预测方法。
2022年02期 v.16;No.161 384-394页 [查看摘要][在线阅读][下载 1824K] [下载次数:660 ] |[网刊下载次数:0 ] |[引用频次:25 ] |[阅读次数:0 ] - 肖泽管;陈清亮;
属性级情感分析(ABSA)的目标是识别出句子中属性的情感倾向。现有的方法大多使用注意力机制隐性地建模属性与上下文中情感表达的关系,而忽略了使用语法信息。一方面,属性的情感倾向与句子中的情感表达有紧密的联系,利用句子的句法结构可以更直接地对两者建模;另一方面,由于现有的基准数据集较小,模型无法充分学习通用语法知识,这使得它们难以处理复杂的句型和情感表达。针对以上问题,提出一种利用多种类型语法信息的神经网络模型。该模型采用基于依存句法树的图卷积神经网络(GCN),并利用句法结构信息直接匹配属性与其对应情感表达,缓解冗余信息对分类的干扰。同时,使用预训练模型BERT具有多种类型的语法信息的中间层表示作为指导信息,给予模型更多的语法知识。每一层GCN的输入结合上一层GCN的输出和BERT中间层指导信息。最后将属性在最后一层GCN的表示作为特征进行情感倾向分类。通过在SemEval 2014 Task4 Restaurant、Laptop和Twitter数据集上的实验结果表明,提出模型的分类效果超越了很多基准模型。
2022年02期 v.16;No.161 395-402页 [查看摘要][在线阅读][下载 1810K] [下载次数:494 ] |[网刊下载次数:0 ] |[引用频次:8 ] |[阅读次数:1 ] - 孙武;邓赵红;娄琼丹;顾鑫;王士同;
异构领域自适应是一种借助源域知识为语义相关但特征空间不同的目标域建模的技术。现有的异构领域自适应方法大多属于半监督方法,这些方法要求目标域中存在一部分已标记样本,然而这种数据集在很多异构领域自适应任务中是稀缺的。为了解决上述问题,提出了一种新的基于模糊规则学习的无监督异构领域自适应算法。一方面,该方法基于TSK模糊系统的规则学习分别对源域和目标域进行特征学习,通过学习两个特征变换矩阵将源域和目标域投影到一个公共特征子空间;另一方面,为了减少因特征变换所造成的信息损失,该算法采取了多种信息保持策略,并且最大化公共特征子空间中源域数据和目标域数据之间的相关性。通过在几个真实领域自适应数据集上进行实验,验证了所提算法相对于现有的异构领域自适应方法具有一定的优越性。
2022年02期 v.16;No.161 403-412页 [查看摘要][在线阅读][下载 2428K] [下载次数:306 ] |[网刊下载次数:0 ] |[引用频次:11 ] |[阅读次数:0 ] - 李广丽;袁天;李传秀;邬任重;卓建武;张红斌;
乳腺癌是女性中最常见的癌症,乳腺肿块识别模型能有效地辅助医生的临床诊断工作。然而,医学图像样本稀缺使识别模型易过拟合。提出融入深层病理信息挖掘的乳腺肿块识别模型:构建样本精选策略,跨越不同乳腺造影图像数据集筛选优质样本,从数据增强角度应对医学图像样本稀缺;由浅入深挖掘有限标注样本中蕴含的病理信息,从特征优选角度应对医学图像样本稀缺。设计多视角有效区域基因优选(MvERGS)算法,以精化原始图像特征,提升特征判别性并压缩特征维度,更好地匹配样本数量;对精化的新特征执行判别相关分析(DCA),深入挖掘异构特征间的跨模态相关性,即深层病理信息,以准确刻画乳腺肿块病灶区域。基于深层病理信息与传统分类器训练出高效的乳腺肿块识别模型,完成乳腺造影图像分类。实验表明:识别模型的关键技术指标,包括Accuracy和AUC,均优于主流基线,样本稀缺导致的过拟合问题得到缓解。
2022年02期 v.16;No.161 413-427页 [查看摘要][在线阅读][下载 3179K] [下载次数:144 ] |[网刊下载次数:0 ] |[引用频次:1 ] |[阅读次数:0 ] - 孟祥福;杨玉;张永库;张霄雁;陈柔冰;王泽;
我国政府目前已建成一定规模的充电站网络。针对充电站网络利用率低,存在大量冗余站点和电动汽车充电难等问题,提出了一种数据驱动的充电站网络优化方法。首先,该方法模拟电动汽车充电行为,对不同时间戳内的充电站分别建立队列系统,进而估计充电站间的到达率情况。在此基础上,分析城市电动汽车的充电行为空间特征,用于挖掘城市电动汽车的充电热点。然后,对充电站间的竞争依赖关系、地理位置特征及用户充电偏好间的相互作用进行建模,进而提出了充电站在网络中的使用效益评分函数。最后,建立了以最大化充电站网络使用效益为目标的充电站网络优化模型,并提出了基于充电热点的启发式网络扩展算法进行模型求解,从而获取最佳充电站网络布局。以一个典型的城区为例进行的实验测试结果表明,该方法不仅能在消除冗余站点的同时提高充电站利用率,而且能够识别充电站网络拥堵区域,为政府规划部门解决充电难问题提供了决策支持。
2022年02期 v.16;No.161 428-437页 [查看摘要][在线阅读][下载 2373K] [下载次数:292 ] |[网刊下载次数:0 ] |[引用频次:2 ] |[阅读次数:0 ]
- 王燕妮;余丽仙;
针对传统的SSD目标检测算法在进行多尺度目标检测时,存在特征图有效信息弱和困难目标漏检率大等问题,提出一种改进的SSD目标检测算法。首先,在网络特征图输出处引入即插即用的轻量级注意力机制,通过不降维、局部跨通道交互以及核大小自适应选择等操作,在保持网络原始计算量的同时有效突出特征图中关键信息。该模块有利于增强背景信息和目标信息差,可以在有效提升网络性能的同时,不增加网络的复杂性。然后,构造了一种新的特征融合模块,可以将不同尺度的特征图进行有效融合,使浅层特征层既含有丰富的细节信息,又能充分利用上下文语义信息。多尺度融合模块有利于丰富特征图信息,提升网络对困难目标的检测性能。使用公开的PASCAL VOC数据集验证该方法,改进后的网络在PASCAL VOC2007测试集上的检测精度达到了79.6%,比原始SSD算法提升了2.4个百分点,在遮挡目标数据集上提升了4.7个百分点,充分证明改进方法具有一定的时效性和鲁棒性。
2022年02期 v.16;No.161 438-447页 [查看摘要][在线阅读][下载 3850K] [下载次数:1073 ] |[网刊下载次数:0 ] |[引用频次:28 ] |[阅读次数:1 ] - 詹天明;宋博;孙乐;万鸣华;杨国为;
高光谱图像变化检测可提供地球表面的时间维变化信息,对城乡规划和管理至关重要。因具有较高的光谱分辨率,高光谱图像常被用于检测更精细的变化。针对高光谱变化检测的问题,提出一种基于协同稀疏与非局部低秩张量的高光谱图像变化检测方法。该方法首先求得前后时间点的高光谱差分图像,再根据差分图像中图像块的非局部分布特点,提取不同的非局部张量簇。然后基于协同稀疏正则化和低秩正则化建立协同稀疏与非局部低秩张量变化检测模型,并采用交替方向乘子法对模型求解得到表示系数。最后根据表示系数求得张量在不同类别中的投影残差,进而根据投影残差最小准则判断该张量块是否发生变化。在Farmland数据集和Urban area in San Francisco City数据集上进行实验,实验结果表明该方法取得较好的高光谱变化检测精度。
2022年02期 v.16;No.161 448-457页 [查看摘要][在线阅读][下载 3190K] [下载次数:236 ] |[网刊下载次数:0 ] |[引用频次:3 ] |[阅读次数:0 ] - 那峙雄;樊涛;孙涛;谢祥颖;来广志;
针对工业生产线光伏组件隐性纹检测问题,为了降低人力成本,提高检测效率,并快速适应新型产品的隐裂检测,提出了一种多损失融合的小样本光伏组件隐裂检测算法。首先,为丰富卷积神经网络提取的语义信息,引入了Transformer的多头注意力机制,缓解各批次产品的分布差异对隐裂检测的影响,促使模型从多样化产品中关注于隐裂信息;其次,利用多损失结合约束模型训练的策略优化特征提取,在直接分类损失的基础上,利用三元组损失拉近含隐裂样本间特征距离;此外,设计了隐式分类损失以适应有无隐裂两类电池片内部也存在类型差异的特点,充分学习历史组件数据的多样性。该算法能够快速提取新型组件特征,利用少量的样本特征对新产品隐裂缺陷进行准确检测。在实际工业生产数据集上的实验结果表明,该算法对新型组件的隐裂检测的召回率相较于其他基线模型可提高10个百分点,能够有效缓解含隐裂样本数量不足的问题,极大地降低了频繁对每批新产品进行数据标记和训练的开销。
2022年02期 v.16;No.161 458-467页 [查看摘要][在线阅读][下载 2777K] [下载次数:369 ] |[网刊下载次数:0 ] |[引用频次:10 ] |[阅读次数:0 ]
- 张发展;贺毅朝;刘雪静;王泽昆;
折扣{0-1}背包问题(D{0-1}KP)是0-1背包问题(0-1KP)的一种更复杂的扩展形式。为了利用离散差分演化高效求解D{0-1}KP,首先提出了一个新V型转换函数(NV),通过NV将个体的实向量映射为一个二进制向量,与已有的S型和V型转换函数相比,NV计算复杂度更低,求解效率更高。然后,基于新V型转换函数给出了一种新的离散差分演化算法(NDDE),并利用NDDE提出了求解D{0-1}KP的一个新的高效方法。最后,为了验证NDDE求解D{0-1}KP的性能,利用它求解四类大规模D{0-1}KP实例,并与基于群论的优化算法(GTOA)、基于环理论的演化算法(RTEA)、混合教学优化算法(HTLBO)和鲸鱼优化算法(WOA)等已有算法的最好计算结果进行比较,比较结果表明,NDDE不仅求解精度更高,而且算法的稳定性佳,非常适于求解大规模D{0-1}KP实例。
2022年02期 v.16;No.161 468-479页 [查看摘要][在线阅读][下载 1754K] [下载次数:187 ] |[网刊下载次数:0 ] |[引用频次:11 ] |[阅读次数:0 ] - 庞源;武继刚;陈龙;姚棉阳;
移动边缘计算技术随着科技的发展,面临着多设备多任务的能耗均衡的挑战。相关研究大多集中在如何利用边缘服务器的计算性能以减少移动设备在任务处理过程中的能耗和执行时间。但现有研究在多设备多任务的能耗均衡问题上还没有很好的解决方法。针对此类能耗均衡问题,改进了现有的边缘计算系统模型,并在此基础上,给出了多移动设备多任务的能耗均衡优化问题的计算模型,同时提出了一个贪心算法,并做出了相应的近似比分析。与总能耗优化算法以及随机算法进行对比,并进行了大量的仿真实验。实验结果证明,所提出的贪心算法的平均性能与随机算法相比在能耗均衡方面可进一步提升66.59%。通过与蛮力算法对比,在经典的任务拓扑下,当移动设备的最小传输功率分别为5 dBm和6 dBm时,贪心算法几乎获得最优解。
2022年02期 v.16;No.161 480-488页 [查看摘要][在线阅读][下载 2012K] [下载次数:500 ] |[网刊下载次数:0 ] |[引用频次:14 ] |[阅读次数:0 ] 下载本期数据