计算机科学与探索


前沿·综述

  • 通信-感知-计算融合:关键技术、挑战与未来趋势

    刘壮;吴宇赫;陈雨然;刘芮彤;董晏宁;赵军;

    在构建未来高度融合的物理与数字世界中,通信、感知与计算的深度整合已成为下一代智能网络的关键技术。聚焦于通信-感知-计算融合(ISCC)技术,系统剖析了其理论与应用价值。从技术演进和新兴需求出发,明确了ISCC在提升系统智能化、降低时延和优化资源利用方面的关键作用,尤其是在满足沉浸式扩展现实(XR)、全息通信和自动驾驶等新兴业务需求中的必要性;深入探讨了ISCC的核心技术体系,包括无线感知、多模态感知、移动边缘计算和感知与通信的深度融合机制,并揭示了其在数字孪生网络、算力网络和空天地一体化网络中的创新应用场景,展示了其在高精度感知、高效数据处理和实时通信方面的优势;系统梳理了ISCC技术在实际部署中面临的多维度挑战,如体系架构设计复杂性、空口协议优化难题、资源管控动态性、数据安全与隐私保护严峻性以及多源干扰管理复杂性,并展望了未来研究方向,强调了跨学科理论创新、标准化推进和系统性仿真验证的重要性。

    2025年09期 v.19;No.204 2273-2301页 [查看摘要][在线阅读][下载 2381K]
    [下载次数:1178 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:1 ]
  • 知识图谱补全研究综述

    昂格鲁玛;王斯日古楞;斯琴图;

    知识图谱已在众多领域得到广泛应用,显著推进了人工智能相关任务的发展。然而,知识图谱在实际应用中仍面临知识不完备的挑战,这一挑战严重限制了知识图谱在下游任务中的应用效果。知识图谱补全任务能够预测知识图谱中缺失的连接,以解决知识不完备的问题。系统梳理了知识图谱及其补全技术的研究背景,明确了其在人工智能与自然语言处理等领域的关键作用。根据信息来源的不同,将现有补全方法划分为基于结构信息、基于文本信息以及融合结构与文本信息等类型,并对各类方法的代表性成果进行了介绍、优缺点比较及适用场景的归纳,揭示了当前技术的发展脉络与演进趋势。关注多语言知识图谱补全的研究进展,探讨了跨语言实体对齐等关键技术,强调了跨语言知识共享与统一建模的重要性。分析了知识图谱补全在知识融合、知识挖掘等方面的挑战,并展望了未来可能的研究趋势。

    2025年09期 v.19;No.204 2302-2318页 [查看摘要][在线阅读][下载 1716K]
    [下载次数:1070 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:1 ]
  • 空间最近邻及其变体查询研究综述

    王璐琦;高继勋;唐昊;李松;赵媛媛;

    空间最近邻查询及其扩展的变体查询是空间数据库研究领域中的重要内容,被广泛地应用于地理信息系统、模式识别、决策支持、城市规划等众多领域。近年来许多空间最近邻及其变体查询算法被提出,对现有的空间最近邻查询工作进行综合分析和梳理。针对最近邻查询索引结构,从基于网格的空间索引结构、基于树的空间索引结构和混合空间索引结构详细介绍目前空间索引结构的研究进展,分析索引结构的优缺点;针对最近邻查询算法的变体查询算法,重点研究分析了以下几种最近邻变体查询:反最近邻查询算法、连续最近邻查询算法、最近对查询算法、障碍最近邻查询算法和基于最近邻的空间Skyline查询算法等。对于每种变体详细分析其算法的特点、研究现状和核心技术,并归纳出变体算法的优缺点和适用范围等。阐明了当前研究工作面临空间数据量大量增加、空间数据维度高和数据查询需求的多样性等问题,并对其未来的发展趋势进行了展望。

    2025年09期 v.19;No.204 2319-2340页 [查看摘要][在线阅读][下载 1941K]
    [下载次数:92 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:0 ]
  • 深度学习在上肢骨折诊断中的研究进展

    魏宗月;仇大伟;刘静;李振江;常少华;

    上肢骨折作为临床常见且复杂的创伤性骨折类型,其诊断准确性对患者的治疗和康复具有重要的意义。传统X射线(X-ray)诊断方法操作繁琐且耗时,难以满足现代医学对高效、精确诊断的需求。在此背景下,深度学习辅助上肢骨折诊断主要利用深度学习模型对医学影像进行分类、检测和分割,确定影像中是否存在异常,提高模型诊断的速度和准确性,同时也为医生提供了更有价值的辅助意见。为了更好地了解深度学习技术在上肢骨折诊断领域的研究现状和进展,详细介绍了几种常见的上肢骨折类型并对当前广泛使用公开的上肢骨折数据集进行了总结,对常用的评价指标进行了系统归纳,以便更好地理解模型在不同任务中的性能表现。深入分析了深度学习在图像分类、目标检测和图像分割三项计算机视觉(CV)任务中的应用进展,通过总结各算法的优化策略及其在骨折诊断中的具体应用,比较了各自的优势与局限性,并对深度学习模型的可解释性进行总结。从数据规模、使用方法、算法优缺点及实验结果等方面进行了全面对比,系统总结了当前上肢骨折诊断中面临的主要挑战,并对未来研究方向进行了展望。

    2025年09期 v.19;No.204 2341-2362页 [查看摘要][在线阅读][下载 2237K]
    [下载次数:489 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:1 ]
  • 面向自动驾驶汽车长短时特性的轨迹预测综述

    刘晓佳;陈泓妤;于德新;陈云结;周宇琴;

    自动驾驶汽车近年来逐步发展,轨迹预测是实现自动驾驶车辆安全高效决策的关键技术。准确的轨迹预测不仅能够提升自动驾驶车辆的安全性,还能有效提高交通流畅度和驾驶效率。然而车辆的未来轨迹是由驾驶员、环境以及车辆当前行驶状态共同决定的,周围复杂的驾驶环境与车辆间的交互制约着轨迹预测的准确性。总结了车辆轨迹预测领域常用的数据集和评估指标,针对现有轨迹预测方法预测时域的不同,从短时预测和长时预测两个方面对该领域进行了系统综述。通过对不同方法的研究现状进行研究,报告了长时域的基于深度学习、强化学习、基于意图识别的预测方法,短时域的基于物理模型的方法,以及预测时域位于二者之间的基于传统机器学习方法的研究现状,并对比了不同车辆轨迹预测方法的优势和劣势。通过综合最新进展,指出交通模式和驾驶意图等高级语义特征在长时轨迹预测中发挥重要作用。最后针对全过程轨迹预测的挑战,提出集成短时预测与长时预测的综合轨迹预测将成为未来研究的主要方向,有助于推动可解释、实时的轨迹预测系统在自动驾驶中的应用。

    2025年09期 v.19;No.204 2363-2383页 [查看摘要][在线阅读][下载 1789K]
    [下载次数:1029 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:0 ]

理论·算法

  • 基于时空特征融合与序列重构的时间序列异常检测

    杨彬;马廷淮;黄学坚;王宇博;王朝明;赵博文;于信;

    异常检测是时间序列分析的关键组成部分,旨在识别时间序列中的异常事件。针对传统方法在融合时空相关性、捕捉序列常态分布以及时变特性方面的局限性,提出了一种基于时空特征融合与序列重构的时间序列异常检测模型(AnomNet)。该模型包含时空特征融合网络(STF)、时间序列重构网络和异常检测机制(ADM)三个主要部分。时空特征融合网络结合时域卷积网络和图注意力影响网络,分别捕捉时域长期依赖和全局属性关联,实现时空特征的联合建模;时间序列重构网络采用多层编码器-解码器架构,利用时空融合特征和周期信息,学习样本的正常分布,从而放大重构数据与潜在异常之间的差异;异常检测机制通过拟合重构偏差的尾部分布来进行异常检测,一旦异常分数超过预设阈值,该机制将触发对广义帕累托分布参数的更新,为后续检测提供最新标准。在五种公开数据集上的实验结果验证了AnomNet在时间序列异常检测领域达到先进水平。与OmniAnomaly相比,所提模型的平均性能提升了11.89%。

    2025年09期 v.19;No.204 2384-2398页 [查看摘要][在线阅读][下载 2706K]
    [下载次数:586 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:2 ]
  • 由交换测试和相位估计构建的量子神经网络

    李盼池;刘广硕;

    针对量子计算和神经计算的融合问题,研究了一种基于交换测试和相位估计的量子神经网络模型及算法。提出了一种采用多比特控制的交换测试量子线路,在此基础上结合相位估计提出了一种量子神经元模型。该模型的输入、权重、输出均为量子比特,其中权重比特的相位为模型参数。基于量子神经元构建了量子神经网络模型,并在该模型的输出端执行测量,以获得网络的实值输出。详细设计了与网络模型相关的各种量子线路,根据量子计算理论导出了网络各层的输入输出关系,根据梯度下降算法,详细设计网络参数的调整方法。在经典计算机上,以平面点集识别和手写体数字二分类问题为仿真对象,虽然不能验证量子计算的并行性,但能验证模型的执行效果。仿真结果表明,该模型的分类能力相较于同等参数规模的经典BP神经网络有明显优势,从而揭示出基于多比特交换测试和相位估计方法构建量子神经网络模型的研究方案是有效可行的,可为量子神经网络研究提供一种新思路。

    2025年09期 v.19;No.204 2399-2407页 [查看摘要][在线阅读][下载 1873K]
    [下载次数:86 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:0 ]

图形·图像

  • 位置强化与双路径边缘增强解码的盲道分割方法

    翁静梁;王龙业;曾晓莉;刘梦瑶;易婷;

    针对盲道分割任务中背景复杂、边界模糊以及盲道形状多样化导致的分割效果不佳等问题,提出了一种位置强化与双路径边缘增强解码的盲道分割方法。设计了位置强化特征提取模块,通过在降采样过程中融入MobileVitv3构成的主干网络,增强模型对盲道特征的感知能力,充分保留上下文信息;提出了融合通道位置强化注意力模块,分别在通道和空间维度上强化特征提取,提升模型在低对比度场景下有效区分盲道与背景信息的能力;采用双路径边缘增强解码方式,对盲道的区域与边界信息进行解码,并结合联合损失函数进一步优化边界细节的处理。此外,针对当前缺乏大规模公开盲道数据集的问题,自制了一个多场景盲道数据集(MSBD),为模型训练和实验验证提供了更丰富的数据支持。实验结果表明,该网络在MSBD数据集上的mIoU、Precision、Recall以及F1-score分别达到96.82%、96.84%、96.48%、96.66%,均优于SegFormer、Deeplabv3+等网络;在输入图片大小为512×512×3时,参数量和计算量分别为1.73×10~6和1.93 GFLOPs,且推理帧率可达86 FPS,综合性能优于所对比网络;同时该网络在公开盲道人行道数据集(BACD)和Cityscapes数据集上的综合指标也优于所对比网络。

    2025年09期 v.19;No.204 2408-2418页 [查看摘要][在线阅读][下载 2104K]
    [下载次数:285 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:1 ]
  • 特征增强和渐进式解码的RGB-D显著性检测

    化春键;姚烨涛;蒋毅;俞建峰;陈莹;

    针对现有的大多数RGB-D显著性检测方法在特征提取过程中难以有效提取多尺度特征以及在解码过程中模态特征信息交互不充分导致信息丢失的问题,提出了一种特征增强和渐进式解码的RGB-D显著性检测方法。针对多尺度特征提取困难,导致算法对多目标、小目标物体检测精度低的问题,构建了多尺度自注意力特征增强模块;为了充分发挥两种模态特征的优势,构建了跨模态特征融合模块,以增强不同模态分支之间的信息交互;为了解决解码过程中信息易丢失的问题,提出了渐进式加权融合解码器,充分整合细化不同模态的特征信息;对逐层解码的结果采用混合损失函数监督训练,实现初始显著图优化。在5个公开基准数据集上与10种先进主流方法进行的对比实验表明,该方法在5个指标上均有较优表现。实验结果表明,该方法在多种复杂情况下都能获得相对精确的显著图,达到了较为先进的性能。

    2025年09期 v.19;No.204 2419-2429页 [查看摘要][在线阅读][下载 2255K]
    [下载次数:110 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:0 ]
  • 融合局部-全局特征的双分支遥感影像建筑物提取网络

    刘二虎;李浩文;胡煜;徐胜军;李小晗;史亚;

    从遥感影像中高效且自动地提取建筑物信息是遥感智能化解译的一项重要工作,然而高分辨率遥感影像中的建筑物大小不一、形状多变,背景干扰严重,导致现有算法的提取效果不佳。针对此问题,提出了一种融合局部-全局特征的双分支网络,用于遥感影像中建筑物的准确高效提取。设计了一种CNN与Transformer双分支结构的编码器以同时捕获建筑物的局部纹理信息和全局上下文依赖关系;为了克服CNN分支与Transformer分支所提取特征的差异性,设计了跨特征注意力融合模块(CFAFM)来有效地聚合两个分支所提取到的两组不同特征,对其进行重要性加权;为了增强解码器的细粒度特征恢复能力,设计了特征细化增强模块(FREM),插入至解码器的末端以减少上采样过程中的信息丢失,细化建筑物的边缘和局部细节。在WHU、Massachusetts及Inria建筑物数据集中,所提网络的IoU分别达到90.84%、74.94%、81.24%,F1-score分别达到95.20%、85.53%、89.69%。实验结果表明,所提网络可以有效提高遥感影像建筑物的提取精度,且在复杂任务场景下与现有方法相比具有明显的优势。

    2025年09期 v.19;No.204 2430-2444页 [查看摘要][在线阅读][下载 2824K]
    [下载次数:340 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:1 ]

人工智能·模式识别

  • 伪标签驱动的类内域对齐:跨域开放集故障诊断

    江德鸿;卢佳慧;李岩;

    目前,域适应故障诊断方法具有广泛的应用和发展。这些方法通常假设训练数据与测试数据共享相同的标签集。然而在实际应用中该假设往往不成立,且测试环境中可能会出现未知故障类别。为了解决这一挑战,提出了一种基于伪标签驱动的类内域对齐的跨域开放集故障诊断算法。该算法在域适应过程中利用目标域的伪标签机制,通过构建类内域对齐策略,有效缩小源域与目标域同类样本在特征空间中的分布差异,提升模型对已知类的判别能力,并通过扩展分类器的加权对抗学习来构建未知类的决策边界。为减少伪标签决策错误的影响,该方法通过伪标签的熵重新分配样本权重,从而更加准确地区分未知类与已知类。在三个轴承数据集上的实验结果表明,该方法在已知类类别和未知类类别准确率上均优于主流方法,充分验证了其有效性和先进性。

    2025年09期 v.19;No.204 2445-2457页 [查看摘要][在线阅读][下载 2280K]
    [下载次数:253 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:1 ]
  • 基于强化学习的社交网络影响力最小化模型GCNNs-DDQN

    陈梓彦;袁得嵛;孙泽宇;程佳琳;

    谣言传播迅速且危害较大,因此,利用辟谣信息对谣言传播进行抑制对于社会稳定有重要意义。为了使已经传播的谣言的影响力尽快减小并消失,提出一种结合图神经网络GCN、GNN、Double DQN的动态辟谣GCNNsDDQN模型。使用GCN获得节点作为源节点和目标节点的初始节点嵌入,结合节点状态向量,将其作为输入传入4个耦合的GNN以获得复杂节点嵌入,进行Q值计算,同时使用Double DQN结合Q值与奖励,优化4个耦合的GNN和Double DQN模型的权重参数,从而实现根据谣言传播的情况,选择当前情况下影响力最大的节点发布辟谣信息。使用10个不同大小的真实数据集来评估模型的辟谣效果,并对各参数对辟谣效果的影响进行分析,最后进行消融实验。实验结果表明,GCNNs-DDQN模型具有更强的泛化能力,能够应用于不同的社交网络中,相较于传统算法,辟谣时间最高可缩短2个单位时间;对谣言有利的参数值的增加,会加大辟谣难度,增加阻断时间,而对辟谣信息有利的因素,则不一定会减少阻断时间,反而可能阻碍辟谣。

    2025年09期 v.19;No.204 2458-2469页 [查看摘要][在线阅读][下载 2112K]
    [下载次数:254 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:1 ]
  • 基于跨模态图掩码和特征增强的推荐方法

    景丽;郑公浩;李晓涵;蔚梦媛;

    提出了一种基于跨模态图掩码和特征增强的推荐方法,旨在减少传统多模态推荐系统中的数据噪声和解决多模态信息表达不足问题。该方法使用CLIP预训练模型提取语义一致性的文本和视觉特征,根据项目模态特征相似性建立项目-项目图,为项目表示提供语义丰富的上下文信息;设计跨模态图掩码重建方法,该方法充分利用模态间特征信息,减少数据噪声并增强特征,之后使用图卷积网络学习用户和项目交互信息;在最终预测时,使用用户偏好分数更准确地捕捉用户对目标项目的偏好,通过不同方面的偏好分数加权计算,更为有效地完成推荐任务。使用多任务联合学习框架进行模型训练,同时兼顾了多模态信息和交互信息,有效提升了多模态推荐的准确性。在Women Clothing、Men Clothing、Beauty、Toys&Games四个公共数据集上的实验结果表明,所提出的方法在召回率(Recall)和归一化折损累计增益(NDCG)指标上均优于现有的基准算法,在Recall@20指标上,比最先进的基线提升8.04%,在NDCG@20指标上,比最先进的基线提升7.31%。

    2025年09期 v.19;No.204 2470-2478页 [查看摘要][在线阅读][下载 1841K]
    [下载次数:225 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:0 ]
  • 联合双粒度图像信息的多模态方面级情感分析

    许威;张晓琳;张换香;张景;

    多模态方面级情感分析(MABSA)作为一种细粒度情感分析技术,旨在通过整合多种模态的特征数据来提高该领域的精度和效果。现有的多模态方面级情感分析的研究大多集中在文本和图像模态间的跨模态对齐上,忽略了图像的粗细粒度特征信息对MABSA子任务的潜在贡献。为此,提出一种联合双粒度图像信息的多模态方面级情感分析方法(CDGI)。在多模态方面词提取任务中,为增强图像与文本模态的交互,利用ClipCap获取图像的粗粒度特征描述文本,作为图像提示信息,辅助模型预测文本中的方面词及其属性。在多模态方面词情感分类中,为了捕获丰富的图像细粒度情感特征,通过跨模态注意力机制,将带有原始情感语义的图像底层特征与掩码后的文本经过多层深度交互,强化图像特征到文本特征的融合。在两个公共的Twitter数据集和Restaurant+数据集上的实验结果表明,CDGI的表现优于当前的基线模型,验证了图像粗细粒度特征对MABSA子任务不同贡献度的合理性。

    2025年09期 v.19;No.204 2479-2492页 [查看摘要][在线阅读][下载 1931K]
    [下载次数:502 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:0 ]
  • 多阶段学习的SBERT单词级文本对抗性样本检测

    常戬;张辉;金海波;王冰冰;

    对抗性样本是在原样本上添加微小扰动,使模型以高置信度产生错误输出的样本。由于其在嵌入空间与原样本高度相似,检测难度较大。同时,大多数语言模型并非专为生成高质量嵌入向量设计,难以有效区分对抗性样本与正常样本,尤其在应对复杂的单词级对抗攻击时,细微的语义差异通常难以被捕捉,从而影响检测性能。针对这一局限,提出了一种创新的句子嵌入模型多阶段学习方法,系统优化SBERT模型的嵌入空间表达,显著放大对抗性样本与普通样本的差异性。第一阶段的训练通过对比学习增强SBERT的区分能力,使对抗性样本与正常样本表征分离;第二阶段的训练结合监督对比学习和多级噪声增强,进一步优化嵌入空间,使同类样本更紧密聚集、异类样本充分分离;第三阶段利用分类器将模型的嵌入向量映射为标签。实验在BERT和Mamba模型作为攻击目标的情况下,针对三种分类数据集和多种文本对抗性攻击类型进行测试,结果表明该方法在检测对抗性样本时效果优异,同时也具备出色的跨模型、跨攻击和跨数据集的泛化能力,为文本对抗性样本检测提供了新的方法和思路。

    2025年09期 v.19;No.204 2493-2505页 [查看摘要][在线阅读][下载 2230K]
    [下载次数:169 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:1 ]

实践·应用

  • 多语言平行情感语料库的构建与研究

    张浩;李世琪;刁宇峰;杨亮;林鸿飞;樊小超;

    在自然语言处理领域,多语平行语料库的构建与应用日益成为研究热点,其在跨文化交流、机器翻译、情感分析及智慧问答等领域的应用价值愈发凸显。特别是在“一带一路”倡议背景下,深化中蒙两国在文化、经济及社会领域的交流合作具有重要意义。因此,该研究构建了一个涵盖中文、传统蒙文和新蒙文的多语平行情感语料库,以推动蒙文体系下的情感分析研究。该语料库的构建不仅有助于深化中蒙两国间的文化交流与合作,还将促进我国民族团结及蒙古族文化的传承与发展。该研究基于SMP2020-EWECT和OCEMOTION两个公开中文情感分析数据集,采用先进的机器翻译技术,将中文文本自动翻译为传统蒙文和新蒙文,并通过机器校对与人工校对相结合的双重验证机制,确保语料库的准确性和高质量。对该语料库进行详尽的数据分析,以确保文本的多样性与平衡性,涵盖不同领域和情感类别,保证语料库在多种自然语言处理任务中的广泛适用性和代表性。通过一系列系统性的实验,探索了多种情感分析模型在蒙文数据上的性能表现,实验结果验证了该语料库在情感分析任务中的可用性和研究价值。

    2025年09期 v.19;No.204 2506-2519页 [查看摘要][在线阅读][下载 2050K]
    [下载次数:649 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:0 ]
  • 高能效CNN加速器设计

    喇超;李淼;张峰;张翠婷;

    当前,卷积神经网络(CNN)被广泛应用于图片分类、目标检测与识别以及自然语言理解等领域。随着卷积神经网络的复杂度和规模不断增加,对硬件部署带来了极大的挑战,尤其是面对嵌入式应用领域的低功耗、低时延需求,大多数现有平台存在高功耗、控制复杂的问题。为此,以优化加速器能效为目标,对决定系统能效的关键因素进行分析,以缩放计算精度和降低系统频率为主要出发点,研究极低比特下全网络统一量化方法,设计一种高能效CNN加速器MSNAP。该加速器以1比特权重和4比特激活值的轻量化计算单元为基础,构建了128×128空间并行加速阵列结构,由于空间并行度高,整个系统采用低运行频率。同时,采用权重固定、特征图广播的数据传播方式,有效减少权重、特征图的数据搬移次数,达到降低功耗、提高系统能效比的目的。通过22 nm工艺流片验证,结果表明,在20 MHz频率下,峰值算力达到10.54 TOPS,能效比达到64.317 TOPS/W,相较同类型加速器在采用CIFAR-10数据集的分类网络中,该加速器能效比有5倍的提升。部署的目标检测网络YOLO能够达到60 FPS的检测速率,完全满足嵌入式应用需求。

    2025年09期 v.19;No.204 2520-2531页 [查看摘要][在线阅读][下载 2148K]
    [下载次数:170 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:1 ]

大数据技术

  • 具有复制鲁棒性的高效数据交易估值框架

    陈思远;陈辰;袁野;李博扬;

    随着数据交易市场的兴起,数据价值评估成为关键技术问题。尽管数据夏普利值是一种公平的数据价值度量方法,但其高昂的计算成本和对数据复制攻击缺乏抵御能力,严重限制了在实际数据交易场景中的应用。提出了一种高效且具备复制鲁棒性的数据交易估值框架。针对数据夏普利值计算效率低下的问题,优化了数据集合效用计算后的更新策略,提出了一种高效的数据夏普利值近似算法OA-Shapley(one for all Shapley)。该算法通过单次效用计算更新所有数据点的夏普利值,显著提高了计算效率,并在理论上保证了算法的无偏性和均方误差。针对数据复制攻击问题,从理论上推导出严格冗员性是复制鲁棒性的充分条件,并基于此提出了CL+Shapley(Cluster+Shapley)数据估值框架。该框架通过聚类预处理实现严格冗员性,能够有效抵御数据复制攻击,并且与具体的数据夏普利算法解耦,具有广泛的适用性。实验结果表明,OA-Shapley算法在去除高(低)价值数据点实验中,AUC指标优于基线算法12.4%(3.5%),无效数据检出量增加9%~32%。CL+Shapley框架在复制攻击实验中展现出优异的复制鲁棒性。

    2025年09期 v.19;No.204 2532-2547页 [查看摘要][在线阅读][下载 2391K]
    [下载次数:110 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:1 ]
  • 基于Spark框架的RDD数据块增益感知缓存替换策略

    贺莎;唐小勇;

    缓存替换是Spark内存优化的一个研究热点和难点。然而,应用程序特征的多样性、内存资源的有限性以及缓存替换的不确定性对实现高系统执行性能构成了挑战。低效的缓存替换策略可能会导致不同的性能问题,如应用程序执行时间长,资源利用率低等。基于此,提出一种面向Spark大数据处理框架的弹性分布式数据集(RDD)数据块增益感知缓存替换策略。该策略建立了综合考虑数据块分区大小、引用计数、计算成本和资源成本影响因子的缓存价值评估模型,用于准确评估数据块的缓存价值。提出缓存增益问题模型,以形式化描述缓存管理的优化问题。提出RDD数据块增益感知缓存替换算法(CRCA),以确保内存中的RDD数据块带来的缓存增益最大化。为验证CRCA算法的有效性,基于Spark构建了一个真实的大数据集群实验平台,并采用HiBench基准测试工具中的多样化负载进行实验评估。结果表明,提出的缓存替换算法在任务执行时间和CPU利用率方面优于现有的最近最少使用算法(LRU)和最小分区权重算法(LPW)。

    2025年09期 v.19;No.204 2548-2558页 [查看摘要][在线阅读][下载 1872K]
    [下载次数:352 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:0 ]

编者信息

  • “极端环境图像处理与应用”专题征文通知

    <正>近年来,密集遮挡、极端弱光、高动态模糊、水下浑浊、强辐射等极端环境日益成为智慧城市、深空探测、极地科考、灾害应急、智能交通和高端制造等领域的常态场景。面对信噪比极低、退化类型多样、目标尺寸微小或密集的原始影像,传统图像处理链路在增强复原、信息解析和下游应用中屡遭瓶颈。与此同时,跨模态融合、物理退化建模、生成式人工智能等新兴技术不断涌现,为极端环境图像处理与应用注入创新动力。

    2025年09期 v.19;No.204 2559页 [查看摘要][在线阅读][下载 600K]
    [下载次数:0 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:2 ]
  • 下载本期数据