- 董欣;俞鹏飞;顾晶晶;
随着遥感技术的快速发展,遥感视觉问答(RSVQA)作为一种结合语言与视觉交互的新兴技术,显著提升了地球观测、环境监测等领域中遥感图像信息的解读效率和交互能力。然而,RSVQA仍面临遥感图像信息复杂度高、遥感图像-文本对齐数据稀缺,以及文本问题表达形式多样等挑战。为了应对这些挑战,提出一种面向RSVQA的跨模态知识引入与提示推理框架(CMKIP)。针对遥感图像的高复杂度,CMKIP为大语言模型LLaMA构建可学习的图像特征适配器,以具备对复杂图像的表征能力;针对遥感图像-文本对齐数据稀缺问题,构建自动化数据生成管道,从公开遥感数据集中生成高质量的图像-文本对,实现高效的遥感领域知识注入;针对问题表达的多样性,创新性地提出一种大小模型协同推理机制,利用小模型进行知识库检索与中间推理校正,显著提升大语言模型对多样化问题的理解能力与推理准确性。此外,CMKIP支持根据任务需求灵活更换小模型,可广泛应用于遥感领域的多项下游任务。实验结果表明,CMKIP在RSVQA基准数据集上的性能显著优于现有方法,特别是在低样本场景下表现尤为突出,展示了其在RSVQA任务中的有效性和泛化性。
2026年03期 v.20;No.210 760-772页 [查看摘要][在线阅读][下载 1963K] [下载次数:345 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:13 ] - 李阳博;郭百恩;沈尧;杨蕾;魏育新;陈蕊丽;胡书良;
现实案件中赤足和穿袜足迹在混合样本库中的检索识别一直是难点问题。提出了一种基于图神经网络的赤足和穿袜足迹识别算法。设计了足迹图像到图结构的转换框架,通过网格划分将足迹分割为多个局部区域并提取统计特征作为节点属性,基于空间邻接关系建立连接,有效保留了足迹的视觉特征和空间拓扑结构。构建了专用于足迹相似度计算的图神经网络模型,融合图注意力卷积和图卷积网络的优势,通过注意力池化机制实现从节点级到图级特征表示的转换,并通过张量网络模块集成多重相似度度量策略,增强相似度计算的准确性。提出了适应足迹识别特点的数据处理与优化策略,包括加权损失函数设计和自适应学习率调度机制。实验结果表明,所提方法在测试集上达到79.53%的准确率和82.27%的F1分数,显著优于ResNet-50、孪生网络等传统深度学习方法。消融实验进一步验证了各组件对性能的贡献,证实了所提架构的合理性和有效性。
2026年03期 v.20;No.210 773-784页 [查看摘要][在线阅读][下载 2313K] [下载次数:234 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:9 ] - 匡豪;刘波;李辉越;曾闰;段围;
随着大语言模型在各领域的广泛应用,微调成为其适配特定任务的重要方法。当前主流的大模型微调方法主要分为部分微调和全量微调两种。部分微调虽能降低计算开销,但该方法仅更新大模型的少量参数,导致在复杂任务场景下,微调出的模型性能受限;虽然全量微调可以解决这一问题,但全量微调需要全面更新模型参数,从而导致微调时会存在计算资源需求高、微调时间长等问题。为解决全量微调存在的问题,提出一种基于动态Power迭代的梯度低秩投影算法(DPI-GLRP)。该方法基于秩一矩阵近似的思想,将大模型的权重矩阵在反向传播阶段产生的梯度矩阵分解为多个秩一矩阵,并通过Power迭代算法求解前r个特征向量以构成投影矩阵。该方法不仅解决了传统Power迭代只能获取单一最大特征向量的问题,还解决了以往研究中使用奇异值分解构建投影矩阵时间复杂度高、微调时间长的问题。对传统Power迭代算法进行研究发现,在特征值分布接近时,会出现收敛速度慢的问题。针对这一问题,提出一种动态Power迭代算法,该算法通过自适应调整迭代参数加快特征向量的计算效率,并从理论上证明提出的动态Power迭代算法的收敛效率比传统Power迭代要高。在LLaMA、Qwen等大模型上的实验表明,相较于LoRA等主流算法,DPI-GLRP算法能在保持或提升模型能力的同时,显著缩短微调时间,平均微调时间最多减少了80%。
2026年03期 v.20;No.210 785-800页 [查看摘要][在线阅读][下载 2172K] [下载次数:231 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:7 ] - 刘华瑞;雒伟群;张兆基;
针对文物领域多源异构数据整合困难,以及传统知识抽取方法依赖人工标注、自动化程度低等问题,提出一种基于大语言模型的文物知识图谱构建方法。融合领域专家知识与文物行业标准,构建涵盖文物核心概念及其关系的知识本体,系统定义其时空属性、文化属性和物理特征,以及文物间的关联关系,形成多维度结构化的知识框架。设计多阶段任务分解的联合抽取策略,利用大语言模型的语义理解与生成能力,将知识抽取拆解为“实体属性提取”与“三元组抽取”两个子任务,并通过提示工程引导模型逐步完成。同时,引入多维度校验机制,从逻辑一致性、领域规范性和事实准确性等三方面对生成的三元组进行验证,确保知识图谱的专业性与可靠性。实验表明,DeepSeek-R1模型在抽取任务中F1值达86.25%,较BERT-BiLSTM-CRF模型提升3.13个百分点;消融实验也验证了各模块的有效性。该方法为文物数字化保护与跨学科研究提供了高效、自动化的技术支撑。
2026年03期 v.20;No.210 801-810页 [查看摘要][在线阅读][下载 2044K] [下载次数:919 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:11 ] - 刘特立;严豫;张一帆;郭放;
立场检测技术在解析文本对特定主题的立场与态度表达方面具有核心价值,是实现文本深层语义理解的重要手段。然而,传统语言模型受限于数据驱动特性,往往在立场检测任务中存在理解偏差、缺乏时效性背景等问题,难以精准捕捉深层立场信息。为此,提出了一种基于群体核心观点挖掘的立场检测去偏方法(SD-GCOM)。该方法利用大语言模型从话题训练文本中挖掘代表性群体核心观点,并从代表性、主观性、多样性等方面进行检验,构建群体核心观点数据库作为背景知识增强立场判断;设计融合语义、观点和主题三维特征的立场概率分布模型,实现对文本近邻观点的深度理解与主题生成;通过引入平衡损失机制,有效提升少数派立场的识别能力,增强模型在复杂语境下的鲁棒性。实验结果表明,该方法在SemEval-2016、P-Stance和COVID19-Stance等多个主流基准数据集上均显著优于现有最优方法,话题综合F_(AVG)最高提升5.85个百分点,证明其在消除理解偏差、提升短文本立场判断能力方面的有效性。
2026年03期 v.20;No.210 811-828页 [查看摘要][在线阅读][下载 2229K] [下载次数:193 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:9 ] - 韩明希;蒲宝明;马驰;李思源;
针对心电图信号时空特征联合建模中存在的多尺度病理表征弱、时序依赖建模能力不足与跨尺度节律解析受限问题,提出一种层次化时空混合模型M2SRC-TBL,空间构建多尺度残差卷积模块(M2SRC)与多层级卷积架构,采用分层递减卷积核策略提取QRS波群、ST-T段等多尺度形态特征,结合改进的2D-SE模块动态增强关键波形特征的鉴别能力,解决了单一卷积核难以同时捕获宽波群与局部偏移的问题;设计全局到局部时序建模架构,利用Transformer Encoder建模RR间期等长期节律特征,通过双向长短期记忆网络(BiLSTM)解析ST段瞬时偏移等局部特征,实现全局节律与局部动态的联合表征。基于PTB-XL数据集进行二分类与20类细粒度分类实验,采用Focal Loss函数缓解类别不平衡影响。实验结果表明,在心肌梗死检测的二分类任务中,模型准确率、召回率与F1分数分别达98.22%、98.07%、98.14%;在心肌梗死类别检测的细粒度分类任务中,F1分数达96.57%。消融实验表明,空间多尺度建模使F1分数提升4.85个百分点,层次化时序设计提升1.64个百分点。混淆矩阵分析显示,模型对下壁心肌梗死(IMI)、前壁心肌梗死(AMI)等主要类别的识别准确率超过97%。该模型通过时空特征联合优化有效提高了心肌梗死诊断精度,为复杂心电信号的智能解析提供了可行方法。
2026年03期 v.20;No.210 829-839页 [查看摘要][在线阅读][下载 2050K] [下载次数:110 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:9 ]