- 许德龙;林民;王玉荣;张树钧;
当前,大语言模型在自然语言处理(NLP)领域展现出巨大的潜力,但其训练过程依赖于大量高质量样本。在低资源场景下,随着模型规模不断扩大,现有数据样本数量难以支撑模型训练收敛,这一问题激发了相关领域科研工作者对于数据增强方法的研究。然而,传统数据增强方法在NLP领域大模型背景下存在应用范围有限和数据失真的问题。相比之下,基于大语言模型的数据增强方法能够更有效地应对这一挑战。全面探讨了现阶段NLP领域大语言模型数据增强方法,采用了综合性的视角研究NLP领域数据增强。对NLP领域传统数据增强方法进行分析与总结。将现阶段NLP领域多种大语言模型数据增强方法归纳总结,并深入探讨了每一种方法的适用范围、优点以及局限性。介绍了NLP领域数据增强评估方法。通过对当前方法的对比实验和结果分析讨论了NLP领域大语言模型数据增强方法的未来研究方向,并提出了前瞻性建议。
2025年06期 v.19;No.201 1395-1413页 [查看摘要][在线阅读][下载 2253K] [下载次数:2530 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:7 ] - 张欣;孙靖超;
在全球范围内,虚假信息于互联网尤其是社交媒体中的传播,已成为亟待解决的重要议题。随着人工智能技术的兴起,虚假信息检测中大语言模型的应用研究已然成为热点。但在国内,该领域相关研究较为匮乏,尚未形成完整体系。为系统梳理其研究现状及发展脉络,对大语言模型赋能虚假信息检测的研究进行了全面总结。聚焦于基于大语言模型的虚假信息检测框架,深入探讨了大语言模型在虚假信息检测过程中数据生成、数据增强、信息抽取、结合外部知识和工具、模型改进、最终融合决策、解释与反馈生成等方面的创新应用。概述了虚假信息的定义及其传播的背景,详细剖析了框架中的核心检测过程,梳理了虚假信息检测框架中各环节的创新点,对“内部”与“外部”的检测流程进行概述,并阐述了检测过程中涉及的检索增强、提示工程、微调等模型改进与最终决策。最后,分析了当前基于大语言模型的虚假信息检测面临的挑战,并对未来的研究方向进行了展望,以期为基于大语言模型的虚假信息检测领域的发展提供借鉴与启示。
2025年06期 v.19;No.201 1414-1436页 [查看摘要][在线阅读][下载 2585K] [下载次数:1419 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:4 ] - 孟祥福;孙硕男;张霄雁;冷强奎;方金凤;
全球定位系统(GPS)、全球移动通信系统(GSM)的快速发展以及移动设备的普遍应用,产生了大量的轨迹数据。目前的轨迹数据处理方法通常以定长的向量形式输入到模型,因此如何将变长的轨迹数据转换成定长低维的嵌入向量十分重要。轨迹表示学习旨在将轨迹数据转换为更具表达力和可解释性的表示形式。对轨迹表示学习的研究现状、方法及应用进行了全面综述。分类介绍了轨迹表示学习的关键技术,总结了现有轨迹公开数据集。将轨迹表示学习方法按照不同的下游任务进行分类,重点综述了轨迹表示学习方法在轨迹相似性计算、相似轨迹搜索、轨迹聚类、轨迹预测等领域的原理、优缺点和应用,并分别分析了每一类任务中具有代表性的模型结构和原理,及各类任务中不同方法的特点和优势。分析了当前轨迹表示学习所面临的挑战,探讨了如何解决轨迹表示学习中的数据稀疏性、多模态以及模型优化与隐私保护等问题,并提出了具体的研究思路和方法。
2025年06期 v.19;No.201 1437-1454页 [查看摘要][在线阅读][下载 2069K] [下载次数:487 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:0 ] - 梁洁欣;冯跃;李健忠;陈涛;林卓胜;何盈;王松柏;
中医在预防疾病方面有着数千年的经验,而中医体质则作为中医的重要组成部分,与个体健康密切相关,因此在疾病预防和治疗中发挥着重要作用。近年来,信息技术与人工智能的快速发展,推动了众多智能技术在中医体质辨识领域的广泛应用。这些技术不仅使传统的中医体质辨识过程更加科学系统化,还为中医的现代化和个性化医疗提供了强有力的技术支持,旨在进一步提高中医体质辨识的准确性和效率。为了推进中医体质智能辨识的研究工作,对其方法的研究进展进行了梳理与总结。从数据层面对基于数据分析的体质辨识方法进行了系统性概括;回顾并讨论了基于传统机器学习的体质辨识方法,从分类器的角度进行比较;阐述了基于深度学习的体质辨识方法,并从网络架构角度将其划分为早期神经网络、卷积神经网络、混合网络及其他方法。针对上述三种方法,根据其研究方法和结果分别进行了分析,比较了各自的优势与局限性,并讨论了未来研究工作中的潜在发展趋势。
2025年06期 v.19;No.201 1455-1475页 [查看摘要][在线阅读][下载 2048K] [下载次数:1433 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:1 ] - 朱佳音;李杨;李明;马金刚;
宫颈癌作为一种常见的严重威胁女性生命健康的恶性肿瘤,其早期诊断和治疗对患者的生命安全至关重要。然而,由于传统的人工检查在效率和结果一致性上存在不足,迫切需要利用计算机辅助技术来提升诊断的准确性和效率。近年来,深度学习技术飞速发展,将其应用于宫颈细胞分割领域,极大提高了分割的精确度和速度,进而显著提升了宫颈细胞学检查的准确性与效率,为宫颈癌的早期诊断提供了强有力的技术支持。为了更好地了解深度学习技术在宫颈细胞分割领域的研究现状和进展,对当前广泛使用的公开的宫颈细胞分割数据集进行了总结,对常用的评价指标进行了系统归纳,以便更好地理解不同模型的性能表现。深入探讨了深度学习技术在宫颈细胞分割领域的具体应用,并对不同算法的主要改进策略、实际效果及其局限性进行了详尽的比较分析。对该领域当前所面临的挑战和问题进行了剖析,并对未来的研究方向提出了展望。
2025年06期 v.19;No.201 1476-1493页 [查看摘要][在线阅读][下载 1975K] [下载次数:654 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:1 ]