9+

您当前的位置:首页 >> 基于章节段落的学术文献结构功能识别方法研究

基于章节段落的学术文献结构功能识别方法研究

查看全文 下载全文

摘要:

摘 要:[目的/意义]学术文献的结构功能识别问题是学术大数据知识挖掘与分析的研究热点,研究如何从中挖掘有效的知识,有助于从更深层次、更细粒度理解学术文献,从而促进学术文献语义理解的发展。[方法/过程] 以学术文献的章节段落为研究对象,对卷积神经网络(CNN)、长短期记忆网络 (LSTM)、来自变换器的双向编码器表征量(BERT)等深度学习模型的学术文献章节段落的结构功能识别性能进行比较研究,并与传统机器学习算法 SVM 进行了对比实验。[结果/结论]中国知网语料集上的实验结果表明,与 SVM 和 LSTM、CNN 模型相比,BERT 模型具有更优的结构功能识别性能,其在整体识别性能上F1值达到0.66,在具体结构功能的识别性能上F1值最高达到0.79。此外,通过引入混淆矩阵, 对功能结构误识情况进行分析。

作者: 刘忠宝1,2 王宇飞3 赵文娟1,2
作者单位: 1. 云计算与物联网技术福建省高等学校重点实验室(泉州信息工程学院), 泉州 362000;2. 北京语言大学语言智能研究院,北京 100083; 3. 中北大学软件学院,太原 030051
期刊: 文献与数据学报
年.(期):页码 2020.(3):37-47
中图分类号: G256
DOI: 10.31193/SSAP.J.ISSN.2096-6695.2020.03.04
关键词: 结构功能 学术文献 章节段落 深度学习 识别方法

欢迎阅读《文献与数据学报》!您是该文第2543位读者!