文献与数据学报

9+

关于本刊

主管单位：中国社会科学院 主办单位：中国社会科学院图书馆 社会科学文献出版社 出版单位：社会科学文献出版社 主  编：王岚 副主编：初景利（执行） 王继民 张大伟 ISSN：2096-6695 CN：10-1611/G2

友情链接

中国社会科学院 国家哲学社会科学文献中心 中国社会科学院图书馆 中国图书馆学会 中国社会科学情报学会 国际图联

相关刊物

中国图书馆学报 图书情报工作 情报学报 大学图书馆学报 情报资料工作 图书情报知识 情报科学 数据分析与知识发现

您当前的位置：首页 >> 基于章节段落的学术文献结构功能识别方法研究

基于章节段落的学术文献结构功能识别方法研究

查看全文

下载全文

下载PDF阅读器

摘要：	摘要：［目的/意义］学术文献的结构功能识别问题是学术大数据知识挖掘与分析的研究热点，研究如何从中挖掘有效的知识，有助于从更深层次、更细粒度理解学术文献，从而促进学术文献语义理解的发展。［方法/过程］以学术文献的章节段落为研究对象，对卷积神经网络（CNN）、长短期记忆网络（LSTM）、来自变换器的双向编码器表征量（BERT）等深度学习模型的学术文献章节段落的结构功能识别性能进行比较研究，并与传统机器学习算法 SVM 进行了对比实验。［结果/结论］中国知网语料集上的实验结果表明，与 SVM 和 LSTM、CNN 模型相比，BERT 模型具有更优的结构功能识别性能，其在整体识别性能上F1值达到0.66，在具体结构功能的识别性能上F1值最高达到0.79。此外，通过引入混淆矩阵，对功能结构误识情况进行分析。
作者：	刘忠宝^1,2王宇飞³ 赵文娟^1,2
作者单位：	1. 云计算与物联网技术福建省高等学校重点实验室（泉州信息工程学院），泉州 362000；2. 北京语言大学语言智能研究院，北京 100083； 3. 中北大学软件学院，太原 030051
期刊：	文献与数据学报
年.(期):页码	2020.(3):37-47
中图分类号：	G256
DOI：	10.31193/SSAP.J.ISSN.2096-6695.2020.03.04
关键词：	结构功能学术文献章节段落深度学习识别方法
欢迎阅读《文献与数据学报》！您是该文第2543位读者！