9+

您当前的位置:首页 >> BiLSTM-CRF 模型在中文电子病历命名实体识别中的应用研究

BiLSTM-CRF 模型在中文电子病历命名实体识别中的应用研究

查看全文 下载全文

摘要:

[目的/意义]健康医疗大数据是我国重要的基础性战略资源。中文电子病历的命名实体识别有助于从大量非结构化文本中提取重要信息,从而为医疗数据挖掘与应用奠定基础。[方法/过程]为探讨深度学习算法在中文电子病历命名实体识别中的效果,本研究通过标注语料集,建立BiLSTM-CRF模型对电子病历中症状、检查、疾病、药物、治疗五类实体进行了识别,并与传统CRF方法进行对比,同时对不同标注方案、标注粒度以及标注类别对模型识别效果的影响进行了分析。[结果/结论]BiLSTMCRF模型在基于词的BIOES标注方案下实体识别效果最好,F值为78.12%;从实体类别来看,检查类实体的识别效果最好,而疾病类实体的识别效果不太理想。

作者: 王若佳1,2 魏思仪3 王继民1
作者单位: 1. 北京大学信息管理系,北京 100871;2. 北京大学海洋研究院,北京 100871;3. 康奈尔大学信息科学学院,美国 14850
期刊: 文献与数据学报
年.(期):页码 2019.(2):53-66
中图分类号: TP393
DOI: 10.31193/SSAP.J.ISSN.2096-6695.2019.02.05
关键词: 深度学习 电子病历 命名实体识别 BiLSTM-CRF模型 条件随机场

欢迎阅读《文献与数据学报》!您是该文第215位读者!