查询结果:   张娜娜,王裴岩,张桂平.面向工艺操作说明文本的命名实体深度学习识别方法[J].计算机应用与软件,2019,36(11):188 - 195,261.
中文标题
面向工艺操作说明文本的命名实体深度学习识别方法
发表栏目
人工智能与识别
摘要点击数
6
英文标题
NAMED ENTITY DEEP LEARNING RECOGNITION METHOD FOR PROCESS OPERATION DESCRIPTION TEXT
作 者
张娜娜 王裴岩 张桂平 Zhang Nana Wang Peiyan Zhang Guiping
作者单位
沈阳航空航天大学计算机学院 辽宁 沈阳 110136 辽宁省知识工程与人机交互工程技术研究中心 辽宁 沈阳 110136    
英文单位
College of Computer Science, Shenyang Aerospace University, Shenyang 110136, Liaoning,China Research Center of Engineering and Technology for Knowledge Engineering and Human-Computer Interaction of Liaoning Province,Shenyang 110136,Liaoning, China    
关键词
工艺操作说明文本 命名实体识别 双向长短时记忆网络 条件随机场
Keywords
Process operation description text Named entity recognition Two-way long-term memory network Conditional random fields
基金项目
辽宁省自然科学基金项目(20170540705)
作者资料
张娜娜,硕士生,主研领域:人工智能,自然语言处理。王裴岩,博士生。张桂平,教授。 。
文章摘要
针对工艺操作说明文本中的命名实体,提出一种基于BiLSTM-CRF模型与词典、规则相结合的识别方法,旨在识别图纸编号、参考标准、零件和零件号等11种实体。基于BiLSTM-CRF模型,使用BERT模型预训练的向量,对相关命名实体进行初始识别;针对工艺操作说明文本中零件和零件号表达方式复杂多样的问题,使用基于词典和规则的方法对此类实体的标注结果进行校正。实验结果表明,该方法在工艺操作说明文本中能较好地完成命名实体识别任务,在测试语料上F1值达到94.03%,比基线提升了4.14%。
Abstract
This paper proposed a recognition method based on BiLSTM-CRF model combined with dictionary and rules for the named entities in the process operation description text. The purpose was to identify 11 entities such as drawing numbers, reference standards, parts and part numbers. The method was based on the BiLSTM-CRF model and used the pre-trained vector of the BERT model to initially identify the relevant named entities. Then, the method based on dictionary and rules was used to correct the labeling results of such entities, which aiming at the complex and diverse expressions of parts and part numbers in the process operation description text. The experimental results show that the method can successfully complete the named entity recognition task in the process operation description text. The F1 value reaches 94.03% in the test corpus, which is 4.14% higher than the baseline.
下载PDF全文   

根据该篇关键词查找到本刊已发表相关论文供参考
序号
文  章  标  题
作者1
发表栏目
页码
摘要
1
融合领域多词特征的英文武器装备名识别研究
雷树杰
人工智能与识别
2019
6
177
[摘要]
2
基于BILSTM_CRF的知识图谱实体抽取方法
翟社平
算法
2019
5
269
[摘要]
3
基于注意力机制的循环神经网络评价对象抽取模型
杨善良
人工智能与识别
2019
3
202
[摘要]
4
基于众包标注的中文微博命名实体识别
房辉
算法
2019
3
255
[摘要]
5
面向工艺操作说明文本的命名实体深度学习识别方法
张娜娜
人工智能与识别
2019
11
188
[摘要]
6
基于层叠条件随机场模型的电子病历文本信息抽取
梁立荣
应用技术与研究
2019
10
47
[摘要]
7
融合领域特征向量的武器装备名深度学习识别方法
雷树杰
人工智能与识别
2019
10
183
[摘要]
8
基于局部-全局一致性学习的弱监督人手分割
谢志坚
人工智能与识别
2019
1
204
[摘要]
9
专业领域智能问答系统设计与实现
陶永芹
应用技术与研究
2018
5
95
[摘要]
10
基于交互式条件随机场的RGB-D图像语义分割
左向梅
图像处理与应用
2017
3
174
[摘要]
11
基于序列标注算法比较的医学文献风险事件抽取研究
喻鑫
数据工程
2017
12
58
[摘要]
12
微博中的开放域事件抽取
陈箫箫
软件技术与研究
2016
8
18
[摘要]
13
基于多尺度特征学习的阴影检测
张永库
图像处理与应用
2016
5
185
[摘要]
14
基于层叠条件随机场的微博热点话题跟踪
戴丹
应用技术与研究
2016
4
56
[摘要]
15
基于层叠条件随机场的哈语树库构建技术研究
于智娟
应用技术与研究
2016
3
71
[摘要]
16
基于链式条件随机场的中文分词改进方法
徐浩煜
算法
2016
12
211
[摘要]
17
面向自由文本的中文地址规范化
徐娟
软件技术与研究
2015
8
22
[摘要]
18
RERM:一种基于评论挖掘的需求获取方法
崔建苓
数据工程
2015
8
28
[摘要]
19
基于CRF和规则相结合的地理命名实体识别方法
何炎祥
人工智能与识别
2015
1
179
[摘要]
20
基于分词信息的中文机构名简称自动生成方法
连誉舜
人工智能与识别
2014
4
153
[摘要]
21
基于CRF和规则的中文医疗机构名称识别
张金龙
人工智能与识别
2014
3
159
[摘要]
22
基于条件随机场的低图像质量车牌字符分割
傅建强
人工智能与识别
2014
10
157
[摘要]