查询结果:   胡迁,黄青松,刘利军,李帅彬,冯旭鹏.基于主题与语义的对话语料关键词抽取方法[J].计算机应用与软件,2018,35(12):27 - 32,60.
中文标题
基于主题与语义的对话语料关键词抽取方法
发表栏目
数据工程
摘要点击数
227
英文标题
KEYWORDS EXTRACT METHOD FROM DIALOGUE CORPUS BASED ON THE TOPIC AND SEMANTIC
作 者
胡迁 黄青松 刘利军 李帅彬 冯旭鹏 Hu Qian Huang Qingsong Liu Lijun Li Shuaibin Feng Xupeng
作者单位
昆明理工大学信息工程与自动化学院 云南 昆明 650500 昆明理工大学云南省计算机技术应用重点实验室 云南 昆明 650500 昆明理工大学教育技术与网络中心 云南 昆明 650500   
英文单位
Faculty of Information Engineering and Automation, Kunming University of Science and Technology, Kunming 650500, Yunnan, China Yunnan Key Laboratory of Computer Technology Applications, Kunming University of Science and Technology, Kunming 650500, Yunnan, China Educational Technology and Network Center, Kunming University of Science and Technology, Kunming 650500, Yunnan, China   
关键词
对话语料 关键词抽取 语义信息 主题信息
Keywords
Dialogue corpus Keyword abstract Semantic information Topic information
基金项目
国家自然科学基金项目(81360230,81560296)。
作者资料
胡迁,硕士生,主研领域:自然语言处理,自动问答。黄青松,教授。刘利军,讲师。李帅彬,硕士。冯旭鹏,硕士。
文章摘要
话信息反映对话者的兴趣,为快速了解对话主题或内容,抽取对话中关键词非常有意义。传统的对话语料关键词抽取方法多基于词频或者共现关系,却忽略语义和主题,因此提出一种基于语义和主题自动关键词抽取方法。结合中文语料训练得到词向量和主题模型;计算词的语义权重,包括词与全文语义相似度权重,词语义聚类权重,词性权重。根据词的语义权重得到Top-N词作为关键词;将TFIDF方法和语义权重方法抽取的关键词作为节点,基于节点间语义相似度建图,通过图迭代得到最终的关键词。该方法有效地解决传统算法忽略语义和主题的问题,同时兼顾词语频率。实验结果表明,该方法优于传统的TFIDF和TextRank方法。
Abstract
The dialogue usually reflects the interest of participator. In order to quickly understand the subject or content of the conversation, it is primary meaningful to extract keywords from the dialogue. The traditional keywords extract method is mostly based on the term frequency and co-occurrence relation, and ignores the semantic and topic. This paper proposed an automatic keywords abstract method for dialogue which was based on the semantic and topic. Chinese corpus training was used to obtain word vector and topic model. The semantic weight of the word was calculated, including the weight of semantic similarity with the dialogue, the semantic clustering weight, and the weight of the POS. According to the semantic weight of the word, Top-N words were selected as keywords. We took the keywords extracted from TFIDF method and semantic weight method as nodes, constructed a graph based on semantic similarity between nodes, and obtained the final keywords by graph iteration. The method effectively solves the problem that traditional algorithm ignores semantics and themes, and takes word frequency into account. Experimental results show that the proposed method is superior to TFIDF and TextRank methods.
下载PDF全文   

根据该篇关键词查找到本刊已发表相关论文供参考
序号
文  章  标  题
作者1
发表栏目
页码
摘要
1
基于依存关系和双通道卷积神经网络关系抽取方法
吴佳昌
算法
2019
4
241
[摘要]
2
基于TextRank和字符级卷积神经网络的小学作文素材自动分类模型研究
朱晓亮
人工智能与识别
2019
1
220
[摘要]
3
基于FD-SSD的遥感图像多目标检测方法
朱敏超
图像处理与应用
2019
1
232
[摘要]
4
基于变分循环自动编码器的协同推荐方法
李晓菊
算法
2018
9
258
[摘要]
5
基于卷积神经网络的跨领域语义信息检索研究
谢先章
数据工程
2018
8
73
[摘要]
6
基于HNC理论的社区问答系统问句检索模型构建
夏远远
数据工程
2018
8
98
[摘要]
7
智慧旅游中基于语义轨迹的高效最近邻查询方法研究
孙一格
数据工程
2018
6
36
[摘要]
8
膝关节镜手术规划及训练系统
莫建清
图像处理与应用
2018
6
214
[摘要]
9
基于语义相似度的本体概念更新方法研究
李婉婉
软件技术与研究
2018
4
15
[摘要]
10
一种基于LDA和TextRank的文本关键短语抽取方案的设计与实现
郎冬冬
应用技术与研究
2018
3
54
[摘要]
11
基于丝绸文物的配色专家系统
彭国明
应用技术与研究
2018
2
69
[摘要]
12
语音识别中神经网络声学模型的说话人自适应研究
金超
人工智能与识别
2018
2
200
[摘要]
13
基于神经网络的图像弱监督语义分割算法
顾攀
算法
2018
2
284
[摘要]
14
基于主题与语义的对话语料关键词抽取方法
胡迁
数据工程
2018
12
27
[摘要]
15
改进的卷积神经网络图片分类识别方法
闫河
人工智能与识别
2018
12
193
[摘要]
16
基于SLAM算法和深度神经网络的语义地图构建研究
白云汉
人工智能与识别
2018
1
183
[摘要]
17
图像语义相似性网络的文本描述方法
刘畅
图像处理与应用
2018
1
211
[摘要]
18
基于并行化递归神经网络的中文短文本情感分类
谢铁
算法
2017
3
205
[摘要]
19
基于词向量的微博话题发现方法
李帅彬
数据工程
2017
12
47
[摘要]
20
网络诈骗信息垂直搜索引擎的设计与实现
胡亮
安全技术
2017
11
302
[摘要]
21
一种基于深度学习的新型小目标检测方法
陈江昀
人工智能与识别
2017
10
227
[摘要]
22
基于HM-SVMs的问句语义分析模型
范士喜
应用技术与研究
2016
5
84
[摘要]
23
基于LDA的问答网站话题抽取算法
战学刚
应用技术与研究
2016
4
95
[摘要]
24
基于结构特征和元模型的中文表格语义分析方法
张家锐
应用技术与研究
2016
3
90
[摘要]
25
一种融合词项关联关系和统计信息的短文本建模方法
马慧芳
数据工程
2016
10
28
[摘要]
26
基于语言无关性语义Kernel学习的短文本分类
易欣
信息技术交流
2015
7
314
[摘要]
27
面向城市交通信息的垂直搜索引擎的设计与实现
袁萌
信息技术交流
2015
3
306
[摘要]
28
一种基于主题类别信息问句检索的新方法
杨海天
数据工程
2015
2
24
[摘要]
29
双语信息处理方法及原理
邹晓辉
应用技术与研究
2015
11
69
[摘要]
30
基于维基知识的微博事件追踪方法
唐浩浩
软件技术与研究
2015
10
21
[摘要]
31
RFID物联网中EPC数据抽象与解析方法研究
赵会群
应用技术与研究
2014
6
32
[摘要]
32
基于多特征的中文关键词抽取方法
杨颖
应用技术与研究
2014
11
109
[摘要]