查询结果:   谭敏,张宏源,张海超.基于弱监督深度学习的文本聚类算法及应用[J].计算机应用与软件,2019,36(4):171 - 177.
中文标题
基于弱监督深度学习的文本聚类算法及应用
发表栏目
人工智能与识别
摘要点击数
442
英文标题
TEXT CLUSTERING ALGORITHM AND ITS APPLICATION BASED ON WEAKLY-SUPERVISED DEEP LEARNING
作 者
谭敏 张宏源 张海超 Tan Min Zhang Hongyuan Zhang Haichao
作者单位
杭州电子科技大学计算机学院 浙江 杭州 310018     
英文单位
School of Computer Science and Technology, Hangzhou Dianzi University, Hangzhou 310018, Zhejiang, China     
关键词
图像识别 深度聚类 用户点击数据 查询合并 弱监督学习
Keywords
Image recognition Deep clustering User-click data Query clustering Weakly-supervised learning
基金项目
国家自然科学基金青年基金项目(61602136)
作者资料
谭敏,讲师,主研领域:深度学习。张宏源,硕士生。张海超,硕士生。 。
文章摘要
围绕基于用户点击数据的文本聚类展开研究。利用点击数据将查询文本表征为图像点击特征图,并在此上训练深度点击模型。为了应对文本噪声,引入可刻画文本可靠性的权重,提出基于弱监督深度学习的文本聚类算法来迭代更新文本权重和深度模型。将该算法应用于基于点击特征的图像识别中,通过合并相似文本,为图像构建紧凑的文本集点击特征向量,实现高效的图像识别。在Clickture-Dog和Clickture-Bird两个公开点击数据集上进行验证,结果表明:用图像点击特征图来表征查询文本可有效解决原始点击特征向量的稀疏和不连续性,帮助获得优秀识别率;弱监督深度聚类模型不仅帮助学习强大的文本表征,还能有效选择高质量文本数据训练模型,进一步提高性能。
Abstract
The research is based on the text clustering from user-click data. With click data, a query-text was represented as a smooth image-click-graph, and a deep click model was trained. In order to deal with heavy noise in the clicked query-text set, a weight vector that could measure the reliability of the query-text was introduced, and a text clustering algorithm based on weakly-supervised training method was proposed to iteratively update the weight vector and deep model. The text clustering algorithm was applied to click-feature-based image recognition. After combining similar query-text, a compact click-frequency-vector for images was constructed to achieve accurate image recognition. The proposed method was verified on public Clickture-Dog and Clickture-Bird datasets. The experimental results show that representing each query as an image-click-graph can deal with the non-smoothness and sparseness in the original click vectors, which helps to improve image recognition accuracy. Weakly-supervised deep learning not only helps to learn powerful representations, but also can effectively select queries of high quality, which further improved the recognition performance.
下载PDF全文   

根据该篇关键词查找到本刊已发表相关论文供参考
序号
文  章  标  题
作者1
发表栏目
页码
摘要
1
基于二维码图像识别的无人机定位方法研究
张义桢
应用技术与研究
2019
9
117
[摘要]
2
一种面向图像分类的流形学习降维算法
刘开南
算法
2019
8
210
[摘要]
3
一种基于多尺度局部纹理特征和CART决策树的野外火灾火焰图像识别算法
冯丽琦
图像处理与应用
2019
5
194
[摘要]
4
基于弱监督深度学习的文本聚类算法及应用
谭敏
人工智能与识别
2019
4
171
[摘要]
5
基于深度CNN和极限学习机相结合的实时文档分类
闫河
人工智能与识别
2019
3
174
[摘要]
6
基于Logistic回归和BPNN的二值人脸图像识别
王海燕
人工智能与识别
2019
2
240
[摘要]
7
基于改进的DenseNet深度网络火灾图像识别算法
杨其睿
图像处理与应用
2019
2
258
[摘要]
8
基于改进FOA-SVM的火灾图像识别模型研究
刘亚如
图像处理与应用
2019
10
摘要还未上传
9
基于小波和可变局部边缘模式的植物物种识别
陈肖蒙
图像处理与应用
2018
9
230
[摘要]
10
基于纹理特征的焊缝图像缺陷识别方法
孙士保
图像处理与应用
2018
5
242
[摘要]
11
基于正则表达式的图像目标特征提取方法研究
芦兵
图像处理与应用
2018
4
260
[摘要]
12
基于多路特征融合和深度学习的露霜图像分类
周忠义
图像处理与应用
2018
10
205
[摘要]
13
基于嵌入式图像识别技术的空间小位移测量
王天正
图像处理与应用
2017
9
206
[摘要]
14
基于多特征字典学习的害虫图像自动分类方法
张超凡
图像处理与应用
2017
3
142
[摘要]
15
基于随机森林的缺损杂草种子识别
龙怡霖
人工智能与识别
2016
8
185
[摘要]
16
基于反卷积神经网络的脑脊液图像快速识别模型
黄文明
图像处理与应用
2016
7
225
[摘要]
17
基于特征融合和优化极限学习机算法的虹膜识别系统
路春辉
信息技术交流
2016
7
326
[摘要]
18
连通域在复杂背景肤色检测中的应用
徐诗惠
图像处理与应用
2016
5
181
[摘要]
19
基于特征匹配的微生物弱小目标分割识别方法
吕侃徽
信息技术交流
2016
5
330
[摘要]
20
基于聚类和马氏距离的SURF昆虫图像匹配算法
兰红
图像处理与应用
2016
4
202
[摘要]
21
融合流形特征的路面破损图像识别方法
石陆魁
人工智能与识别
2016
2
150
[摘要]
22
深度卷积神经网络在Caltech-101图像分类中的相关研究
段建
图像处理与应用
2016
12
165
[摘要]
23
图像识别计数在储备生猪统计的应用
张天昊
图像处理与应用
2016
12
173
[摘要]
24
基于树型稀疏模型的重构算法在人脸图像中的研究
孙翠华
信息技术交流
2015
8
324
[摘要]
25
基于逻辑回归模型的木片和树皮的图像识别
扈华
人工智能与识别
2015
5
189
[摘要]
26
基于关系型发散的黎曼流形分类图像识别
郑翔
信息技术交流
2015
3
317
[摘要]
27
基于BP神经网络的纸币面向识别方法
刘艳萍
人工智能与识别
2015
11
176
[摘要]
28
基于角半径变换的五金器件识别系统的研究
李保俊
图像处理与应用
2015
10
181
[摘要]
29
基于嵌入式的车辆牌照识别系统设计
孔繁荣
嵌入式软件与应用
2015
10
223
[摘要]
30
基于可拓学的E-SURF图像识别算法
李延伟
图像处理与应用
2014
7
221
[摘要]
31
基于PCA多特征融合的肝脏B超临床医学图像识别研究与实现
张卫国
图像处理与应用
2014
4
239
[摘要]
32
改进单尺度Retinex的复杂光照人脸识别算法
朱珍
算法
2014
3
246
[摘要]
33
超图拉普拉斯稀疏编码在图像识别中的应用
周钦青
人工智能与识别
2014
10
183
[摘要]
34
一种基于改进BP神经网络的PCA人脸识别算法
李康顺
人工智能与识别
2014
1
158
[摘要]