查询结果:   颜飞,张兴,李畅,李万杰,李帅.基于差分隐私的海量数据发布方法研究[J].计算机应用与软件,2018,35(11):314 - 320.
中文标题
基于差分隐私的海量数据发布方法研究
发表栏目
安全技术
摘要点击数
28
英文标题
MASSIVE DATA PUBLISHING METHOD BASED ON DIFFERENTIAL PRIVACY
作 者
颜飞 张兴 李畅 李万杰 李帅 Yan Fei Zhang Xing Li Chang Li Wanjie Li Shuai
作者单位
辽宁工业大学电子与信息工程学院 辽宁 锦州 121001     
英文单位
School of Electronics and Information Engineering, Liaoning University of Technology, Jinzhou 121001, Liaoning, China     
关键词
差分隐私 分组融合 噪声干扰 数据发布
Keywords
Differential privacy Grouping fusion Noise interference Data publishing
基金项目
辽宁省高等学校杰出青年学者成长计划项目(LJQ2014066);辽宁省自然科学基金项目(20170540434)
作者资料
颜飞,硕士生,主研领域:大数据安全,隐私保护。张兴,教授。李畅,硕士生。李万杰,硕士生。李帅,硕士生。 。
文章摘要
海量静态数据直方图发布过程中分组划分存在离群点,导致误差增大和离群点判定效率低的问题。对此提出一种适用于Spark框架的满足ε-差分隐私保护的海量静态数据直方图发布方法。对k-means聚类算法进行避免距离重复计算的优化改进;利用改进后的k-means聚类算法进行直方图最优分组划分,实现快速聚合相似分组,形成最优分组融合;对分组结果添加噪声处理,并将经过差分隐私保护处理后的数据进行发布。利用实际数据进行仿真实验,结果表明,所提方法在海量静态数据集隐私保护处理中可提高发布效率和保证数据隐私安全性,同时保证发布数据具有较好的可用性。
Abstract
There are outliers in group partition in the process of massive static data histogram publishing, which may lead to increased errors and low efficiency of outlier decision. To solve this problem, we presented a histogram publishing method for massive static data satisfying differential privacy protection for Spark framework. k-means clustering algorithm was optimized to avoid distance duplication calculation. The improved k-means clustering algorithm was used to partition the histogram into the best grouping, and the similar grouping was quickly aggregated to form the optimal grouping fusion. We added noise to grouping results, and published data with differential privacy protection. The simulation experiment was carried out by real data. The results show that the proposed method can improve the publishing efficiency and ensure the data privacy security in the privacy protection processing of massive static data sets. It can also ensure the availability of publishing data.
下载PDF全文   

根据该篇关键词查找到本刊已发表相关论文供参考
序号
文  章  标  题
作者1
发表栏目
页码
摘要
1
锅炉物联网监测云平台软件系统设计
赵辉
应用技术与研究
2018
7
114
[摘要]
2
基于高斯拟合的亚像素边缘检测算法
韩东
图像处理与应用
2018
6
210
[摘要]
3
扩散式样条最小四阶矩算法
周楠
算法
2018
6
230
[摘要]
4
基于差分隐私的海量数据发布方法研究
颜飞
安全技术
2018
11
314
[摘要]
5
基于小波域双谱分析的磨粒图像多尺度形状特征提取
郭恒光
图像处理与应用
2016
9
224
[摘要]
6
一种复杂背景下多尺度多视角的人体检测方法
杨颖
信息技术交流
2016
8
329
[摘要]
7
基于改进和声搜索算法的玉米叶片病害图像分割算法
刘立群
图像处理与应用
2016
4
183
[摘要]
8
基于直方图均衡化与形态学处理的边缘检测
王淑青
图像处理与应用
2016
3
193
[摘要]
9
差异化隐私预算分配的线性回归分析算法
郑剑
算法
2016
3
275
[摘要]
10
衰落环境下高速铁路基站配置标准研究
李颖
网络与通信
2016
11
71
[摘要]
11
空间信息码本和粒子滤波相结合目标跟踪算法
瞿中
算法
2016
11
230
[摘要]
12
基于改进混合蛙跳算法的图像阈值分割算法
刘立群
图像处理与应用
2015
5
212
[摘要]
13
一种结合帧差法和混合高斯的运动检测算法
於正强
多媒体技术应用
2015
4
129
[摘要]
14
复杂场景中运动目标的检测
王小霞
图像处理与应用
2015
2
203
[摘要]
15
基于自适应分类样本更新的运动目标检测
罗有志
图像处理与应用
2015
12
197
[摘要]
16
基于云计算的链接数据平台
张晓辉
软件技术与研究
2014
8
45
[摘要]
17
基于AMDF的脉搏周期检测改进算法
吴艳君
应用技术与研究
2014
6
52
[摘要]
18
协同MIMO移动Ad Hoc网络中的一种新型Alamouti编码
刘婉妮
网络与通信
2014
10
104
[摘要]
19
基于TEO能量谱减法的语音增强技术的研究
崔兆国
多媒体技术应用
2014
1
151
[摘要]
20
智能软降噪算法研究
叶尔江∙哈力木
算法
2013
4
302
[摘要]
21
基于麦克风阵列的语音增强系统设计
朱兴宇
多媒体技术应用
2013
3
240
[摘要]
22
基于Atom的个性化数据重用
魏伟
应用技术与研究
2013
12
236
[摘要]