查询结果:   邬志罡,荆一楠,何震瀛,王晓阳.基于用户查询与样本间匹配度评估的分层抽样策略[J].计算机应用与软件,2019,36(8):196 - 202.
中文标题
基于用户查询与样本间匹配度评估的分层抽样策略
发表栏目
算法
摘要点击数
61
英文标题
A STRATIFIED SAMPLING APPROACH BASED ON MATCHING DEGREE EVALUATION BETWEEN USER QUERY AND SAMPLE SET
作 者
邬志罡 荆一楠 何震瀛 王晓阳 Wu Zhigang Jing Yi’nan He Zhenying Wang Xiaoyang
作者单位
复旦大学计算机科学技术学院 上海 201203 上海市数据科学重点实验室(复旦大学) 上海 200433 上海智能电子与系统研究院 上海 200433   
英文单位
School of Computer Science, Fudan University, Shanghai 201203, China Shanghai Key Laboratory of Data Science, Fudan University, Shanghai 200433, China Shanghai Institute of Intelligent Electronics and Systems, Shanghai 200433, China   
关键词
抽样系统 近似查询处理 分层抽样 优化问题
Keywords
Sampling system Approximate query processing Stratified sampling Optimization problem
基金项目
国家自然科学基金项目(61732004);国家重点研发计划项目(2018YFB1004404);上海科技创新行动计划项目(16DZ11002001)
作者资料
邬志罡,硕士生,主研领域:数据管理。荆一楠,讲师。何震瀛,副教授。王晓阳,教授。 。
文章摘要
在数据探索性分析场景下,用户倾向于借助抽样系统获取近似查询结果来换取更快的查询速度。现有的抽样系统通常假设用户的历史查询记录能很好地表征未来的查询情况,从而针对特定的查询特征生成特定的抽样策略。然而,在现实场景中,用户探索意图变化丰富,用户查询特征的稳定性假设通常无法得到保证。为解决上述问题,提出一种评估任意用户查询与样本间匹配度的方法。离线训练生成多份样本集,并在应对具体查询时自动选取最匹配样本集进行近似结果计算。离线样本集的生成是以在所有可能的用户查询上的预期匹配度损失总和最小作为训练目标。实验结果表明,在真实数据集上,该抽样系统与现有方法相比,将近似结果的精确度提高了26.3%。
Abstract
During the data exploration tasks, users usually prefer to use sampling system for getting an approximate answer rather than suffer from high query latency. Existing sampling systems usually make hypothesis that the historical user query workload can represent the pattern of future user queries very closely. Based on this hypothesis, they specifically design sampling strategy for specific user query pattern. However, in the real use case, the users’ exploration intentions are always changing, so the hypothesis of the stability of the user query pattern cannot be guaranteed. To solve these problems, this paper proposed a method to evaluate the matching degree between any user query and the sample set. The system generated multiple offline sample sets. When a particular user query came, the system could automatically choose the best matching sample set and calculate the approximate query answer. The offline sample sets were trained so that the expected total sum of the matching degree losses upon all possible user queries became the lowest. The experimental results show that, compared with the existing methods, the accuracy of the approximate results is improved by 26.3% on the real data set.
下载PDF全文   

根据该篇关键词查找到本刊已发表相关论文供参考
序号
文  章  标  题
作者1
发表栏目
页码
摘要
1
基于用户查询与样本间匹配度评估的分层抽样策略
邬志罡
算法
2019
8
196
[摘要]
2
协同免疫量子粒子群算法求非合作博弈Nash均衡解
刘露萍
算法
2019
8
203
[摘要]
3
基于局部关键路径与截止期限分配的云工作流调度算法
蔡艳婧
算法
2019
8
220
[摘要]
4
抽油烟机新风系统对厨房热舒适性的影响研究
吕孝鲁
应用技术与研究
2019
7
99
[摘要]
5
考虑擦除编码可靠视频流三步式内凸逼近优化
朱雯曦
多媒体技术应用
2019
7
169
[摘要]
6
移动边缘计算中带有缓存机制的任务卸载策略
郭煜
网络与通信
2019
6
114
[摘要]
7
数据中心中能量与QoS保障的虚拟机部署
王以伍
应用技术与研究
2019
5
51
[摘要]
8
基于依存句法的初等数学分层抽样应用题题意理解
吴林静
人工智能与识别
2019
5
126
[摘要]
9
改进多目标蚁群算法在动态路径优化中的应用
吴耕锐
算法
2019
5
249
[摘要]
10
基于均衡适应度的云工作流调度算法
方军
算法
2019
5
255
[摘要]
11
基于反学习飞蛾火焰算法优化的LSSVM模型及其软测量应用
夏祥礼
算法
2019
5
322
[摘要]
12
基于最优个体指导单纯形法改进的人工蜂群算法及应用
赵旭芳
应用技术与研究
2019
2
44
[摘要]
13
SDN架构下的链路分离路径算法的研究
池亚平
网络与通信
2018
9
183
[摘要]
14
“一带一路”下基于两阶段模型的无水港选址研究
梁承姬
软件技术与研究
2018
8
31
[摘要]
15
使用角度选择策略的第二代Pareto强度进化算法
罗校清
算法
2018
7
290
[摘要]
16
基于目标相对重要性的模糊多目标进化算法
易高明
算法
2018
6
272
[摘要]
17
改进差分进化算法求解B样条曲线曲面拟合问题
李小艳
算法
2018
3
275
[摘要]
18
一种基于截断机制的稳态优化算法求解多目标优化问题
荆东星
算法
2018
11
283
[摘要]
19
基于网络流的自动化集装箱码头堆场空间分配
梁承姬
应用技术与研究
2018
1
77
[摘要]
20
改进的多目标粒子群优化算法
项铁铭
算法
2017
9
302
[摘要]
21
一种货架共用模式自动化立体仓库货位优化
张衍会
算法
2017
7
262
[摘要]
22
EarnCache:一种增量式大数据缓存策略
郭俊石
软件技术与研究
2017
11
44
[摘要]
23
D2D通信中高能效的资源分配算法研究
郝兰兰
网络与通信
2017
11
141
[摘要]
24
自适应重生鱼群优化算法
易正俊
算法
2016
6
227
[摘要]
25
考虑容量约束的电缆敷设变邻域搜索优化算法
梁涛
算法
2016
6
291
[摘要]
26
基于蚁群算法的直升机舰面系留索预紧力优化
吴靖
应用技术与研究
2016
3
114
[摘要]
27
基于网络编码的无线多跳网络寿命优化模型研究
李明
网络与通信
2016
2
118
[摘要]
28
融合流形特征的路面破损图像识别方法
石陆魁
人工智能与识别
2016
2
150
[摘要]
29
基于双字符搜索的GRASP-CSP算法改进
李珊珊
算法
2016
2
203
[摘要]
30
装备维修过程中备件布局的多目标优化决策
郭璐
算法
2016
10
233
[摘要]
31
基于细菌趋药性和当前最优解策略的人工蜂群算法
周长喜
算法
2016
1
268
[摘要]
32
基于群代理的QoS-AP算法优化QoS组播路由
李睿
网络与通信
2015
9
127
[摘要]
33
基于社会力模型算法的SVM参数优化
张俊杰
算法
2015
9
235
[摘要]
34
基于新搜索策略的混合蛙跳算法
赵芳
算法
2015
8
224
[摘要]
35
求解多目标优化问题的自适应混沌混合蛙跳算法
田祎
算法
2015
6
252
[摘要]
36
动态场景下视点相关简单块状分层方法
龚星宇
应用技术与研究
2015
5
102
[摘要]
37
基于粒子群算法的摄像机自标定
黄伟光
图像处理与应用
2015
5
216
[摘要]
38
生态毒理动力学函数优化方法
黄光球
算法
2015
5
249
[摘要]
39
模拟退火算法优化聚类头节点的MANET服务质量改进
鲜敏
信息技术交流
2015
4
326
[摘要]
40
基于遗传算法求解带公差的“一刀切”问题
张维存
应用技术与研究
2015
2
72
[摘要]
41
面向不确定目标的多无人机协同搜索控制方法
吴楠
人工智能与识别
2015
2
174
[摘要]
42
多选择软硬件划分问题的启发式算法比较
朱峰军
嵌入式软件与应用
2015
2
215
[摘要]
43
航班着陆调度的多目标优化研究
王东兴
算法
2015
2
224
[摘要]
44
D2D通信中基于保证蜂窝用户通信质量的功率分配算法
韩春燕
网络与通信
2015
12
83
[摘要]
45
面向多目标优化问题的自适应差分进化算法
刘红平
算法
2015
12
249
[摘要]
46
基于MapReduce工作流优化器的研究
袁开银
软件技术与研究
2015
10
54
[摘要]
47
人工鱼群算法优化支持向量机的无线传感器网络节点定位
谭军
网络与通信
2015
10
144
[摘要]
48
基于组合算法的嵌入式系统软硬件划分方法
陈玮
嵌入式软件与应用
2015
10
240
[摘要]
49
一种基于编码等价变换和遗传算法的DNA序列优化设计
郑学东
算法
2015
10
248
[摘要]
50
基于EV-SPEA2的过热汽温控制系统优化方法
周霞
算法
2015
10
260
[摘要]
51
基于多峰函数优化的无线传感网稀疏事件检测
华涛
网络与通信
2015
1
114
[摘要]
52
改进ABC算法优化LSSVM的网络流量预测模型
许爱军
信息技术交流
2015
1
323
[摘要]
53
基于模拟退火的空域扇区优化方法研究
王超
算法
2014
9
244
[摘要]
54
基于蛙跳算法的装备测试设计优化方法
魏斌
算法
2014
7
280
[摘要]
55
基于决策者与带扰动因子的布谷鸟算法
屈迟文
算法
2014
7
290
[摘要]
56
一种径向基混沌神经网络分段退火策略及应用
许楠
人工智能与识别
2014
6
158
[摘要]
57
基于多种群蚁群算法的交叉路口信号配时优化
伍尚昆
应用技术与研究
2014
5
83
[摘要]
58
一种基于加速坐标下降的大规模图像分类算法研究
王智勇
图像处理与应用
2014
4
208
[摘要]
59
遗传算法同步选择特征和支持向量机参数的网络入侵检测
李学峰
安全技术
2014
3
301
[摘要]
60
一种结合云模型思想的粒编码遗传算法
阎高伟
算法
2014
11
269
[摘要]
61
一种求解约束优化问题的改进型免疫克隆算法
么焕民
算法
2014
11
275
[摘要]
62
变异粒子群优化最小二乘支持向量机的网络流量预测
嵇可可
网络与通信
2014
10
129
[摘要]
63
基于Log-Gabor和正交局部保持投影的人耳识别方法
雷松泽
人工智能与识别
2014
10
172
[摘要]
64
基于均匀设计优化预测模型参数的混沌时间序列预测
陈海英
人工智能与识别
2014
10
176
[摘要]
65
基于Oracle罚函数的自适应约束差分进化算法
董明刚
算法
2014
1
290
[摘要]