数据库查询通信开销降低97%的技术方案

news/2025/10/15 23:10:57/文章来源:https://www.cnblogs.com/codeshare1135/p/19144481

如何将数据库查询的通信开销降低高达97%

某中心的研究人员描述了一种在服务器间分配数据库表的新方法。

在第46届超大型数据库国际会议上,研究人员提出了一种跨服务器分配数据的新方法。在涉及从多个表检索数据的查询实验中,该方法相对于原始未优化配置将通信开销降低了高达97%。

连接多重图

该方法的第一步是创建所谓的连接多重图。在连接多重图中,顶点是数据库的表,边连接已执行连接操作的独立表的属性,边权重表示这些属性间连接所需的数据传输。

目标是找到使所有边累积权重最大化的图分区方案。研究证明该问题是NP完全的,意味着精确求解在计算上不可行。

优化方法

研究人员采用了"最佳世界"方法,首先尝试使用整数线性规划来分区图,对线性规划求解器设置时间限制。如果求解器超时,则使用四种不同的启发式方法对图进行分区,并选择产生最大累积权重的方案。

这四种启发式方法都是最大权重匹配问题的近似解,研究证明该问题是分布键推荐问题的特殊情况。

测试结果

在四个不同数据集上的测试表明,该方法将通信开销降低了80%到97%,这些节省将直接转化为客户端的性能改进。

该方法已被某中心Redshift Advisor采用,用于向客户推荐数据存储配置,使他们能够执行更高效的数据库查询。
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号(网络安全技术点滴分享)

公众号二维码

公众号二维码

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/937867.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

人生的底色

人生的底色是孤独的,孤独的出生,孤独的生活,孤独的死去,生命中的每一个人终究只会伴你走过一段旅程,或长或短,或开心或痛苦,但孤独却会伴随你的一生。

差分操作正确性证明

差分操作正确性证明 本文是作者因题目写差分写挂了后随手总结的。 定义 对于一个长度为 \(n\) 的数组 \(a\),定义其差分数组为 \(p\),且 \(\forall 1\le i\le n,p_i=a_i-a_{i-1}(a_0=0)\)。 转化回原数列 给些式子就…

ansible安装脚本

ansible安装脚本#!/usr/bin/env bash # # 通用 Ansible 安装脚本 # 支持多种方式安装(yum/apt/pip/source) # 支持 root 和 普通用户 # 支持自定义版本(默认 2.9.27)set -eANSIBLE_VERSION=${1:-2.9.27} # 默认…

详细介绍:【笔记】介绍 WPF XAML 中 Binding 的 StringFormat详细功能

详细介绍:【笔记】介绍 WPF XAML 中 Binding 的 StringFormat详细功能pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: &…

CF2143D2

给定长度为 \(n(n \le 2000)\) 的序列 \(a\),询问有多少个子序列满足不存在长度 \(\ge 3\) 的下降子序列。 显然可以 DP,令 \(dp_{i, j, k}\) 表示前 \(i\) 个数组成的子序列,最大值为 \(j\),长度为 \(2\) 的下降…

结果(Results)和结论 (Conclusion)的联系与区别

学术论文中结果(Results)和结论 (Conclusion)的联系与区别维度 结果 (Results) 结论 (Conclusion)联系 结论基于结果。结论必须以结果的客观发现为基础,不能无中生有。区别 事实呈现,描述“是什么”(What)。 事实的…

【训练技巧】PyTorch多卡训练模型DistributedDataParallel和DataParallel设置方法详解及分布式训练命令解释 - 实践

【训练技巧】PyTorch多卡训练模型DistributedDataParallel和DataParallel设置方法详解及分布式训练命令解释 - 实践pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; …

20251015

今天上了离散数学课,然后收获了非常多的知识,接着又上了马克思原理课,今天总结下来就是非常的收获,然后中午经过一个舒爽的午睡以后,直接完成英语作业,读了单词剪辑了视频作业,非常的满意,然后还写了算法与数据…

java date 初始化指定时分秒及比较日期大小

java date 初始化指定时分秒及比较日期大小java date 初始化指定时分秒及比较日期大小Date now = new Date();/*** 注意:使用new Date(year, month, date)构造方法时,年份是绝对的年份(比如1999),月份是从0开始的…

软件工程学习日志2025.10.15

今日核心成果 完成了EIMS系统三大核心窗口的视觉统一与体验优化,实现了从"功能可用"到"体验优雅"的重要跨越。 ✨ 界面焕新:细节中的专业感全局视觉语言统一• 字体系统:全平台采用Microsoft Y…

实用指南:玳瑁的嵌入式日记---0929(ARM--ADC)

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

C++篇:007

C++篇:007$(".postTitle2").removeClass("postTitle2").addClass("singleposttitle");C++篇:007.C++20常用新特性 一、模块 模块是一个用于在翻译单元间分享声明和定义的语言特性。它…

C++篇:006

C++篇:006$(".postTitle2").removeClass("postTitle2").addClass("singleposttitle");C++篇:006.C++17常用新特性 一、折叠表达式 C++17中引入了折叠表达式,主要是为了方便模板编程,…

C++篇:005

C++篇:005$(".postTitle2").removeClass("postTitle2").addClass("singleposttitle");C++篇:005.C++11常用新特性 一、auto 在新标准中,auto的功能变为类型推断,通知编译器去根据初…

C++篇:004

C++篇:004$(".postTitle2").removeClass("postTitle2").addClass("singleposttitle");C++篇:004.综合案例 基于字符串的IO操作 1.iostream istream 读取 ostream 写入 iostream 读写 …

轻量级ChatGPT克隆版nanochat技术解析

某知名AI研究员发布开源项目nanochat,提供完整的ChatGPT风格模型训练与推理流程。该项目包含8000行代码,涵盖分词器训练、Transformer预训练、监督微调及强化学习等关键技术环节。轻量级ChatGPT克隆版nanochat技术解…

10.15 —— 2020icpc上海D

临近一个月得知区域赛有了名额,可能也不算是好消息,大概率会延续去年打铁的经历。但不管怎样,我都会全力以赴,就算失败,我也会坦然地告诉自己尽力了,没有什么遗憾。 紧急进行一个小规划:争取每天练一道铁铜牌区…

[QOJ888] Travel around China 题解

存在[QOJ888] Travel around China 题解Petrozavodsk Winter 2021. Day 4. PKU Contest (Common Contest 1)考虑 \(n = 2\),猫树分治,考虑统计所有经过 \(mid\) 的区间,从 \(mid\) 开始跑最短路,处理出区间左右端点…

MySQL面试必考:从入门到精通的20个问题

低级难度问题问题:MySQL和SQL Server有什么区别? 答案:MySQL是一个开源的关系数据库管理系统,而SQL Server是微软开发的一个商业数据库管理系统。它们在性能、安全性、功能和成本方面有所不同。 案例: -- MySQL 分…

手撕大模型 | MQA 和 GQA 原理解析

一、前言 大模型(参数规模通常数十亿至万亿级)在处理复杂任务时面临三大核心问题:显式关联的局限性:传统 Multi-head Attention 依赖输入数据的显式特征(如文本中的词向量、图像中的像素特征)计算注意力,难以捕…