网站建设教育平台点点 wordpress
news/
2025/9/30 2:58:06/
文章来源:
网站建设教育平台,点点 wordpress,手机app与手机网站的区别,高端t恤定制网站想象为翼#xff0c;起飞~ 跳表简介#xff1f; skiplist本质上是一种查找结构#xff0c;用于解决算法中的查找问题#xff0c;跟平衡搜索树和哈希表的价值是 一样的#xff0c;可以作为key或者key/value的查找模型。
跳表由来 skiplist是由美国计算…
想象为翼起飞~ 跳表简介 skiplist本质上是一种查找结构用于解决算法中的查找问题跟平衡搜索树和哈希表的价值是 一样的可以作为key或者key/value的查找模型。
跳表由来 skiplist是由美国计算机科学家William Pugh于1989年发明skiplist顾名思义首先它是一个list。实际上它是在有序链表的基础上发展起来的。我们知道在对一个有序链表进行查找它的时间复杂度为O(N)。
William Pugh开始了他的优化思路:
● 假如我们每相邻两个节点升高一层增加一个指针让指针指向下下个节点如下图所示: 这样新增的一层指针通过连接可以形成新的链表它包含了整个链表节点的一半由此需要在这一层进行比较、筛除的个数也就降低了一半。 以此类推继续增加一层指针新链表的节点数下降查找的效率自然而然也就提高了。按照上述每增加一层节点数就少一半其查找的过程类似于二分查找使得查找的时间复杂度可以降低到O(LogN)。 当然上述查找的前提是一个有序的链表。无论你是对其中的链表新增节点还是删除节点都可能打乱原有维持的指针连接从而导致跳表失效。。如果要维持这种对应关系就必须把新插入的节点后面的所有节点也 包括新插入的节点重新进行调整这会让时间复杂度重新蜕化成O(n)。
● 随机层数: 为了避免这种情况skiplist的设计不再严格要求对应比例关系而是插入一个节点的时候随机出一个层数。这样每次插入和删除都不需要考虑其他节点的层数。 skiplist如何保证效率 那么skiplist在引入随机层数后如何保证其查找效率呢首先这个随机层数会有一个限制这里把它叫做maxlevel其次会设置一个多增加一层的概率p。那么计算这个随机层数的伪代码如下图: 我们最终可以得到这样一个数学式用于计算一个节点的平均层数:
有了这个公式我们可以很容易计算出:
当 p 1/2 时: 每个节点所包含的平均指针数目为2。
当 p 1/4 时: 每个节点所包含的平均指针数目为1.33。 至于跳表的平均时间复杂度为O(logN)这个推导的过程较为复杂愚钝的我也就不在此摆弄文墨下面的两篇中英文章可以给你提供你要的答案: 铁蕾大佬的博客http://zhangtielei.com/posts/blog-redis-skiplist.html.
William_Pugh大佬的论文: http://ftp.cs.umd.edu/pub/skipLists/skiplists.pdf.
跳表实现: leetcode上有一道实现跳表的题你可以在这上面完成跳表的测试 https://leetcode.cn/problems/design-skiplist/ 当然讲了这么多还是没具体说说到底跳表是如何进行查找的所以我们要实现的第一个函数接口就是跳表元素查找:
skipList初始化:
// 跳表不仅仅是要存储数据 _data
// 还需要有next指针当然这些next指针也不止一个
// 这取决于 当前节点的层数
typedef struct SkiplistNode
{int _val; // 节点值vectorSkiplistNode* _nextV; // 节点连接的其他表项SkiplistNode(int val, int level):_val(val), _nextV(level, nullptr){}
}Node;class Skiplist {
public:Skiplist() {// 初始化 _headList// 默认给一层_head new SkiplistNode(-1, 1);}
private:Node* _head; // 头节点double _prate 0.25; // 新增层概率int _MaxLevel; // 最大层数
}; Search: bool search(int target) {// 1.从头节点查Node* cur _head;// 记录的层数// 0~n-1的下标int level _head-_nextV.size() - 1;while (level 0){// target 大于 下一个节点的val cur向右移动if (cur-_nextV[level] target cur-_nextV[level]-_val){cur cur-_nextV[level];} // 因为支持数据冗余 所以如果出现一样的就把新节点插在它后面即可else if(cur-_nextV[level]nullptr || target cur-_nextV[level]-_val){// target 小于 下一个节点的val --level || next节点为空--level;}else{// 找到了return true;}}return false;} Add: vectorNode* FindPath(int num){// 从头节点查起Node* cur _head;int level _head-_nextV.size()-1;// 开和level一样的大小vectorNode* prevV(level1,_head);while (level 0){if (cur-_nextV[level] num cur-_nextV[level]-_val){// 只管移动cur cur-_nextV[level];} // 因为支持数据冗余 所以如果出现一样的就把新节点插在它后面即可else if (cur-_nextV[level] nullptr || num cur-_nextV[level]-_val){// 记录该层num的前一个节点prevV[level] cur;// 向下更新--level;}}return prevV;}int RandomLevel(){int level 1;while (rand() _prate * RAND_MAX level _MaxLevel){level;}return level;}void add(int num){// 前驱节点vectorNode* prevV FindPath(num);// 创建节点int n RandomLevel();Node* newnode new Node(num, n);// 可能创建节点层数 _headif (n _head-_nextV.size()){// 进行扩容_head-_nextV.resize(n,nullptr);// prevV也许跟着扩容// 这里的新增前驱节点为什么初始化为 _head?// 新增节点一定是连接在 prevV里的节点之后的prevV.resize(n, _head);}// 前后连接节点for (int i 0;i n;i){// 可以理解为newnode-next prev-next-nextnewnode-_nextV[i] prevV[i]-_nextV[i];prevV[i]-_nextV[i] newnode; // 连接回来}} 这里的randomLevel()是以一种巧妙的方式完成的: 通过p可以控制最终值产生范围的概率。 不过C有专门的随机数生成的库比这个rand功能更加强大,所以我们可以将那个RandomLevel()改成这样: int RandomLevel(){// 随机数种子static static std::default_random_engine generator(std::chrono::system_clock::now().time_since_epoch().count());// 生成随机数范围static std::uniform_real_distributiondouble distribution(0.0,1.0);size_t level 1;while (distribution(generator) _prate level _MaxLevel){level;}return level;} Erase: bool erase(int num){vectorNode* prevV FindPath(num);// 这里可能找不到if (prevV[0]-_nextV[0] nullptr || prevV[0]-_nextV[0]-_val ! num) return false;// 我们根据prevV的最底层节点 就可以找到del节点Node* del prevV[0]-_nextV[0];// 根据该节点的层数 更新prevV 和 nextV// 进行连接for (int i 0;i del-_nextV.size();i){prevV[i]-_nextV[i] del-_nextV[i];}// 删除节点// 这里记录levelint level del-_nextV.size();delete del;// 如果删除的节点是 最高层呢 并且是唯一呢// 这种优化可以不做 但你也可以做// 就是重新定义_head的高度// 向下遍历 只要遇到不为空的最高 就breakint i _head-_nextV.size() - 1; while (i 0){if (_head-_nextV[i] nullptr){--i;}else{break;}}_head-_nextV.resize(i 1);return true;} 最后我们可以通过leetcode提供的测试用例来测试测试咱们写的跳表。 跳表vs平衡搜索树和哈希表的对比 最后一个话题 skiplist相比平衡搜索树(AVL树和红黑树)对比都可以做到遍历数据有序时间复杂度也差不多。不过skiplist与平衡搜索树的最大优势在于:
● skiplist实现简单容易控制。平衡树增删查改遍历都更复杂.
● skiplist的额外空间消耗更低。平衡树节点存储每个值有三叉链平衡因子/颜色等消耗。可是skiplist可以通过p来调整每个节点的指针个数那是个可接受的数量。 skiplist相比哈希表而言在查找上就没有那么大的优势了。
● 哈希表平均时间复杂度是O(1)比skiplist快。 相反skiplist在这些方面胜过哈希表: ● 遍历数据有序
● skiplist空间消耗略小一点哈希表存在链接指针和表空间消耗
● 哈希表再极端场景下哈希冲突高效率下降厉害需要红黑树补足接力 本篇到此结束感谢你的阅读。
祝你好运向阳而生~
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/922427.shtml
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!