跳跃表的分析与实现

首页 > 代码库 > 跳跃表的分析与实现

2024-07-12 10:07:36 222人阅读

<body>

----《大规模分布式存储系统：原理解析与架构实战》读书笔记

在了解了
Bitcask存储模型后,又开始研究LSM树存储引擎。LSM在实现的过程中使用了一个很有意思的数据结构：跳跃表。之前在《算法导论公开课》中听过这一节。当时感觉这种结构和二叉树简直是殊途同归，但是一直没有亲自动手实现过。这次又遇到了，就来实现试试看。话说跳跃表和各种平衡树一样，都是用来加速查询的。要随手实现一个B树不容易，但是实现一个跳跃表就简单很多。

跳跃表的简单介绍

跳跃列表一个有序链表，按层建造的。底层是一个普通的有序链表。每个更高层都充当下面列表的"快速跑道"，查找一个元素时，可以先通过高层的“快车道”，在快车道上找不到时，从最接近目标元素的快车道逐步进入慢车道，直到最后找的目标元素。
分析的时候，常用的形状如下：

各层是完全分开的列表。但是在实际实现中，则使用的为如下结构：

这种方式将多条联表的值合并到一起，同时使用指针来构造高层"快车道"。这种方式管理起来简单，节省空间。

更详细的介绍，请看跳表SkipList。

跳跃表的复杂度分析以及概率因子p

来看看跳跃表的复杂度分析:

空间复杂度： O(n) （期望）
跳跃表高度： O(logn) （期望）

跳跃表的高度

实际使用时，如果高度太高，会造成空间浪费，我们要做一个空间和时间的平衡。那么跳跃表的高度多少最合适？
假设跳跃表中的元素个数为N，当跳跃表的高度为log(N)时，跳跃表进化为一个二叉树结构，其查询次数与二分查找法一致。这无疑最理想的结果。

如果有一亿条记录，高度log(N)约等于30。redis中，最大高度也就是32，最多可以存几亿条记录。通常，我们用不了这么多记录。所以高度可以降低一点。

跳跃表的实现

跳跃表在levledb和redis中均有实现。二者都是用C实现的。我这个实现是C++版本的

skiplist
skiplist0.2。

主要特点为：

支持模板
0.2版本增加了对迭代器和反向迭代器的支持
可自定义高度，默认为8，0.2版本版本改为了16
因为高度为8的话适合几百条的记录，这时候，选用跳跃表并没有太多优势，不如之间使用排序数组。将默认值改为16的话，可以方便几万条记录大小的地方使用。
概率p:暂时使用p=1/2
做过单元测试，放心使用啦

初始版本简单直接，支持的函数为insert,find,remove。不支持范围操作。0.2版本增了对了迭代器的支持。
另外，在实现的时候也遇到一些问题，要注意模板编程与平时编程有所不同，平时编程通常实现和定义分离，分别放在.cpp和.h中。但是模板编程编写的通常是没有具现的实现，为了方便，一般定义和实现都会放在.h文件中。

初始版本简单直接，支持的函数为insert,find,remove。不再介绍。下面是0.2版本实现的函数及其功能：
void insert(const_value_type &value)
在当前表中插入value值。值可以重复。
void remove(const_value_type &value)
删除第一个值为value的元素。重复值需要多次删除
void clear()
清空跳跃表
iterator find(const_value_type &value)
返回第一个值为value的元素的迭代器，否则返回end.
iterator begin(int level = 0)
返回指向当前表中第level层的第一个元素的迭代器。使用begin的时候，可以指定遍历不同的层，默认为最底层。这个实际上并不是标准的迭代器，为了实现分层遍历进行了特化。
iterator end() const
返回指向当前表中最后一个元素的迭代器。
iterator rbegin() const
返回指向当前表中最后一个元素的反向迭代器。
iterator rend() const
返回指向表中第一个元素的反向迭代器。
unsigned long size()
返回当前表中元素的数目
unsigned int level()
返回当前表的总层数
unsigned int maxlevel()
返回当前表的能使用的最大层数
bool empty()
判断表是否为空

代码地址见上面的链接。

欢迎光临我的网站----蝴蝶忽然的博客园----人既无名的专栏。
如果阅读本文过程中有任何问题，请联系作者，转载请注明出处！

声明：以上内容来自用户投稿及互联网公开渠道收集整理发布，本网站不拥有所有权，未作人工编辑处理，也不承担相关法律责任，若内容有误或涉及侵权可进行投诉：投诉/举报工作人员会在5个工作日内联系你，一经查实，本站将立刻删除涉嫌侵权内容。

联系
我们

首页 > 代码库 > 跳跃表的分析与实现