首页 > 代码库 > set和multiset容器的能力

set和multiset容器的能力

1 set和multiset容器的能力
set 和multiset容器的内部结构通常由平衡二叉树(balancedbinary tree)来实现。当元素放入容器中时,会按照一定的排序法则自动排序,默认是按照less<>排序规则来排序。这种自动排序的特性加速了元素查找的过程,但是也带来了一个问题:不可以直接修改set或multiset容器中的元素值,因为这样做就可能违反了元素自动排序的规则。如果你希望修改一个元素的值,必须先删除原有的元素,再插入新的元素。

2 set和multiset容器的操作
Constructor and Destructor

·        set c:创建一个空的set或multiset容器

·        set c(op):创建一个空的使用op作为排序法则的set或multiset容器

·        set c1(c2):创建一个已存在的set或multiset容器的复制品,容器的类型和所有元素一同复制

·        set c(beg, end):创建一个set或multiset容器,并且以[beg, end)范围中的元素进行初始化

·        set c(beg, end, op):创建一个使用op作为排序法则的set或multiset容器,并且以[beg, end)范围中的元素进行初始化

·        c.~set():容器的析构函数,销毁所有的元素,释放所有的分配内存

上面的set可以是下面几种形式:

·        set<type>:以less<>为排序法则的set

·        set<type, op>:以op为排序法则的set

·        multiset<type>:以less<>为排序法则的multiset

·        multiset<type, op>:以op为排序法则的multiset

从上面我们可以看到,可以从两个地方来指定排序法则:

(1)作为模板参数

例如:std::set<int, greater<int> > col1;

这种情况下,排序法则本身作为容器类型的一部分。对于一个set或者multiset容器,只有当元素类型和排序法则类型都相同时,他们的类型才被认为相同,否则就是不同类型的容器。

(2)作为构造函数参数
例如:std::set<int> col1(greater<int>);

这种情况下指定的排序法则不作为容器类型的一部分,你可以为相同类型的容器指定不同的排序规则。这通常应用于要求相同的容器类型,但排序规则可以不同的场合。

Size and Comparing
set
和multiset容器同样提供size(), empty(), max_size()三个关于查询元素数目的接口,提供==,!=, <, <=, >, >=等比较操作符。但值得注意的是比较操作符只针对相同类型的容器,元素类型和排序法则类型都必须相同。

Special Search Operations
set和multiset容器的内部结构对于元素的查找提供了优化空间,所以它们提供了一些特殊的查找接口,这些查找操作通常要比同名的通用算法高效,所以在相同的条件下应该优先使用这些接口。

·        count(val):返回容器中值等于val的元素数目。

·        find(val):返回容器中值等于val的第一个元素的iterator位置;如果没有匹配元素,则返回end()位置。

·        lower_bound(val):返回容器中第一个值大于或等于val的元素的iterator位置。

·        upper_bound(val):返回容器中第一个值大于val的元素的iterator位置。

·        equal_range(val):返回容器中值等于val的所有元素的范围[beg, end)组成的pair<beg, end> 。

下面我们看一个使用lower_bound(), upper_bound和equal_range(val)例子,以加深对它们的理解:

#include <iostream>

#include <set>

#include "print.hpp"

using namespace std;

int main()

{

    multiset<int> col1;

 

    col1.insert(2);

    col1.insert(5);

    col1.insert(4);

    col1.insert(6);

    col1.insert(1);

    col1.insert(5);

 

    PRINT_ELEMENTS(col1, "col1:");

    cout << endl;

 

    multiset<int>::const_iteratorpos;

    pair<multiset<int>::iterator,multiset<int>::iterator> range;

 

    cout << "lower_bound(3):" << *col1.lower_bound(3) << endl;

    cout << "upper_bound(3):" << *col1.upper_bound(3) << endl;

    range = col1.equal_range(3);

    cout << "equal_range(3):" << *range.first << " " << *range.second<< endl;

    cout << "elements withvalue(3): ";

    for (pos = range.first; pos !=range.second; ++pos)

    {

        cout << *pos<< " ";

    }

    cout << endl;

    cout << endl;

 

    cout << "lower_bound(5):" << *col1.lower_bound(5) << endl;

    cout << "upper_bound(5):" << *col1.upper_bound(5) << endl;

    range = col1.equal_range(5);

    cout << "equal_range(5):" << *range.first << " " << *range.second<< endl;

    cout << "elements withvalue(5): ";

    for (pos = range.first; pos !=range.second; ++pos)

    {

        cout << *pos<< " ";

    }

    cout << endl;

}

执行结果如下:

col1: 1 2 4 5 5 6 

 

lower_bound(3): 4

upper_bound(3): 4

equal_range(3): 4 4

elements with value(3): 

 

lower_bound(5): 5

upper_bound(5): 6

equal_range(5): 5 6

elements with value(5): 5 5 


Assignment
set
和multiset容器只提供最基本的赋值操作:

·        c1 = c2: 把c2的所有元素复制到c1中,同时c1原有的元素被销毁。

·        c1.swap(c2):交换c1和c2的元素。

·        swap(c1, c2):同上,只不过这是一个通用算法。

需要注意的是两个容器的类型要一致(包括元素类型和排序法则类型)。

Inserting and Removing Elements
set
和multiset容器的插入和删除元素接口跟其他容器也非常类似,但在细节上却存在差别。

·        c.insert(elem): 在容器中插入元素elem的一份拷贝,并返回新元素的iterator位置;如果是set容器,同时还返回是否插入成功的标志。

·        c.insert(pos, elem):在容器中插入元素elem的一份拷贝,并返回新元素的iterator位置;因为set和multiset容器的元素是自动排序的,所以pos位置只是插入位置的一个提示,设置恰当的话,可以提高插入元素的效率。

·        c.insert(beg, end):在容器中插入[beg, end)范围中所有元素的拷贝,没有返回值。

·        c.erase(val):删除容器中所有值为val的元素,返回删除元素的数目。

·        c.erase(pos):删除容器中位置pos处的元素,没有返回值。

·        c.erase(beg, end):删除容器中[ben, end)范围内所有的元素,没有返回值。

·        c.clear():删除容器中所有元素,使容器成为空容器。


其中我们重点说一下c.insert(elem)接口。

对于set容器,它的定义如下:

pair<iterator, bool> insert(const TYPE& val);

而对于multiset容器,它的定义如下:

iterator insert(const TYPE& val);

它 们的不同就是set容器的insert接口返回的是一个pair<iterator,bool>,而multiset容器的insert接口直接返回一个iterator。这是因为set容器中不允许有重复的元素,如果容器中已经存在一个跟插入值相同的元素,那么插入操作就会失败,而pair中的bool值就是标识插入是否成功的。而multiset不存在这个问题。

3 set和multiset容器的异常处理

因为set和multiset容器的独特内部结构,当发生异常时,也可以把影响减到最小。也就是说,跟list容器一样,set和multiset容器的操作要么成功,要么对原有容器没有影响。

4 运行时指定排序法则

通常情况下,我们是在定义容器时指定排序法则,就像下面形式:

std::set<int, greater<int> > col1;

或者

std::set<int> col1;    //use defaultsorting criterion less<>

 

然而,如果你需要在运行时动态指定容器的排序法则,或者你希望对于相同的容器类型却有着不同的排序法则,那么就要做一些特殊处理。下面我们看一个例子:

#include <iostream>

#include <set>

#include "print.hpp"

using namespace std;

 

template <typename T>

class RuntimeCmp 

{

    public:

        enum cmp_mode {normal,reverse};

    private:

        cmp_mode mode;

    public:

        RuntimeCmp(cmp_mode m =normal) : mode(m) {}

 

        bool operator() (constT& t1, const T& t2)

        {

            returnmode == normal ? t1 < t2 : t1 > t2;

        }

 

        bool operator== (constT& rhv) 

        {

            returnmode == rhv.mode;

        }

};

 

typedef set<int, RuntimeCmp<int> > IntSet;

 

//pre-declare

void fill(IntSet& col1);

 

int main()

{

    IntSet col1;

    fill(col1);

    PRINT_ELEMENTS(col1, "col1:");

 

    RuntimeCmp<int>reverse_cmp(RuntimeCmp<int>::reverse);

    IntSet col2(reverse_cmp);

    fill(col2);

    PRINT_ELEMENTS(col2, "col2:");

 

    if (col1 == col2) 

    {

        cout << "col1and col2 is equal" <<endl;

    }

    else

    {

        if (col1 <col2) 

        {

            cout<< "col1 is less than col2" << endl;

        }

        else 

        {

            cout<< "col1 is greater than col2" << endl;

        }

    }

    return 0;

}

 

void fill(IntSet& col1) 

{

    col1.insert(2);

    col1.insert(3);

    col1.insert(6);

    col1.insert(5);

    col1.insert(1);

    col1.insert(4);

}

运行结果如下:

col1 1 2 3 4 5 6 

col2 6 5 4 3 2 1 

col1 is less than col2


这里例子中,col1和col2有着相同的类型:set<int,RuntimeCmp<int> >,但是它们的排序法则却不相同,一个升序,一个降序。这都是通过自定义的函数对象来实现的,所以函数对象比普通函数有着更加灵活与强大的控制,可以满足一些特殊的需求。

set和multiset容器的能力