C++ std::set 出现重复元素

如题,今天自定义了一个set的排序函数,重新构造了set,往里插入元素的时候居然出现了重复元素!

首先set的比较函数含义是按照元素的出现频率比较,高频率的大于低频率,如果二者频率相等,则数值小的大于数值大的。

unordered_map<int,int> ump;//统计元素频率
struct cmp{
    bool operator()(int a,int b){
        //先比频率
        //再比数值
        if(a == b) return 0;
        return ump[a] == ump[b] ? a<b:ump[a]>ump[b];
    }
};
set<int,cmp> mp;
void printmp()
{
    //输出整个set
    for(auto c:mp) cout<<c<<":"<<ump[c]<<", ";
    cout<<endl;
}
int main() {
    vector<int> nums{1,2,2,1,3};
    for(int & num : nums)
    {
        ump[num]++;
        mp.insert(num);
        printmp();
    }
};

程序的运行结果如下:

1:1,
1:1, 2:1,
2:2, 1:1, 2:2,
2:2, 1:2, 2:2,
2:2, 1:2, 2:2, 3:1,

出现这个结果我思考了半天,首先怀疑了是不是自己定义的比较函数写错了,然而并没有写错。那么在这种比较函数中两个元素是如何判断等于的呢?简单来说就是将比较函数的参数互换如果得到相同的结果,就会判断为等于。放在set的实现中是不会将其插入的。

那么问题出在哪里,就出在std::set的底层实现上,set的底层实现是红黑树,在判断是不是存在重复元素的时候,是从根节点开始向下遍历树节点访问的,如果向下访问中访问到了重复才不会插入,然而在我们的比较函数中,插入的时候1:1是比2:1要大的,也就是说2:1在1:1的左孩子上,而新加入的元素2:2是大于1:1的,因此红黑树添加到了1:1的右孩子节点,根本不会向左走去比较红黑树中已经存在的元素2,这时候set中就出现了重复元素。

如果更正以上代码应该如下:

unordered_map<int,int> ump;
struct cmp{
    bool operator()(int a,int b){
        if(a == b) return 0;
        return ump[a] == ump[b] ? a<b:ump[a]>ump[b];
    }
};
set<int,cmp> mp;
void printmp()
{
    for(auto c:mp) cout<<c<<":"<<ump[c]<<", ";
    cout<<endl;
}
int main() {
    vector<int> nums{1,2,2,1,3};
    for(int & num : nums)
    {
        if(mp.find(num) != mp.end()) mp.erase(num);
        ump[num]++;
        mp.insert(num);
        printmp();
    }
};
经验分享 程序员 微信小程序 职场和发展