C++ std::set 出现重复元素
如题,今天自定义了一个set的排序函数,重新构造了set,往里插入元素的时候居然出现了重复元素!
首先set的比较函数含义是按照元素的出现频率比较,高频率的大于低频率,如果二者频率相等,则数值小的大于数值大的。
unordered_map<int,int> ump;//统计元素频率 struct cmp{ bool operator()(int a,int b){ //先比频率 //再比数值 if(a == b) return 0; return ump[a] == ump[b] ? a<b:ump[a]>ump[b]; } }; set<int,cmp> mp; void printmp() { //输出整个set for(auto c:mp) cout<<c<<":"<<ump[c]<<", "; cout<<endl; } int main() { vector<int> nums{1,2,2,1,3}; for(int & num : nums) { ump[num]++; mp.insert(num); printmp(); } };
程序的运行结果如下:
1:1, 1:1, 2:1, 2:2, 1:1, 2:2, 2:2, 1:2, 2:2, 2:2, 1:2, 2:2, 3:1,
出现这个结果我思考了半天,首先怀疑了是不是自己定义的比较函数写错了,然而并没有写错。那么在这种比较函数中两个元素是如何判断等于的呢?简单来说就是将比较函数的参数互换如果得到相同的结果,就会判断为等于。放在set的实现中是不会将其插入的。
那么问题出在哪里,就出在std::set的底层实现上,set的底层实现是红黑树,在判断是不是存在重复元素的时候,是从根节点开始向下遍历树节点访问的,如果向下访问中访问到了重复才不会插入,然而在我们的比较函数中,插入的时候1:1是比2:1要大的,也就是说2:1在1:1的左孩子上,而新加入的元素2:2是大于1:1的,因此红黑树添加到了1:1的右孩子节点,根本不会向左走去比较红黑树中已经存在的元素2,这时候set中就出现了重复元素。
如果更正以上代码应该如下:
unordered_map<int,int> ump; struct cmp{ bool operator()(int a,int b){ if(a == b) return 0; return ump[a] == ump[b] ? a<b:ump[a]>ump[b]; } }; set<int,cmp> mp; void printmp() { for(auto c:mp) cout<<c<<":"<<ump[c]<<", "; cout<<endl; } int main() { vector<int> nums{1,2,2,1,3}; for(int & num : nums) { if(mp.find(num) != mp.end()) mp.erase(num); ump[num]++; mp.insert(num); printmp(); } };
下一篇:
单链表C语言代码实现