10亿数据找出前100大的数据

10亿数据找出前100大的数据 2022-08-20 368

方法1：利用堆排实现

取前m个数，建立一个小根堆。建堆的时间复杂度为O(mlogm)
顺序读取后边的元素，如果该元素比堆顶的元素小，直接丢弃。如果大于堆顶的元素则替换它，然后调整堆，最坏的情况是每一次都需要调整堆。时间复杂度为O(nlogm)。n为数据总数，m表示前m大的数。

方法2：快排划分的思想

首先对数据进行划分，并且划分之后，持续对基准右边的数据继续递归
直到右边的数据小于100，然后返回上一层，并返回该区间的数目n。
对上一层数据左边的数据继续进行划分，此时划分的目的就是找出前100-n大的数据
递归上述步骤，直到前100大的数据调整到整个数组的右边

方法三：数据分块

将一亿个数据划分为100块，每块有100万个数据，然后对每一部分分别找出前100个，最后在100*100个数据中找出前100大的数据

免费搭建微信查券返利机器人来轻松赚佣金

文章来自:IT技术分享网
分享地址:http://www.5ityx.cn/cate117/121888.html

上一篇：通过多线程提高代码的执行效率例子

下一篇： Vue 中基于element-ui二次封装Pagination分页组件

聚合标签

腾讯笔试题

学习建议系列

大数据系列二

企业真题笔记

．【考试】

如何制作网页

背景差分法

经验分享程序员微信小程序职场和发展