查找最小的 k 个元素

直观的解法是对所有的 N 个数进行排序，再取最前或最后的 k 个元素。
这种做法的时间复杂度为 O(NlogN) 。

一种较好的解法是：维持一个 k 个元素的集合 S，遍历 N 个数，对每个元素，首先检查 S 中的元素个数是否小于 k，如果小于直接加入到 S 中。如果 S 中已有 k 个元素，则比较待处理元素与 S 中最大的元素的大小关系，若小于 S 中最大的元素，则删除 S 中最大的元素，并将该元素加入到 S 中。

怎样才能快速地从 S 中寻找到我们想要的最大的元素，使用堆是个好方法，最大堆。每次直接去堆的第一个元素即是 S 中最大的元素。如果将 S 中的最大元素删除，然后将最后的一个元素放在堆顶，下滑，已调整堆。在讲新的元素加入到堆中，上滑，以调整堆。可以将这两个过程合并，即将 S 中最大的元素替换为待处理的元素。对这个堆顶上的元素下滑，以调整堆。这里的复杂度为 O(Nlogk)。

STL 中的 multimap 不是堆，但是其可以以 O(logn) 维护其有序性，所以可以直接用 multimap 代替堆来实现。

http://zhedahht.blog.163.com/blog/static/2541117420072432136859/

1 #include <iostream>
2 #include <vector>
3 #include <set>
4 #include <ctime>
5 using namespace std;
6
7 void findMinK(multiset<int, greater<int> >& Kdata, int k, const vector<int>& data)
8 {
9     Kdata.clear();
10     int m = 0;
11     for (vector<int>::const_iterator cit = data.begin(); cit != data.end(); ++cit)
12     {
13         if (m < k)
14         {
15             Kdata.insert(*cit);
16             ++m;
17         }
18         else
19         {
20             if (*cit < *(Kdata.begin()))
21             {
22                 Kdata.erase(Kdata.begin());
23                 Kdata.insert(*cit);
24             }
25         }
26     }
27 }
28
29 int main()
30 {
31     vector<int> data;
32     srand(time(0));
33     int n = 100;
34     while (n--)
35     {
36         data.push_back(rand());
37     }
38     multiset<int, greater<int> > Kdata;
39     findMinK(Kdata, 10, data);
40     for (vector<int>::const_iterator cit = data.begin(); cit != data.end(); ++cit)
41     {
42         cout << *cit << ' ';
43     }
44     cout << endl;
45     for (multiset<int, greater<int> >::const_iterator cit = Kdata.begin(); cit != Kdata.end(); ++cit)
46     {
47         cout << *cit << ' ';
48     }
49     cout << endl;
50     return 0;
51 }

posted on 2011-04-26 22:59 unixfy 阅读(1239) 评论(3) 编辑收藏引用

常用链接

留言簿(3)

随笔档案

搜索

最新评论

阅读排行榜

评论排行榜

只有注册用户登录后才能发表评论。




网站导航: 博客园博客园最新博文博问管理