posts - 183,  comments - 10,  trackbacks - 0

直观的解法是对所有的 N 个数进行排序,再取最前或最后的 k 个元素。
这种做法的时间复杂度为 O(NlogN)

一种较好的解法是:维持一个 k 个元素的集合 S,遍历 N 个数,对每个元素,首先检查 S 中的元素个数是否小于 k,如果小于直接加入到 S 中。如果 S 中已有 k 个元素,则比较待处理元素与 S 中最大的元素的大小关系,若小于 S 中最大的元素,则删除 S 中最大的元素,并将该元素加入到 S 中。

怎样才能快速地从 S 中寻找到我们想要的最大的元素,使用堆是个好方法,最大堆。每次直接去堆的第一个元素即是 S 中最大的元素。如果将 S 中的最大元素删除,然后将 最后的一个元素放在堆顶,下滑,已调整堆。在讲新的元素加入到堆中,上滑,以调整堆。可以将这两个过程合并,即将 S 中最大的元素替换为 待处理的元素。对这个堆顶上的元素下滑,以调整堆。这里的复杂度为 O(Nlogk)。

STL 中的 multimap 不是堆,但是其可以以 O(logn) 维护其有序性,所以可以直接用 multimap 代替堆来实现。

http://zhedahht.blog.163.com/blog/static/2541117420072432136859/


 1 #include <iostream>
 2 #include <vector>
 3 #include <set>
 4 #include <ctime>
 5 using namespace std;
 6 
 7 void findMinK(multiset<int, greater<int> >& Kdata, int k, const vector<int>& data)
 8 {
 9     Kdata.clear();
10     int m = 0;
11     for (vector<int>::const_iterator cit = data.begin(); cit != data.end(); ++cit)
12     {
13         if (m < k)
14         {
15             Kdata.insert(*cit);
16             ++m;
17         }
18         else
19         {
20             if (*cit < *(Kdata.begin()))
21             {
22                 Kdata.erase(Kdata.begin());
23                 Kdata.insert(*cit);
24             }
25         }
26     }
27 }
28 
29 int main()
30 {
31     vector<int> data;
32     srand(time(0));
33     int n = 100;
34     while (n--)
35     {
36         data.push_back(rand());
37     }
38     multiset<int, greater<int> > Kdata;
39     findMinK(Kdata, 10, data);
40     for (vector<int>::const_iterator cit = data.begin(); cit != data.end(); ++cit)
41     {
42         cout << *cit << ' ';
43     }
44     cout << endl;
45     for (multiset<int, greater<int> >::const_iterator cit = Kdata.begin(); cit != Kdata.end(); ++cit)
46     {
47         cout << *cit << ' ';
48     }
49     cout << endl;
50     return 0;
51 }
posted on 2011-04-26 22:59 unixfy 阅读(1161) 评论(3)  编辑 收藏 引用

只有注册用户登录后才能发表评论。
网站导航: 博客园   IT新闻   BlogJava   博问   Chat2DB   管理