coding everyday

编程面试题 https://interview.codeplex.com

C++博客 首页 新随笔 联系 聚合 管理
  12 Posts :: 2 Stories :: 7 Comments :: 0 Trackbacks
微博上@陈利人会不定时的发一些程序员的面试题,觉得挺有意思,有时会去写代码做一下。最近他开了个微信公众号:待字闺中 (id: daiziguizhongren),推送这些面试题目和网友的一些好的解答。看到他出的面试题目是促使我开这个博客的另一个重要原因。:)

本文正是关于他出的题目:给一个整数数组,找到其中包含最多连续数的自己,比如给:15,7,12,6,14,13,9,11,则返回5:[11,12,13,14,15]。最简单的方法是sort然后scan一遍,但是要O(nlgn)。有什么O(n)的方法吗?

跟他确认了下,对空间复杂度有没有什么要求,能不能用map这样的辅助数据结构,他说没有限制。

我的想法就是,用一个map<int, int>,它的key是一个起始的数字,value是这个起始数字起连续的个数。这样这个数组遍历一遍下来,只要map维护好了,自然就能得到最长的连续子串了,并且算法复杂度应该是O(n)。(不考虑map函数实现的复杂度)
前面说了维护好map就可以了,那么怎么来维护这个map呢?
  1. 取出当前的整数,在map里看一下是否已经存在,若存在则直接取下一个,不存在转2 (为什么要看是否已经存在,因为题目没有说不会有重复的数字。)
  2. 查看下map里面当前数字的前一个是否存在,如果存在,当前的最长长度就是前一个最长长度+1
  3. 查看下map里面当前数字的后一个是否存在,如果存在,那么就将以下一个数字开始的子串的最后一个更新下,因为本来没有连上的2个子串,因为当前数字的出现连起来了
  4. 接着再看下前面数字是否存在,如果存在,就更新以这个数字结尾的子串的第一个数字的连续子串长度,原因同上
算法就是如上所示了,我们拿例子演练一遍
1)   首先给定15,这个时候map里面没有15也没有14和16,那么这个执行完了之后map是map[15] = 1;
2)   然后遇到7,同上,也没有6,7和8,所以执行玩了之后变成map[7]=1, map[15]=1;
3)   12同上,map[7]=1, map[12]=1, map[15]=1;
4)   接下来是6,6就不一样了,因为7存在的,所以执行上面第3步之后,map[6]=2,map[7]=2,map[12]=1,map[15]=1;
5)   14的情况跟6一样,结果是map[6]=2,map[7]=2,map[12]=1,map[14]=2,map[15]=2;
6)   13的情况相对复杂一些,因为12和14都存在了 ,所以它会执行以上1,2,3,4的所有4步:首先12存在,所以13的最长子串是2,14存在,所以会更新到14起始的最后一个数字的最长长度,这里就是15的长度=它自己的加上13的长度,也就是4,同时我们把13的长度也改成4,最后因为12存在,我们要更新以12结尾的连续子串的开始处,本例中就是12自己,12对应更新成4
7)   最后是11,11的前面一个数字不存在,后一个数字存在,也就是要执行以上1,3,第3步结束的时候已经是11和15都更新成5了。最后的结果也就是5,并且是从11起始的。

下面上代码:
  1 int find_longest_consecutive_items(int *list, int size) {
 2     map<intint> mapping;
 3     int max = 0;
 4     // The start point for the longest chain
 5     int start = 0;
 6 
 7     for (int i=0; i<size; i++) {
 8         if (mapping.find(list[i]) == mapping.end()) {
 9             int cur = list[i];
10             // Set current position as the start point for this potential longest chain
11             int cur_start = cur;
12             mapping.insert(make_pair(cur, 1));
13 
14             map<intint>::iterator prev = mapping.find(cur - 1);
15             map<intint>::iterator next = mapping.find(cur + 1);
16 
17             if (prev != mapping.end()) {
18                 // If previous number exists, increase current consecutive count
19                 mapping[cur] = prev->second + 1;
20             }
21 
22             if (next != mapping.end()) {
23                 // Update the last one in the chain with the consecutive count from the one before current position
24                 int last = next->first + next->second - 1;
25                 mapping[last] = mapping[cur] = mapping[cur] + mapping[last];
26             }
27 
28             if (prev != mapping.end()) {
29                 // Update the first one in the chain with the consecutive count from the one after current position
30                 int first = prev->first - prev->second + 1;
31                 mapping[first] = mapping[cur];
32 
33                 // Use the first one as the start point for the whole chain
34                 cur_start = first;
35             }
36 
37             if (mapping[cur_start] > max) {
38                 start = cur_start;
39                 max = mapping[cur_start];
40             }
41         }
42     }
43 
44     cout << "Longest consecutive items:";
45     for (int i=0; i<max; i++) {
46         cout << " " << start + i;
47     }
48     cout << endl;
49 
50     return max;
51 }

完整代码
posted on 2013-07-01 22:05 everyday 阅读(1599) 评论(4)  编辑 收藏 引用 所属分类: 算法

Feedback

# re: 最多连续数的子集 2013-07-02 10:50 passinger
这样做map里面存储过多冗余信息,比如从11到15,应该只存储(11,5),而不是5个成员。  回复  更多评论
  

# re: 最多连续数的子集 2013-07-03 06:23 everyday
@passinger
good catch. :) 谢谢。
为什么这么做是因为方便找出是否存在当前这个数字的前一个和后一个,以便连接起来。比如一开始有11,12的出现,如果只有一个entry是(11, 2)的话,这时出来13的话,要找连续会困难一些,但是如果有(11,2), (12, 2)的存在,O(1)就能找到。这里确实是以空间换时间。  回复  更多评论
  

# re: 最多连续数的子集 2013-07-08 10:38 jun_deng
map中的value到底代表的什么?  回复  更多评论
  

# re: 最多连续数的子集 2013-07-12 14:30 everyday
@jun_deng
代表的是包含它的连续序列的长度,但不是每个都up to date的。只维护了那个序列中的开始和最后就够了,中间没有意义。  回复  更多评论
  


只有注册用户登录后才能发表评论。
网站导航: 博客园   IT新闻   BlogJava   知识库   博问   管理