百度之星程序设计大赛
试题
第一题(共四题100分):连续正整数(10分)
题目描述:一个正整数有可能可以被表示为n(n>=2)个连续正整数之和,如:
15=1+2+3+4+5
15=4+5+615=7+8
请编写程序,根据输入的任何一个正整数,找出符合这种要求的所有连续正整数序列。
输入数据:一个正整数,以命令行参数的形式提供给程序。
输出数据:在标准输出上打印出符合题目描述的全部正整数序列,每行一个序列,每个序列都从该序列的最小正整数开始、以从小到大的顺序打印。如果结果有多个序列,按各序列的最小正整数的大小从小到大打印各序列。此外,序列不允许重复,序列内的整数用一个空格分隔。如果没有符合要求的序列,输出“NONE”。
例如,对于15,其输出结果是:
1 2 3 4 5
4 5 6
7 8
对于16,其输出结果是:
NONE
评分标准:程序输出结果是否正确。
我的程序:
#include <stdio.h>
#include <math.h>
void show(int a1, int n)
{
int i;
printf("%d", a1);
for (i = 1; i < n; i++)
{
printf(" %d", a1 + i);
}
printf("\n");
}
int main(int argc, char** argv)
{
int x, n, a1;
int showed = 0;
if (argc != 2)
return -1;
if (sscanf(argv[1], "%d", &x)!=1)
return -1;
x = x*2;
// n(1+n)/2 = x
n = (int)sqrt(x); // a*b = c^2 then a <= c <= b, so n <= sqrt(2x) <= n+1
for(; n >= 2; n--)
{
if (x % n)
continue;
a1 = x / n - n + 1;
if (a1 % 2 == 0)
{
a1 /= 2;
show(a1, n);
showed = 1;
}
}
if (showed == 0)
printf("NONE\n");
return 0;
}
//
第二题(共四题100分):重叠区间大小(20分)
题目描述:请编写程序,找出下面“输入数据及格式”中所描述的输入数据文件中最大重叠区间的大小。
对一个正整数n,如果n在数据文件中某行的两个正整数(假设为A和B)之间,即A<=n<=B或A>=n>=B,则n属于该行;如果n同时属于行i和j,则i和j有重叠区间;重叠区间的大小是同时属于行i和j的整数个数。
例如,行(10 20)和(12 25)的重叠区间为[12 20],其大小为9;行(20 10)和(12 18)的重叠区间为[10 12],其大小为3;行(20 10)和(20 30)的重叠区间大小为1。
输入数据:程序读入已被命名为input.txt的输入数据文本文件,该文件的行数在1到1,000,000之间,每行有用一个空格分隔的2个正整数,这2个正整数的大小次序随机,每个数都在1和2^32-1之间。(为便于调试,您可下载测试input.txt文件,实际运行时我们会使用不同内容的输入文件。)
输出数据:在标准输出上打印出输入数据文件中最大重叠区间的大小,如果所有行都没有重叠区间,则输出0。
评分标准:程序输出结果必须正确,内存使用必须不超过256MB,程序的执行时间越快越好。
我的程序:
#include <stdio.h>
#include <stdlib.h>
#ifndef MIN
#define MIN(a,b) ((a)<(b)?(a):(b))
#endif
int map[1000000][2];
int cmp(const void *a, const void *b)
{
return *(int*)a > *(int*)b;
}
inline int cover(int n[2], int e)
{
int left = n[0];
int right = MIN(n[1], e);
if (left <= right)
return right - left + 1;
return 0;
}
int main()
{
FILE *fp = fopen("input.txt", "rt");
int i = 0, n, a, b;
int end;
int maxcover = 0, c;
while(fscanf(fp, "%d%d", &a, &b) == 2)
{
if (a < b)
{
map[i][0] = a;
map[i][1] = b;
}
else
{
map[i][0] = b;
map[i][1] = a;
}
i++;
}
fclose(fp);
n = i;
qsort(map, n, sizeof(int)*2, cmp);
end = map[0][1];
for (i = 1; i < n; i++)
{
c = cover(map[i], end);
if (c > maxcover)
maxcover = c;
if (map[i][1] > end)
{
end = map[i][1];
}
}
printf("%d\n", maxcover);
return 0;
}
//第三题(共四题100分):字符串替换(30分)
题目描述:请编写程序,根据指定的对应关系,把一个文本中的字符串替换成另外的字符串。
输入数据:程序读入已被命名为text.txt和dict.txt的两个输入数据文本文件,text.txt为一个包含大量字符串(含中文)的文本,以whitespace为分隔符;dict.txt为表示字符串(s1)与字符串(s2)的对应关系的另一个文本(含中文),大约在1万行左右,每行两个字符串(即s1和s2),用一个\t或空格分隔。dict.txt中各行的s1没有排序,并有可能有重复,这时以最后出现的那次s1所对应的s2为准。text.txt和dict.txt中的每个字符串都可能包含除whitespace之外的任何字符。text.txt中的字符串必须和dict.txt中的某s1完全匹配才能被替换。(为便于调试,您可下载测试text.txt和dict.txt文件,实际运行时我们会使用不同内容的输入文件。)
输出数据:在标准输出上打印text.txt被dict.txt替换后了的整个文本。
评分标准:程序输出结果必须正确,内存使用越少越好,程序的执行时间越快越好。
我的程序:
#pragma warning(disable:4786)
#include <string>
#include <map>
#include <fstream>
#include <cassert>
#include <cstdio>
using namespace std;
map< string, string > dict;
void loadDict(const char *filename)
{
string a, b;
ifstream dic;
assert(filename != NULL);
dic.open(filename);
while(dic>>a>>b)
{
dict[a] = b;
}
dic.close();
}
const char *replaceWord(const string &word)
{
map< string, string >::iterator word2 = dict.find(word);
if (word2 == dict.end())
{
return word.c_str();
}
else
{
return word2->second.c_str();
}
}
int main()
{
bool isChinese = false;
char c;
string word;
loadDict("dict.txt");
FILE *fp = fopen("text.txt", "rt");
while(!feof(fp))
{
c = fgetc(fp);
if (isChinese)
{
word += c;
isChinese = false;
}
else
{
if ((c & 0x80) == 0 && isspace(c))
{
if (!word.empty())
{
printf("%s", replaceWord(word));
word = "";
}
printf("%c", c);
}
else
{
if (c & 0x80)
{
isChinese = true;
}
word += c;
}
}
}
fclose(fp);
if (!word.empty())
{
printf("%s", replaceWord(word));
}
return 0;
}
第四题(共四题100分):低频词过滤(40分)
题目描述:请编写程序,从包含大量单词的文本中删除出现次数最少的单词。如果有多个单词都出现最少的次数,则将这些单词都删除。
输入数据:程序读入已被命名为corpus.txt的一个大数据量的文本文件,该文件包含英文单词和中文单词,词与词之间以一个或多个whitespace分隔。(为便于调试,您可下载测试corpus.txt文件,实际运行时我们会使用不同内容的输入文件。)
输出数据:在标准输出上打印删除了corpus.txt中出现次数最少的单词之后的文本(词与词保持原来的顺序,仍以空格分隔)。
评分标准:程序输出结果必须正确,内存使用越少越好,程序的执行时间越快越好。
我的程序:
#pragma warning(disable: 4786)
#include <map>
#include <string>
#include <vector>
#include <cstdio>
#include <fstream>
#include <algorithm>
using namespace std;
struct Pair
{
Pair(){}
Pair(const string& w, int c):word(w), count(c)
{
}
string word;
int count;
};
map< string, int > wordmap;
vector< Pair > wordcount;
vector< int > wordindex;
int main()
{
// load the file, count word, build index
string word;
fstream file("corpus.txt");
while(file >> word)
{
int id;
map< string, int >::iterator itw = wordmap.find(word);
if (itw == wordmap.end()) // new word
{
id = wordcount.size();
wordmap[word] = id;
wordcount.push_back(Pair(word, id));
}
else // found it
{
wordcount[itw->second].count++;
id = itw->second;
}
wordindex.push_back(id);
}
file.close();
if (wordcount.empty())
return 0;
// find the min count
vector< Pair >::iterator itc = wordcount.begin();
int mincount = itc->count;
for (++itc; itc != wordcount.end(); ++itc)
{
if (mincount > itc->count)
mincount = itc->count;
}
// show all filtered words
if (wordindex.empty())
return 0;
// skip leading filtered words
vector< int >::iterator w = wordindex.begin();
while(w != wordindex.end() && wordcount[*w].count == mincount)
++w;
if (w == wordindex.end())
return 0;
/**//* debug use
for (vector< Pair >::iterator iw = wordcount.begin(); iw != wordcount.end(); ++iw)
printf("%s %d\n", iw->word.c_str(), iw->count);
printf("mincount = %d\n", mincount);
/*/
// show first word, with no space after
printf("%s", wordcount[*w].word.c_str());
for (++w; w != wordindex.end(); ++w)
{
if (wordcount[*w].count != mincount)
{
printf(" %s", wordcount[*w].word.c_str());
}
}
printf("\n");
//*/
return 0;
}