posts - 7, comments - 13, trackbacks - 0, articles - 37
   :: 首页 :: 新随笔 :: 联系 ::  :: 管理

2005百度初赛

Posted on 2008-10-16 09:18 岁月流逝 阅读(103) 评论(0)  编辑 收藏 引用

百度之星程序设计大赛
试题

第一题(共四题100分):连续正整数(10分)
题目描述:一个正整数有可能可以被表示为n(n>=2)个连续正整数之和,如:
15=1+2+3+4+5
15=4+5+615=7+8
请编写程序,根据输入的任何一个正整数,找出符合这种要求的所有连续正整数序列。
输入数据:一个正整数,以命令行参数的形式提供给程序。

输出数据:在标准输出上打印出符合题目描述的全部正整数序列,每行一个序列,每个序列都从该序列的最小正整数开始、以从小到大的顺序打印。如果结果有多个序列,按各序列的最小正整数的大小从小到大打印各序列。此外,序列不允许重复,序列内的整数用一个空格分隔。如果没有符合要求的序列,输出“NONE”。

例如,对于15,其输出结果是:
  1 2 3 4 5
  4 5 6
  7 8
 
对于16,其输出结果是:
  NONE

评分标准:程序输出结果是否正确。

我的程序:

#include <stdio.h>
#include <math.h>

void show(int a1, int n)
{
    int i;
    printf("%d", a1);
    for (i = 1; i < n; i++)
    {
        printf(" %d", a1 + i);
    }
    printf("\n");
}

int main(int argc, char** argv)
{
    int x, n, a1;
    int showed = 0;
    if (argc != 2)
        return -1;

    if (sscanf(argv[1], "%d", &x)!=1)
        return -1;

    x = x*2;
    // n(1+n)/2 = x
    n = (int)sqrt(x); // a*b = c^2 then a <= c <= b, so n <= sqrt(2x) <= n+1
    for(; n >= 2; n--)
    {
        if (x % n)
            continue;

        a1 = x / n - n + 1;
        if (a1 % 2 == 0)
        {
            a1 /= 2;
            show(a1, n);
            showed = 1;
        }
    }
    if (showed == 0)
        printf("NONE\n");
    return 0;
}
//
第二题(共四题100分):重叠区间大小(20分)

题目描述:请编写程序,找出下面“输入数据及格式”中所描述的输入数据文件中最大重叠区间的大小。
对一个正整数n,如果n在数据文件中某行的两个正整数(假设为A和B)之间,即A<=n<=B或A>=n>=B,则n属于该行;如果n同时属于行i和j,则i和j有重叠区间;重叠区间的大小是同时属于行i和j的整数个数。
 例如,行(10 20)和(12 25)的重叠区间为[12 20],其大小为9;行(20 10)和(12 18)的重叠区间为[10 12],其大小为3;行(20 10)和(20 30)的重叠区间大小为1。

输入数据:程序读入已被命名为input.txt的输入数据文本文件,该文件的行数在1到1,000,000之间,每行有用一个空格分隔的2个正整数,这2个正整数的大小次序随机,每个数都在1和2^32-1之间。(为便于调试,您可下载测试input.txt文件,实际运行时我们会使用不同内容的输入文件。)

输出数据:在标准输出上打印出输入数据文件中最大重叠区间的大小,如果所有行都没有重叠区间,则输出0。

评分标准:程序输出结果必须正确,内存使用必须不超过256MB,程序的执行时间越快越好。

我的程序:

#include <stdio.h>
#include <stdlib.h>

#ifndef MIN
#define MIN(a,b) ((a)<(b)?(a):(b))
#endif

int map[1000000][2];

int cmp(const void *a, const void *b)
{
    return *(int*)a > *(int*)b;
}
inline int cover(int n[2], int e)
{
    int left = n[0];
    int right = MIN(n[1], e);
    if (left <= right)
        return right - left + 1;
    return 0;
}
int main()
{
    FILE *fp = fopen("input.txt", "rt");
    int i = 0, n, a, b;
    int end;
    int maxcover = 0, c;
   
    while(fscanf(fp, "%d%d", &a, &b) == 2)
    {
        if (a < b)
        {
            map[i][0] = a;
            map[i][1] = b;
        }
        else
        {
            map[i][0] = b;
            map[i][1] = a;
        }
        i++;
    }
    fclose(fp);
    n = i;
   
    qsort(map, n, sizeof(int)*2, cmp);
   
    end = map[0][1];

    for (i = 1; i < n; i++)
    {
        c = cover(map[i], end);
        if (c > maxcover)
            maxcover = c;

        if (map[i][1] > end)
        {
            end = map[i][1];
        }
    }   
   
    printf("%d\n", maxcover);
    return 0;
}
//第三题(共四题100分):字符串替换(30分)

题目描述:请编写程序,根据指定的对应关系,把一个文本中的字符串替换成另外的字符串。

输入数据:程序读入已被命名为text.txt和dict.txt的两个输入数据文本文件,text.txt为一个包含大量字符串(含中文)的文本,以whitespace为分隔符;dict.txt为表示字符串(s1)与字符串(s2)的对应关系的另一个文本(含中文),大约在1万行左右,每行两个字符串(即s1和s2),用一个\t或空格分隔。dict.txt中各行的s1没有排序,并有可能有重复,这时以最后出现的那次s1所对应的s2为准。text.txt和dict.txt中的每个字符串都可能包含除whitespace之外的任何字符。text.txt中的字符串必须和dict.txt中的某s1完全匹配才能被替换。(为便于调试,您可下载测试text.txt和dict.txt文件,实际运行时我们会使用不同内容的输入文件。)

输出数据:在标准输出上打印text.txt被dict.txt替换后了的整个文本。

评分标准:程序输出结果必须正确,内存使用越少越好,程序的执行时间越快越好。

我的程序:

#pragma warning(disable:4786)
#include <string>
#include <map>
#include <fstream>
#include <cassert>
#include <cstdio>

using namespace std;

map< string, string > dict;

void loadDict(const char *filename)
{
    string a, b;
    ifstream dic;
    assert(filename != NULL);
    dic.open(filename);
    while(dic>>a>>b)
    {
        dict[a] = b;
    }
    dic.close();
}

const char *replaceWord(const string &word)
{
    map< string, string >::iterator word2 = dict.find(word);
    if (word2 == dict.end())
    {
        return word.c_str();
    }
    else
    {
        return word2->second.c_str();
    }
}

int main()
{
    bool isChinese = false;
    char c;
    string word;
    loadDict("dict.txt");
   
    FILE *fp = fopen("text.txt", "rt");
    while(!feof(fp))
    {
        c = fgetc(fp);
        if (isChinese)
        {
            word += c;
            isChinese = false;
        }
        else
        {
            if ((c & 0x80) == 0 && isspace(c))
            {
                if (!word.empty())
                {
                    printf("%s", replaceWord(word));
                    word = "";
                }
                printf("%c", c);
            }
            else
            {
                if (c & 0x80)
                {
                    isChinese = true;
                }
                word += c;
            }
        }
    }
    fclose(fp);

    if (!word.empty())
    {
        printf("%s", replaceWord(word));
    }
    return 0;
}
第四题(共四题100分):低频词过滤(40分)

题目描述:请编写程序,从包含大量单词的文本中删除出现次数最少的单词。如果有多个单词都出现最少的次数,则将这些单词都删除。

输入数据:程序读入已被命名为corpus.txt的一个大数据量的文本文件,该文件包含英文单词和中文单词,词与词之间以一个或多个whitespace分隔。(为便于调试,您可下载测试corpus.txt文件,实际运行时我们会使用不同内容的输入文件。)

输出数据:在标准输出上打印删除了corpus.txt中出现次数最少的单词之后的文本(词与词保持原来的顺序,仍以空格分隔)。

评分标准:程序输出结果必须正确,内存使用越少越好,程序的执行时间越快越好。

我的程序:


#pragma warning(disable: 4786)
#include <map>
#include <string>
#include <vector>
#include <cstdio>
#include <fstream>
#include <algorithm>

using namespace std;

struct Pair
{
    Pair(){}
    Pair(const string& w, int c):word(w), count(c)
    {
    }
    string word;
    int count;
};

map< string, int > wordmap;
vector< Pair > wordcount;
vector< int > wordindex;

int main()
{
    // load the file, count word, build index
    string word;
    fstream file("corpus.txt");
    while(file >> word)
    {
        int id;
        map< string, int >::iterator itw = wordmap.find(word);
        if (itw == wordmap.end()) // new word
        {
            id = wordcount.size();
            wordmap[word] = id;
            wordcount.push_back(Pair(word, id));
        }
        else // found it
        {
            wordcount[itw->second].count++;
            id = itw->second;
        }
        wordindex.push_back(id);
    }
    file.close();
   
    if (wordcount.empty())
        return 0;
   
    // find the min count
    vector< Pair >::iterator itc = wordcount.begin();
    int mincount = itc->count;
    for (++itc; itc != wordcount.end(); ++itc)
    {
        if (mincount > itc->count)
            mincount = itc->count;
    }
   
    // show all filtered words
    if (wordindex.empty())
        return 0;

    // skip leading filtered words
    vector< int >::iterator w = wordindex.begin();
    while(w != wordindex.end() && wordcount[*w].count == mincount)
        ++w;
   
    if (w == wordindex.end())
        return 0;

    /**//* debug use
    for (vector< Pair >::iterator iw = wordcount.begin(); iw != wordcount.end(); ++iw)
        printf("%s %d\n", iw->word.c_str(), iw->count);
    printf("mincount = %d\n", mincount);
    /*/

    // show first word, with no space after
    printf("%s", wordcount[*w].word.c_str());
    for (++w; w != wordindex.end(); ++w)
    {
        if (wordcount[*w].count != mincount)
        {
            printf(" %s", wordcount[*w].word.c_str());
        }
    }
    printf("\n");
    //*/
    return 0;
}


只有注册用户登录后才能发表评论。
网站导航: 博客园   IT新闻   BlogJava   博问   Chat2DB   管理