在很多软件中,输入拼音的首写字母就可以快速定位到某个词条。比如,在铁路售票软件中,输入: “bj”就可以定位到“北京”。怎样在自己的软件中实现这个功能呢?问题的关键在于:对每个汉字必须能计算出它的拼音首字母。

    GB2312汉字编码方式中,一级汉字的3755个是按照拼音顺序排列的。我们可以利用这个特征,对常用汉字求拼音首字母。

    GB2312编码方案对每个汉字采用两个字节表示。第一个字节为区号,第二个字节为区中的偏移号。为了能与已有的ASCII编码兼容(中西文混排),区号和偏移编号都从0xA1开始。

    我们只要找到拼音a,b,c,...x,y,z 每个字母所对应的GB2312编码的第一个汉字,就可以定位所有一级汉字的拼音首字母了(不考虑多音字的情况)。下面这个表给出了前述信息。请你利用该表编写程序,求出常用汉字的拼音首字母。


a 啊 B0A1
b 芭 B0C5
c 擦 B2C1
d 搭 B4EE
e 蛾 B6EA
f 发 B7A2
g 噶 B8C1
h 哈 B9FE
j 击 BBF7
k 喀 BFA6
l 垃 C0AC
m 妈 C2E8
n 拿 C4C3
o 哦 C5B6
p 啪 C5BE
q 期 C6DA
r 然 C8BB
s 撒 C8F6
t 塌 CBFA
w 挖 CDDA
x 昔 CEF4
y 压 D1B9
z 匝 D4D1


【输入、输出格式要求】

    用户先输入一个整数n (n<100),表示接下来将有n行文本。接着输入n行中文串(每个串不超过50个汉字)。

    程序则输出n行,每行内容为用户输入的对应行的汉字的拼音首字母。

    字母间不留空格,全部使用大写字母。

    例如:
    用户输入:
3
大家爱科学
北京天安门广场
软件大赛

    则程序输出:
DJAKX
BJTAMGC
RJDS

 


结题思路:
C语言中的一个汉字占两个字节(两个char),我们只需把这两个字节对应的int型数字算出来,然后到编码表里去比较即可。计算该数字时要用到移位,与,或等位运算操作。
代码如下:
#include<stdio.h>
#include
<string.h>
int N;
char str[200];
void pro(){
    
    
for(int i = 0; i < strlen(str) - 1; )
    
{
        
char c0 = str[i++];
        
char c1 = str[i++];
        
int t = (int)c0 << 8;//得到高八位 
        
        t 
= t | (0x000000ff & (int)c1);//得到低八位 
        t &= 0x0000ffff;//去掉负号 
        
        
if(t >= 0xB0A1 && t < 0xB0C5){
            printf(
"A");    
        }

        
else if(t < 0xB2C1)
            printf(
"B");
        
else if(t < 0xB4EE)
            printf(
"C");
        
else if(t < 0xB6EA)
            printf(
"D");
        
else if(t < 0xB7A2)
            printf(
"E");
        
else if(t < 0xB8C1)
            printf(
"F");
        
else if(t < 0xB9FE)
            printf(
"G");
        
else if(t < 0xBBF7)
            printf(
"H");
        
else if(t < 0xBFA6)
            printf(
"J");
        
else if(t < 0xC0AC)
            printf(
"K");
        
else if(t < 0xC2E8)
            printf(
"L");
        
else if(t < 0xC4C3)
            printf(
"M");
        
else if(t < 0xC5B6)
            printf(
"N");
        
else if(t < 0xC5BE)
            printf(
"O");
        
else if(t < 0xC6DA)
            printf(
"P");
        
else if(t < 0xC8BB)
            printf(
"Q");
        
else if(t < 0xC8F6)
            printf(
"R");
        
else if(t < 0xCBFA)
            printf(
"S");
        
else if(t < 0xCDDA)
            printf(
"T");
        
else if(t < 0xCEF4)
            printf(
"W");
        
else if(t < 0xD1B9)
            printf(
"X");
        
else if(t < 0xD4D1)
            printf(
"Y");
        
else 
            printf(
"Z");
            
    }

    printf(
"\n");
        
}


int main()
{    
    scanf(
"%d"&N);
    getchar();
    
for(int i = 0; i < N; i++)
    
{
        gets(str);
        pro();
    }

    
    
//getchar();
}




posted on 2013-07-09 11:04 小鼠标 阅读(1194) 评论(0)  编辑 收藏 引用 所属分类: C语言

只有注册用户登录后才能发表评论。
网站导航: 博客园   IT新闻   BlogJava   知识库   博问   管理


<2024年11月>
272829303112
3456789
10111213141516
17181920212223
24252627282930
1234567

常用链接

随笔分类(111)

随笔档案(127)

friends

最新评论

  • 1. re: 线段树
  • 是这个样子的,所以在OJ有时候“卡住”了也不要太灰心,没准真的不是自己的原因呢。
    加油,祝你好运啦!
  • --小鼠标
  • 2. re: 线段树
  • 对于编程竞赛来说,Java所需时间一般为C/C++的两倍。合理的竞赛给Java的时间限制是给C/C++的两倍。
  • --伤心的笔
  • 3. re: poj1273--网络流
  • 过来看看你。
  • --achiberx
  • 4. re: (转)ubuntu11.10无法启动无线网络的解决方法
  • 膜拜大神。。查了一个下午资料终于在这里解决了问题。。神牛说的区域赛难道是ACM区域赛。。?
  • --Hang
  • 5. re: 快速排序、线性时间选择
  • 博主,谢谢你的文章。你的方法可以很好的处理分区基准在数组中重复的情况,书上的方法遇到这种输入会堆栈溢出。书上给出了解释但给的方法貌似不简洁。
  • --lsxqw2004

阅读排行榜