聚星亭

吾笨笨且懒散兮急须改之而奋进

posts - 74, comments - 166, trackbacks - 0, articles - 0

好听音乐网 -- 歌曲下载分析流程及程序的编写

Posted on 2009-06-24 16:25 besterChen 阅读(1331) 评论(5) 编辑收藏引用所属分类: WTL/MFC/GuiLib

难得我母亲要我给她下音乐听，她在好听音乐网上听到一首，我就要百度好久才能找到播放的是哪首，好长时间才下了仅仅的几首。
记得以前迅雷可以直接分析出下载地址来的，可是现在不知怎么的，迅雷的版本高了，功能却变得弱智了。
没有办法就只有自己找找规律分析一下了，下面记录我的分析过程，贴出来纪念下：

先看下网址的规律：
多个歌曲连播的URL地址形式：
http://www.haoting.com/play/htsonglian1.htm?id=123907&id=357857
其中id=后面的数字就是歌曲的ID。

单首歌曲播放的URL形式：
http://www.haoting.com/htmusic/357857ht.htm
其中的数字就是歌曲的ID。

查看其源文件，得到如下内容：

打开这个文件，查看其代码，仔细分析得到有用信息如下：

function digui(musicids,length)
{
if(idindex < length)
{
  idvalue = musicids[idindex];
  s = document.createElement("script");
  s.type="text/javascript";
  s.src="http://haoting.com/musicjs/"+musicids[idindex]+".js"; // 这个是关键。
  document.getElementsByTagName("head")[0].appendChild(s);

}

由于到这里两种网址中歌曲的ID已经都取到了只要访问如下格式的URL：
http://haoting.com/musicjs/歌曲的ID.js
比如：
http://haoting.com/musicjs/357857.js

就可以下载到如下内容的JS文件：

var url_357857="/21z/0/dianxiao2yyyyqx090620/1/0897053676a18e5e_1.wma"; //下载地址

var music_357857="相爱后动物感伤(CD Version) - 阿密特(张惠妹)"; //这个是歌曲名

var singer_357857="最新单曲"; //这个是歌手名

var nclassid_357857=5538;

var specialid_357857="abb60fe6d6c77f45";

var specialName_357857="最新单曲合辑NO.48"; //这个是专辑名

我们知道这个音乐在网站上的相对地址了，怎么才能知道它完整的地址呢？

继续分析lianbohy.js中的代码，找到如下信息：

//播放歌曲
function play(str,obj)
{

var STAND_STR = "/19z/",
STAND_STR2 = "/20z/",
STAND_STR3 = "/21z/",
STAND_STR4 = "/22z/";
if(url.indexOf(STAND_STR)==-1 && url.indexOf(STAND_STR2)==-1 && url.indexOf(STAND_STR3)==-1 && url.indexOf(STAND_STR4)==-1)
  ht = "http://ow.haoting.com";
else
  ht = "http://wma.haoting.com";

if(window.navigator.userAgent.indexOf("MSIE") == -1)
{
  installPlayer(ht+url);
}
else
{
  haotingplay.url=ht+url;
  haotingplay.controls.play();
  showTLab();
}

}

嘿嘿，明白了吧，如果看不懂这些代码，就把它跟我们找到的地址一起对比下：
STAND_STR3 = "/21z/",
ht = "http://wma.haoting.com";
haotingplay.url=ht+url;
再看下相对地址：
var url_357857="/21z/0/dianxiao2yyyyqx090620/1/0897053676a18e5e_1.wma";

根据上面的文件我们可以提取出很多的信息，其中下载地址如下:
http://wma.haoting.com/21z/0/dianxiao2yyyyqx090620/1/0897053676a18e5e_1.wma

分析完毕，下面开始写个小程序，让它自动完成我上面的分析过程并显示结果：
首先需要用程序来分解上面的网址，从中提取出里面的歌曲ID：

/************************************************************************/
// 函数名称:    AnalyseXUrl
// 参数列表:
//            1、 pUrl      : 要分析的网址。
//            2、    desMusicID:    用来存放歌曲ID的缓冲区。
//            3、 desBufLen :    URL中存在歌曲ID的数量。
// 函数功能:
//                从给定的网址中分离出歌曲的ID。
// 返回值  :
//                获取成功返回TRUE, 否则是FALSE。
/************************************************************************/
BOOL WINAPI AnalyseXUrl(PCHAR pUrl, PDWORD desMusicID, PDWORD desBufLen)
{
    bool bStart = false;
    char tmpID[10] = {0};

    int UrlLen = lstrlen(pUrl);
    if (0 < UrlLen)
    {
        if (NULL != strstr(pUrl, "haoting.com/htmusic/\0") && NULL != strstr(pUrl, ".htm\0"))
        {
            //http://www.haoting.com/htmusic/357857ht.htm
            for (int i = 0, x = 0; i<lstrlen(pUrl); i++)
            {
                if (pUrl[i] >= '0' && pUrl[i] <= '9')
                {
                    tmpID[x] = pUrl[i];
                    x++;
                }
            }
            sscanf(tmpID, "%d", desMusicID);
            *desBufLen = 1;
            return TRUE;
        }
        else if(NULL != strstr(pUrl, ".htm?id=\0"))
        {
            *desBufLen = 0;
            //http://www.haoting.com/play/htsonglian1.htm?id=123907&id=357857
            for (int i = 0, x = 0; i<lstrlen(pUrl); i++)
            {
                if (i>=0 && pUrl[i-1] == '=')
                {
                    bStart = true;
                    x = 0;
                }

                if (pUrl[i] == '&')
                {
                    bStart = false;
                    sscanf(tmpID, "%d", desMusicID);
                    *desBufLen += 1;
                    desMusicID++;
                    RtlZeroMemory(tmpID, 10);
                }

                if (bStart)
                {
                    tmpID[x] = pUrl[i];
                    x++;
                }
            }
            sscanf(tmpID, "%d", desMusicID);
            *desBufLen += 1;
            return TRUE;
        }
        else
        {
            return FALSE;
        }
    }
    else
    {
        return FALSE;
    }
}

OK,成功得到ID我们就可以构造一个网址，得到ID对应歌曲的信息：

/************************************************************************/
// 函数名称:    GetXCode
// 参数列表:
//            1、    nMusicID:    指定歌曲的ID
//            2、 desCode    :    用来存放HTML代码的缓冲区
// 函数功能:
//                获取指定URL中的HTML代码。
// 返回值  :
//            返回获取的代码的字节数。
/************************************************************************/
int WINAPI GetXCode(int nMusicID, PCHAR desCode)
{
    char    szMusicID[10] = {0};
    BOOL    bReadFlg = FALSE;
    char    MusicXCodeBuf[1024] = {0};
    DWORD    dwBytesRead = 0;
    char    pUrl[128]    = "http://haoting.com/musicjs/\0";    //"http://haoting.com/musicjs/"+musicids[idindex]+".js"
    sprintf(szMusicID, "%d", nMusicID);

    lstrcat(pUrl, szMusicID);
    lstrcat(pUrl, ".js\0");

    HINTERNET hNet = ::InternetOpen("Wonderful Songs", //当HTTP协议使用时，这个参数随意赋值
        PRE_CONFIG_INTERNET_ACCESS, //访问类型指示Win32网络函数使用登记信息去发现一个服务器。
        NULL,
        INTERNET_INVALID_PORT_NUMBER, //使用INTERNET_INVALID_PORT_NUMBER相当于提供却省的端口数。
        0 //标志去指示使用返回句句柄的将来的Internet函数将"不"为回调函数发送状态信息
        ) ;

    HINTERNET hUrlFile = ::InternetOpenUrl(hNet,    //从InternetOpen返回的句柄
        pUrl,    //需要打开的URL ,我们要打开哪个网址就可以填到这里
        NULL,    //用来向服务器传送额外的信息,一般为NULL
        0,        //用来向服务器传送额外的信息,一般为 0
        INTERNET_FLAG_RELOAD, //InternetOpenUrl行为的标志
        0) ;    //信息将不会被送到状态回调函数

    bReadFlg = ::InternetReadFile(hUrlFile,        //InternetOpenUrl返回的句柄
            MusicXCodeBuf,            //保留数据的缓冲区,也就是存放网页的内容拉
            sizeof(MusicXCodeBuf),
            &dwBytesRead);    //指向包含读入缓冲区字节数的变量的指针;

    if (!bReadFlg)
    {
        lstrcpy(desCode, "连接超时\0");
    }
    else
    {
        lstrcpy(desCode, MusicXCodeBuf);
    }

    ::InternetCloseHandle(hUrlFile);
    ::InternetCloseHandle(hNet);

    return lstrlen(desCode);
}

/************************************************************************/
// 函数名称:    AnalyseXCode
// 参数列表:
//            1、 nMusicID:    歌曲ID。
//            2、    XCode     :    HTML代码。
// 函数功能:
//                从JS代码中分离歌曲的关键信息到结构体中。
// 返回值  :
//                返回 SONG_STRU 结构，其中存放的歌曲的信息。
// 参数的格式:
//                var url_357857="/21z/0/dianxiao2yyyyqx090620/1/0897053676a18e5e_1.wma";
//                var music_357857="相爱后动物感伤(CD Version) - 阿密特(张惠妹)";
//                var singer_357857="最新单曲";
//                var nclassid_357857=5538;
//                var specialid_357857="abb60fe6d6c77f45";
//                var specialName_357857="最新单曲合辑NO.48";
/************************************************************************/
SONG_STRU WINAPI AnalyseXCode(int nMusicID, PCHAR XCode)
{
    bool        bStart = false;
    char        *pdest;
    char        tmpStr[128]    = {0};
    char        szMusicID[10] = {0};

    SONG_STRU    struMusicInfo ;

    struMusicInfo.id            =    nMusicID;
    struMusicInfo.MusicName        =    new char[128];
    struMusicInfo.Singer        =    new char[128];
    struMusicInfo.specialName    =    new char[128];
    struMusicInfo.Url            =    new char[128];

    if (XCode != NULL)
    {
        //解析下载地址
        pdest  = strstr(XCode, "url_\0");
        if (NULL != pdest)
        {
            for (int i = pdest - XCode + 1, x = 0; i<lstrlen(XCode); i++)
            {
                if (i>=0 && XCode[i-2] == '=')
                {
                    bStart = true;
                    x = 0;
                }

                if (XCode[i+1] == ';')
                {
                    bStart = false;

                    if(strstr(tmpStr, "/19z/\0")==NULL && strstr(tmpStr, "/20z/\0")==NULL && \
                                strstr(tmpStr, "/21z/\0")==NULL && strstr(tmpStr, "/22z/\0")==NULL)
                    {
                        lstrcpy(struMusicInfo.Url, "http://ow.haoting.com");
                    }
                    else
                    {
                        lstrcpy(struMusicInfo.Url, "http://wma.haoting.com");
                    }

                    lstrcat(struMusicInfo.Url, tmpStr);
                    RtlZeroMemory(tmpStr, 128);
                    break;
                }

                if (bStart)
                {
                    tmpStr[x] = XCode[i];
                    x++;
                }
            }
        }

        //解析歌曲名字
        pdest  = strstr(XCode, "music_\0");
        if (NULL != pdest)
        {
            for (int i = pdest - XCode + 1, x = 0; i<lstrlen(XCode); i++)
            {
                if (i>=0 && XCode[i-2] == '=')
                {
                    bStart = true;
                    x = 0;
                }

                if (XCode[i+1] == ';')
                {
                    bStart = false;
                    lstrcpy(struMusicInfo.MusicName, tmpStr);
                    RtlZeroMemory(tmpStr, 128);
                    break;
                }

                if (bStart)
                {
                    tmpStr[x] = XCode[i];
                    x++;
                }
            }
        }

        //解析歌手名字
        pdest  = strstr(XCode, "singer_\0");
        if (NULL != pdest)
        {
            for (int i = pdest - XCode + 1, x = 0; i<lstrlen(XCode); i++)
            {
                if (i>=0 && XCode[i-2] == '=')
                {
                    bStart = true;
                    x = 0;
                }

                if (XCode[i+1] == ';')
                {
                    bStart = false;
                    lstrcpy(struMusicInfo.Singer, tmpStr);
                    RtlZeroMemory(tmpStr, 128);
                    break;
                }

                if (bStart)
                {
                    tmpStr[x] = XCode[i];
                    x++;
                }
            }
        }

        //解析专辑名字
        pdest  = strstr(XCode, "specialName_\0");
        if (NULL != pdest)
        {
            for (int i = pdest - XCode + 1, x = 0; i<lstrlen(XCode); i++)
            {
                if (i>=0 && XCode[i-2] == '=')
                {
                    bStart = true;
                    x = 0;
                }

                if (XCode[i+1] == ';')
                {
                    bStart = false;
                    lstrcpy(struMusicInfo.specialName, tmpStr);
                    RtlZeroMemory(tmpStr, 128);
                    break;
                }

                if (bStart)
                {
                    tmpStr[x] = XCode[i];
                    x++;
                }
            }
        }
    }

    return    struMusicInfo;
}

然后将它得到的信息显示到程序的界面的就可以了，由于直接显示在分析的时候，会造成界面的暂时性假死，所以我单独抛了个线程来完成分析的工作，界面只负责显示，然后在分析的时候加上等待时间，以减少对网络和电脑资源的消耗。
效果如下图：

当然，如果大家有兴趣，可以写个程序，通过对ID的遍历来实现歌曲搜索、下载等功能，不过可能会比较消耗网络资源我就不写了，嘿嘿！

工程下载：/Files/bester/HaotingPlg/GetDownloadUrlPlg.rar

Feedback

# re: 好听音乐网 -- 歌曲下载分析流程及程序的编写回复 更多评论

2009-06-30 08:05 by besterChen

这里有另一种写法和分析：
http://bbs.pediy.com/showthread.php?t=92326

# re: 好听音乐网 -- 歌曲下载分析流程及程序的编写回复 更多评论

2009-12-22 11:01 by 我靠

靠。会点小技术，就不要公开，md，我对haoting采集大半年了。
你这个破技术公开，导致好听代码重新调整，我又要重写我程序，拜托楼主你还能不要公开这点破烂玩意呢。

# re: 好听音乐网 -- 歌曲下载分析流程及程序的编写回复 更多评论

2010-01-13 13:37 by besterChen

@我靠
抱歉哦，我不是故意的……

我就是平时无聊，搞个博客来显摆显摆，装下牛人~

仅仅是满足下自己的虚荣心而已，希望你别往心里去~

# re: 好听音乐网 -- 歌曲下载分析流程及程序的编写回复 更多评论

2010-07-30 05:22 by hoodlum1980

GetXCode函数里设置pUrl的时候，用一个sprintf函数就好了呀，干吗还要连续的strcat呢呵呵。。。
看得出来，lz还是很留恋在C的多字节字符串处理上（可能和我一样，用熟了就不喜欢换别的了），不过我还是建议楼主逐渐适应TCHAR上来（毕竟NT以后的操作系统都采用宽字符了），只需要记得大部分用_tcs开头就是了，基本上所有的多字节字符串都有 tchar 版本；

# re: 好听音乐网 -- 歌曲下载分析流程及程序的编写[未登录] 回复 更多评论

2010-07-30 18:00 by besterchen

@hoodlum1980
恩，是啊~
我会注意的，(*^__^*) 嘻嘻……~

刷新评论列表

只有注册用户登录后才能发表评论。
【推荐】100%开源！大型工业跨平台软件C++源码提供，建模，组态！

相关文章: 如何检测内存泄漏问题好听音乐网 -- 歌曲下载分析流程及程序的编写给MFC对话框程序添加状态栏的方法将程序最小化到托盘的方法

网站导航: 博客园 IT新闻 BlogJava 博问 Chat2DB 管理

聚星亭

好听音乐网 -- 歌曲下载分析流程及程序的编写

Feedback

# re: 好听音乐网 -- 歌曲下载分析流程及程序的编写回复 更多评论

# re: 好听音乐网 -- 歌曲下载分析流程及程序的编写回复 更多评论

# re: 好听音乐网 -- 歌曲下载分析流程及程序的编写回复 更多评论

# re: 好听音乐网 -- 歌曲下载分析流程及程序的编写回复 更多评论

# re: 好听音乐网 -- 歌曲下载分析流程及程序的编写[未登录] 回复 更多评论

公告

随笔分类(81)

随笔档案(74)

牛人博客

团队博客

友情链接

知名论坛

最新随笔

搜索

积分与排名

最新评论

阅读排行榜

评论排行榜

聚星亭

好听音乐网 -- 歌曲下载分析流程及程序的编写

Feedback

# re: 好听音乐网 -- 歌曲下载分析流程及程序的编写 回复 更多评论

# re: 好听音乐网 -- 歌曲下载分析流程及程序的编写 回复 更多评论

# re: 好听音乐网 -- 歌曲下载分析流程及程序的编写 回复 更多评论

# re: 好听音乐网 -- 歌曲下载分析流程及程序的编写 回复 更多评论

# re: 好听音乐网 -- 歌曲下载分析流程及程序的编写[未登录] 回复 更多评论

公告

随笔分类(81)

随笔档案(74)

牛人博客

团队博客

友情链接

知名论坛

最新随笔

搜索

积分与排名

最新评论

阅读排行榜

评论排行榜

# re: 好听音乐网 -- 歌曲下载分析流程及程序的编写回复更多评论

# re: 好听音乐网 -- 歌曲下载分析流程及程序的编写回复更多评论

# re: 好听音乐网 -- 歌曲下载分析流程及程序的编写回复更多评论

# re: 好听音乐网 -- 歌曲下载分析流程及程序的编写回复更多评论

# re: 好听音乐网 -- 歌曲下载分析流程及程序的编写[未登录] 回复更多评论