为了支持LingosHook Android Client,今天优化了我的HTML解析类--TinyHtmlParser。长时间没看LingosHook代码,都不认识了,分析了很久才明白其工作原理,汗啊,这曾经可是自己写的啊。。。
这次增加了一个新的分解过程中类型 -- DT_END_SPECIAL,用于指点类似<META .../>的元素,真没想到,以前竟然不支持这个,如果元素是以'/'结尾的话,只能放到DT_SPECIAL列表中,这方法太无聊了。。。
还有,这次增加了输出功能,分解后的数据可以再合成一个HTML串了。这样极大地方便了定制输出,以后提取指定数据要准确和灵活很多了。(哈哈,可以增加真正的数据导出功能了。。。)
就这些,TinyHtmlParser在类似'<A>[<B>123</B>]</A>'的处理上还不够灵活,导致输出时有些走样,还有再改改。另外,输出函数直接放到TinyHtmlParser类中有些勉强,还是单独弄个Ouput类来处理比较,比较好看。
<---- 就是分割线 ---->
喜欢看代码的,请帮忙检查这里
TinyHtmlParser.h 和
TinyHtmlParser.cpp ,辛苦了。