这几天收到的最多的错误报告就是HTML解析异常,么办法,谁叫LingosHook的HTML解析对象是咱自己写的,稍微不合规则点的HTML数据,TinyHtmlParser都不认识。甚至连合规则的HTML标准注释'<--!-->'都不认识。。。。嗯,我知道这样不太靠谱。。。
为了保证TinyHtmlParser能够正确解析,就需要先‘预处理’一下HTML数据,使其能够符合标准点。对于这样的需求,一个不二的库就出现了--
Tidylib。这个库怎么用就不说了,因为我也不太熟悉,嘿嘿,我使用的代码请见
这里。
此次修改就是为了减少解析HTML数据时产生异常出频度,因此界面上基本没有变化,就直接上配置界面了。下载在
这里。
如图所示,这个选项默认是开启的,因此想来像我这样就使用一个或两个词典的人应该不多,加上就使用vicon的更应该不多了,最主要的使用其它词典而碰到异常的人应该很多很多,所以默认开启此项。此项开启会引起性能的降低,当然了这个降低只是代码理论上的,实际使用中是看不出来的。只是有影响,咱最好就提供个选择,民主点了。。。
下面的图是Debug界面图,就是原来的Trace界面,可以看到添加了一个Text和一个Button,便于调试,现在我能很快定位异常位置了,不需要像前面写代码了。。这里贴下就给大家看看,也想说下,实际给自己留好调试的后门,是很必要的。。