上海交通违章查询网站: http://www.shjtaq.com/Server1/dzjc_new.asp
验证码图片获取地址: http://www.shjtaq.com/Server1/validatecode.asp?m=2304.046
服务器通过页面请求的session-id来区分之后提交的验证码。 第一次请求查询页面时,服务器将访问session(cookie)传到客户端,之后的查询和验证码获取时客户端携带之前的cookie传送到服务器,服务器端保存着当前 session-id与验证码 的对应关系。
查询返回记录可通过 xpath或者 beautifulsoup进行解析
程序使用python完成,也是个简单的小爬虫,scrapy 之类的没必要使用了,gevent完成异步通信。
交通网的验证码生成还是比较简单,做自动识别可找几个简单的图形识别程序即可。
如若不行,则人工输入喽