socketref,再见!高德

https://github.com/adoggie

  C++博客 :: 首页 :: 联系 :: 聚合  :: 管理
  246 Posts :: 4 Stories :: 312 Comments :: 0 Trackbacks

常用链接

留言簿(54)

我参与的团队

搜索

  •  

最新评论

阅读排行榜

评论排行榜



import sys 
from PyQt4.QtCore import *
from PyQt4.QtGui import *
from PyQt4.QtWebKit import *
start_url = 'http://searchex.yixun.com/?YTAG=1.100090000'
def save_file(data,file='temp.txt'):
f = open(file,'w')
f.write(data)
f.close()
web = None
def onDone():
f = open('scrapy.html','w')
page = web.page().mainFrame().toHtml().toUtf8().data()
f.write(page) 
f.close()
print "Done ..."
e = web.page().mainFrame().documentElement().findFirst("h3[class=m_classbox_hd]")
print e.tagName()
#print dir(e)
print e.toPlainText().toUtf8().data() #.decode('gbk') #.decode('utf-8') #.encode('utf-8')
save_file(e.toPlainText().toUtf8().data())
def onStart():
print "Started..." 
app = QApplication(sys.argv)
web = QWebView()
web.page().mainFrame().loadStarted.connect(onStart)
web.page().mainFrame().loadFinished.connect(onDone)
web.load(QUrl(start_url))
#print web.page().mainFrame().toHtml()
print 'end'
web.show()
sys.exit(app.exec_())
posted on 2014-05-19 21:41 放屁阿狗 阅读(771) 评论(0)  编辑 收藏 引用

只有注册用户登录后才能发表评论。
网站导航: 博客园   IT新闻   BlogJava   知识库   博问   管理