随笔 - 41, 文章 - 8, 评论 - 8, 引用 - 0
数据加载中……

[导入][python]获取贴吧中每个帖子的链接

代码:

from win32com.client import DispatchEx
import time
ie=DispatchEx("InternetExplorer.Application")

ie.Navigate("http://tieba.baidu.com/python")
ie.Visible=1
while ie.Busy:
    time.sleep(1)

body=ie.Document.body
for i in body.getElementsByTagName("table"):
    if str(i.getAttribute("id"))=="thread_list_table":
        tbody=i
        break
for i in tbody.getElementsByTagName("tr"):
    if str(i.getAttribute("tid")).isdigit():
        tmpurl="http://tieba.baidu.com/f?kz=%s"%i.getAttribute("tid")
        print tmpurl

ie.quit()

感觉这都可以用来爆吧了。真是邪恶啊。

阅读全文
类别:Python 查看评论
文章来源:http://hi.baidu.com/mirguest/blog/item/80755520b643a4e0d7cae2ef.html

posted on 2011-02-10 11:52 mirguest 阅读(272) 评论(0)  编辑 收藏 引用


只有注册用户登录后才能发表评论。
网站导航: 博客园   IT新闻   BlogJava   博问   Chat2DB   管理