注意:这里假设你知道如何使用 pip 安装 python 的库的知识,如果你不了解这一块的话,点这里获取帮助。
强烈推荐使用 pip 安装。
pip install robobrowser -i http://pypi.douban.com/simple/
这里用上了豆瓣源,原因你懂得。
新建 1 个 start.py 文本文件,然后敲入下面的代码
import re
from robobrowser import RoboBrowser
b = RoboBrowser(history=True)
b.open('http://itest.info/courses/2')
title = b.select('.headline h2')
print title[0].text
infos = b.select('h4')
for info in infos:
print info.text
在命令行里运行python start.py
,然后看一下结果,如果报错请自行耐心分析原因。
robobrowser 自带一点点文档,聊胜于无,凑合看吧。
在命令行里运行
python -m pydoc -p 1234
如果运行成功的话,就从浏览器中访问http://localhost:1234/robobrowser.htmlbrowser 这个类就好了。。主要看一下
Beautiful Soup将让你受益匪浅,强烈建议阅读。
文本版权归乙醇所有,欢迎转载,但请标明出处。
下一节:基于 robobrowser 的简单的爬虫