安装 robobrowser

注意:这里假设你知道如何使用 pip 安装 python 的库的知识,如果你不了解这一块的话,点这里获取帮助。

强烈推荐使用 pip 安装。

pip install robobrowser -i http://pypi.douban.com/simple/

这里用上了豆瓣源,原因你懂得。

快速开始

新建 1 个 start.py 文本文件,然后敲入下面的代码

import re
from robobrowser import RoboBrowser

b = RoboBrowser(history=True)
b.open('http://itest.info/courses/2')

title = b.select('.headline h2')
print title[0].text

infos = b.select('h4')

for info in infos:
  print info.text

在命令行里运行python start.py,然后看一下结果,如果报错请自行耐心分析原因。

查看文档

robobrowser 自带一点点文档,聊胜于无,凑合看吧。

在命令行里运行

python -m pydoc -p 1234

如果运行成功的话,就从浏览器中访问http://localhost:1234/robobrowser.htmlbrowser 这个类就好了。。主要看一下

相关知识

Beautiful Soup将让你受益匪浅,强烈建议阅读。

文本版权归乙醇所有,欢迎转载,但请标明出处。

下一节:基于 robobrowser 的简单的爬虫


↙↙↙阅读原文可查看相关链接,并与作者交流