前端测试 还没被玩坏的 robobrowser (2)——安装及快速开始

乙醇 · 2015年01月08日 · 最后由 恒温 回复于 2015年01月08日 · 2488 次阅读
本帖已被设为精华帖!

安装 robobrowser

注意:这里假设你知道如何使用 pip 安装 python 的库的知识,如果你不了解这一块的话,点这里获取帮助。

强烈推荐使用 pip 安装。

pip install robobrowser -i http://pypi.douban.com/simple/

这里用上了豆瓣源,原因你懂得。

快速开始

新建 1 个 start.py 文本文件,然后敲入下面的代码

import re
from robobrowser import RoboBrowser

b = RoboBrowser(history=True)
b.open('http://itest.info/courses/2')

title = b.select('.headline h2')
print title[0].text

infos = b.select('h4')

for info in infos:
  print info.text

在命令行里运行python start.py,然后看一下结果,如果报错请自行耐心分析原因。

查看文档

robobrowser 自带一点点文档,聊胜于无,凑合看吧。

在命令行里运行

python -m pydoc -p 1234

如果运行成功的话,就从浏览器中访问http://localhost:1234/robobrowser.htmlbrowser 这个类就好了。。主要看一下

相关知识

Beautiful Soup将让你受益匪浅,强烈建议阅读。

文本版权归乙醇所有,欢迎转载,但请标明出处。

下一节:基于 robobrowser 的简单的爬虫

共收到 4 条回复 时间 点赞

以前的爬虫就是用 Beautiful Soup~~~

一听到爬虫,都不敢碰~ 公司有高压线啊……严禁这东西~

真不错,也可以用来遍历页面 元素用。

我是测试回帖的。

需要 登录 后方可回复, 如果你还没有账号请点击这里 注册