每周问答 ruby 获取页面内容乱码

simple · 2014年01月10日 · 最后由 恒温 回复于 2014年01月11日 · 1538 次阅读

需求:获取http://home.soufun.com/album/channel_101/ 下的所有 link 的 href
用 nokogiri、open-uri、net/http 都试过,取出来的内容是 ASCII-8BIT 编码的,很奇怪,大家帮忙看看

共收到 1 条回复 时间 点赞
2.0.0p353 :021 > doc.css("a").each do |link|
2.0.0p353 :022 >      puts link['href']
2.0.0p353 :023?>   end
http://home.soufun.com/
http://home.soufun.com/news/
http://home.soufun.com/zhuangxiu/
http://home.soufun.com/album/
http://home.soufun.com/yangbanjian/
需要 登录 后方可回复, 如果你还没有账号请点击这里 注册