Nokogiri を使って、ページ内にある a タグの href 属性を全て取得するサンプルコードです。
1 2 3 4 5 6 7 8 9 10 11 12 |
require 'nokogiri' require 'open-uri' html = open('http://codaholic.org') do |data| data.read end doc = Nokogiri::HTML.parse(html) doc.css('a').each do |anchor| p anchor[:href] end |
4行目 〜 6行目
http://codaholic.org の URL の HTML を取得して変数 html に保存します。
8行目 〜 11行目
HTML をパースして、そのオブジェクトの中から a タグの要素を抽出します。抽出された a タグのそれぞれの href 属性を出力します。