例外処理

h1タグの中のaタグのhref要素の値を取るようにしてたんだけども、ブログデータセットのファイルの中でh1がないやつがあり、例外処理を行うことに。
Hpricotをrequireしてdoc.at("/h1/a").attributes['href]で探しているけども、無かったらnilでしょ。
ifとかでもいいけど

begin
 urlh1 = doc.at("h1/a").attributes['href']
puts urlh1
rescue
puts "Can't get URL"

にしてやればいいや。ってことで。
後はHpricotのparse.rbが can't convert nil into String (TypeError)を吐くのがむかつくのでそれの対処かね。と思ったら単に空htmlだった。