かっちゃんの日記

初めまして!自営業(タイヤの卸売)をやってます。新規事業としてアプリ開発に興味がありプログラミングを勉強中です。日々の学びを発信していきます。よろしくお願いします。HTML/CSS/haml/sass/Ruby/Ruby on rails/Javascript/Jquery/Git/GitHub/データベースとSQL/統合テスト/AWS

スクレイピング(get_attributeメソッド)

get_attributeメソッド

aタグ要素のHTMLはリンク先のURLを値とする属性hrefを持っています。このようなHTMLの属性の値を取得したい場合、get_attributeメソッドを使います。

 

今回は、画像のURLを取得したいので、get_attributeメソッドを使います。

こちらの音楽サイトのALBUMジャケットのURLをスクレイピングしてみます。

 

f:id:chkc:20190724140840j:plain

 

検証ツール(command + option + i)で属性の情報をみてみます

 

f:id:chkc:20190724141116p:plain

 

 

c-article-middleクラスimgタグに画像URLがあります。属性はsrcですね。

それを反映させるとこんな感じです。

f:id:chkc:20190724141725p:plain

 

しかしターミナルで出力結果を見ると

f:id:chkc:20190724141939p:plain

一番上のURLをブラウザで確認してみても、当然ですがこうなります。笑

f:id:chkc:20190724142208p:plain

先ほど取得したURLの前に「https://rockinon.com」があれば上手くいきそうです

f:id:chkc:20190724142402p:plain

書き直してみます。

f:id:chkc:20190724142703p:plain

出力結果は、、

f:id:chkc:20190724143013p:plain

きました。自分でコード改良してハマると嬉しいですね。笑

ブラウザで確認してみます。

f:id:chkc:20190724143235p:plain

バッチリです。

構文の書き方で改善点あれば教えてください。