(ヽ´ω`) < 助けてほしいマン

わからないことを助けてほしいマンが書くブログ

Ruby

(ヽ'ω`) < RubyでPythonのpickleを読み込む

(ヽ'ω`) < 何するの? rubyでpythonのcPickleライブラリの.pckファイルを読み込む。 (ヽ'ω`) < ライブラリがあるはず pickleのフォーマット自体は公開されているので、当然Rubyで読み込むためのライブラリなんてのは、どこかの頭のいい人が作ってくれてるは…

(ヽ´ω`) < ruby 2.xでgollum(というよりGrit)を使うとエラー

(ヽ´ω`) < undefined method `>>' for "x":String ruby 2.xでgollumを起動すると、画面のレンダリングの際に以下のようなエラーが発生する。 NoMethodError at /home undefined method `>>' for "x":String 調べてみると、どうもgollumの依存ライブラリのgri…

(ヽ´ω`) < 3. 選択された要素から値を取り出す

(ヽ´ω`) < 選択された要素から値を取り出す 2.で選択した要素*_nodesから、要素が保持している文字列や属性の値を取得する。 (ヽ´ω`) < まずはNodeSetからNodeに 2.でも説明したように、#xpathや#cssメソッドが返す値は、常にNodeSetオブジェクトとなる。 そ…

(ヽ´ω`) < 2. 作成したDOMから要素を選択。

(ヽ´ω`) < 作成したDOMから要素を選択。 1で作成したdocから、値を取得したい要素(Nokogiri::XML::Nodeオブジェクト)を選択する。選択方法にはXPathとCSSの他に、children, parents, siblings等の一般的なツリー探索のメソッド郡が用意されている。 (ヽ´ω`) …

(ヽ´ω`) < 1. XML(HTML)文章からDOMを作成

(ヽ´ω`) < DOMを作成 DOMを作成するにはNokogiri::XMLかNokogiri::HTMLを使う。 引数としては読みだし可能なIOストリームならなんでもOK。 (ヽ´ω`) < 入力ソースの文字コードを指定する Nokogiriではオブジェクトが内部で保持するデータは常にUTF-8であり、…

(ヽ´ω`) < RubyのNokogiriを上辺だけ使う。深入りはしない。

(ヽ´ω`) < 3 steps Nokogiriを使ってスクレイピングを行う際の、大きな流れとしては3つ。 XML(HTML)文章からDOMを作成。 作成したDOMから要素を選択。 選択された要素から値を取り出す。又は更にそこから要素を選択。 1〜3までの流れについて、それぞれ別の…