happyou.infoのブログ

ニュース収集サイトhappyou.infoのブログです。 国内外のあらゆる企業と組織、団体のウェブサイトの更新を収集します。 岡本将吾が運営しています。twitterは @happyou_info_ja です。

サーバを更新しました。

これまでクローラはCentOS6.5で動作させていたのですが、CentOS7.4での動作に更新しました。 クロールに用いるウェブブラウザはPhantomJSとSWTの利用を止めてGoogleChrome headlessモードとFirefoxに 統一しました。 AdobeFlashの対応があるため、Firefoxは必要です。

APIサーバはCentOS6.5のままなので、いずれ更新を行わなければなりません。

現在FinalScraper2を開発しています。うまくゆくかどうかはわかりません。