happyou.infoのブログ

ニュース収集サイトhappyou.infoのブログです。 国内外のあらゆる企業と組織、団体のウェブサイトの更新を収集します。 岡本将吾が運営しています。twitterは @happyou_info_ja です。

2021-01-01から1年間の記事一覧

Adobe PDF Extract API を動かしてみた

だいたい久しぶりにブログを書いた。 この手のサービスでは一番性能が良いと思われる。 これはとても辛い判断ではあるけれども、独自の実装は諦めることにした。 どうやっても勝てそうにない。 qiita.com おそらくテーブル外のテキスト(タイトルや脚注)は…

最近の開発(表のパースについて)

ブログをずっと更新していなかったので、最近について書きます。 引き続きHTML/PDF中のテーブルをパースするfs2の開発を続けています。 テーブルのOCRについては以下のようなサービスやライブラリがあることを認識しています。どれも機能や品質、価格に一長…