Wikitable
Wikitables - Convert Wikipedia tables to CSV file
URLを入力すると、Wikipediaのページにあるテーブルの内容をCSVファイルに変換する。
- 1つのarticleに1テーブルが存在する場合は綺麗にデータが取れる。e.g. Parsed tables from https://simple.wikipedia.org/wiki/List_of_countries_by_population
- しかし1つのarticleに複数のテーブルがある場合、そのデータが何を指すのか機械的に判断出来ない。e.g. Parsed tables from https://simple.wikipedia.org/wiki/Crime_in_Russia
Parsed tables from https://ja.wikipedia.org/wiki/%E5%AE%AE%E5%9F%8E%E7%9C%8C
Wikipediaですらこの状態。世に多数存在する雑なウェブページからテーブルを抽出したところで、そのデータが何なのか判断できない。なんとかしてテーブルに適切なタイトルをつけることが出来ないだろうか?
道は遠い。