wikipedia2XML 0.1

ライセンス: 無料 ‎ファイルサイズ: N/A
‎ユーザー評価: 3.0/5 - ‎1 ‎投票

元のウィキペディアのデータベースバックアップダンプから XML コーパス (言語目的のテキストの大規模なコレクション) を作成して処理するための Python スクリプトのコレクション。MediaWiki マークアップ言語の正規表現ベースのパーサーが含まれています。

バージョン履歴

  • バージョン 0.1 に転記 2008-04-01
    いくつかの修正と更新
  • バージョン 0.1 に転記 2008-04-01

プログラムの詳細