元のウィキペディアのデータベースバックアップダンプから XML コーパス (言語目的のテキストの大規模なコレクション) を作成して処理するための Python スクリプトのコレクション。MediaWiki マークアップ言語の正規表現ベースのパーサーが含まれています。
バージョン履歴
- バージョン 0.1 に転記 2008-04-01
いくつかの修正と更新 - バージョン 0.1 に転記 2008-04-01
プログラムの詳細
- カテゴリ: 教育 > 他
- パブリッシャー: wikipedia2xml.sf.net
- ライセンス: 無料
- 価格: N/A
- バージョン: 0.1
- プラットフォーム: windows