wikipedia2XML 0.1

Licenza: Gratuito ‎Dimensioni del file: N/A
‎Valutazione utenti: 3.0/5 - ‎1 ‎Voti

Circa wikipedia2XML

Una raccolta di script python per creare e gestire un corpus XML (una grande raccolta di testo per scopi linguistici) da un dump di backup originale del database di Wikipedia. Include un parser basato su espressioni regolari per il linguaggio di markup MediaWiki.