Una raccolta di script python per creare e gestire un corpus XML (una grande raccolta di testo per scopi linguistici) da un dump di backup originale del database di Wikipedia. Include un parser basato su espressioni regolari per il linguaggio di markup MediaWiki.
cronologia delle versioni
- Versione 0.1 pubblicato il 2008-04-01
Diverse correzioni e aggiornamenti - Versione 0.1 pubblicato il 2008-04-01
Dettagli del programma
- Categoria: Istruzione > Altro
- Editore: wikipedia2xml.sf.net
- Licenza: Gratuito
- Prezzo: N/A
- Versione: 0.1
- Piattaforma: windows