Programmi di wikipedia2xml.sf.net
-
wikipedia2XML Gratuito
Una raccolta di script python per creare e gestire un corpus XML (una grande raccolta di testo per scopi linguistici) da un dump di backup originale del database di Wikipedia. Include un parser basato su espressioni regolari