Programmi di wikipedia2xml.sf.net

  • wikipedia2XML Gratuito

    Una raccolta di script python per creare e gestire un corpus XML (una grande raccolta di testo per scopi linguistici) da un dump di backup originale del database di Wikipedia. Include un parser basato su espressioni regolari