pydocrawl scarica automaticamente pdf-, ps- e doc-file da siti web. È necessario fornire un URL iniziale e un elenco di parole. Strumento di data mining (raccolta) di informazioni multithread scritto interamente in Python. La versione 0.1 viene eseguita correttamente su Linux e Cygwin.
cronologia delle versioni
- Versione r20040925_v1 pubblicato il 2004-09-24
Diverse correzioni e aggiornamenti - Versione r20040925_v1 pubblicato il 2004-09-24
Dettagli del programma
- Categoria: Rete & Internet > Altro
- Editore: pydocrawl.sf.net
- Licenza: Gratuito
- Prezzo: N/A
- Versione: 20040925
- Piattaforma: windows