Octoparse 6.4.1
Sarai in grado di scaricare in 5 secondi.
Circa Octoparse
Octoparse è un software di raschiamento Web Windows lato client gratuito che trasforma i dati non strutturati o semistrutturati dai siti Web in set di dati strutturati, senza bisogno di codifica. È uno strumento di raschiamento web facile da usare che raccoglie dati dal Web. I crawler eseguiti in Octoparse sono determinati dalle regole di estrazione configurate. La regola di estrazione direbbe a Octoparse: quale sito web deve essere aperto; dove sono i dati che si prevede di eseguire la ricerca per indicizzazione, ecc. fornisce la raccolta di dati ad alta velocità, eseguendo fino a 10 thread simultanei. Essendo un'applicazione Windows, Octoparse funziona bene per i siti Web statici e dinamici, inclusi quelli le cui pagine Web utilizzano Ajax. Esistono vari formati di esportazione a scelta, ad esempio CSV, EXCEL, HTML, TXT e database (MySQL, SQL Server e Oracle). Octoparse simula il funzionamento umano per interagire con le pagine Web. Le sue notevoli caratteristiche come la compilazione di moduli, l'inserimento di un termine di ricerca nella casella di testo, ecc., renderebbero molto più facile estrarre i dati web. È possibile eseguire il progetto di estrazione su computer propri (estrazione locale) o nel cloud (Cloud Extraction). Octoparse fornisce un riquadro operativo visivo, che è molto intuitivo e diretto. Octoparse simula il comportamento umano di navigazione web come l'apertura di una pagina Web, l'accesso a un account, l'immissione di un testo, il puntamento e il clic sull'elemento web, ecc. Basta fare clic sulle informazioni sul sito web nel browser integrato ed eseguire l'estrazione, otterrai i dati strutturati di cui hai bisogno. Raschiare il web su larga scala contemporaneamente, basato sul calcolo distribuito, è la caratteristica più potente di Octoparse. Dopo aver caricato il progetto di configurazione nel cloud, è possibile scegliere di eseguire l'estrazione contemporaneamente utilizzando molti server cloud. Se hai bisogno di raschiare 10.000 pagine Web in breve tempo, il servizio cloud Octoparse si adatta meglio.