Web Data Extractor Pro è uno strumento di raschiatura web appositamente progettato per la raccolta di massa di vari tipi di dati. Può raccogliere URL, numeri di telefono e fax, indirizzi e-mail, nonché informazioni sui meta tag e testo del corpo. La caratteristica speciale di WDE Pro è l'estrazione personalizzata di dati strutturati. Questo programma ad alta velocità e multithread funziona usando una parola chiave nei motori di ricerca, ragnando un sito Web o un elenco di URL da un file. Puoi anche permettergli di seguire collegamenti esterni dalle pagine originali, con la possibilità di entrare in profondità nei percorsi URL di cui hai bisogno e cercare effettivamente l'intero Internet. Web Data Extractor è superiore per la raccolta di informazioni strutturate e tipi di dati specifici relativi alle parole chiave fornite cercando tra più livelli di siti Web.
cronologia delle versioni
- Versione 3.10 pubblicato il 2020-01-06
Parser significativamente migliorato degli indirizzi e-mail; L'elenco degli agenti utente è stato aggiornato; Sono state aggiunte le opzioni "Riprova URL non estratti" e "Fattore umano avanzato" in Connessione per un lavoro ancora più efficace con i siti Web di destinazione; Sono state aggiunte opzioni "Controlla ogni X minuti" e "Rinnova dopo aver letto il numero Y di collegamenti" in Server proxy per un lavoro più efficace con i proxy; Molti miglioramenti sono stati apportati in base alle recensioni dei nostri clienti! - Versione 3.9 pubblicato il 2018-12-30
L'elenco dei motori di ricerca è cancellato da collegamenti obsoleti / interrotti. Questo ci ha permesso di aumentare la velocità del software in modalità motori di ricerca; Parser degli indirizzi di posta elettronica significativamente migliorato, in particolare per le e-mail nascoste JS (JavaScript);Opzione migliorata per importare server proxy personalizzati dai file CSV;Miglioramento del lavoro con i siti Web HTTPS;Prestazioni migliorate quando si lavora con elenchi di URL di grandi dimensioni;opzione Migliorata "Acquisizione cookie"; Varie correzioni/miglioramenti minori in base ai feedback dei clienti - Versione 3.8 pubblicato il 2017-12-29
Aggiunta la possibilità di caricare ed estrarre informazioni dai file PDF; Aggiunta la possibilità di caricare il file di licenza direttamente dal modulo dell'interfaccia utente, quando scade il periodo di prova dell'utilizzo del programma. In alternativa, il file di licenza può essere caricato dal modulo Opzioni -> Informazioni su se il periodo di prova non è ancora scaduto; Lavoro significativamente migliorato attraverso i server proxy; Parser di E-mail JS codificate è stato migliorato; La voce del menu di scelta rapida "URL di avvio" è stata aggiunta all"URL non valido";Miglioramento dell"utilizzo dell'archivio dati interno del software; Aggiunta la possibilità di eliminare le sessioni insieme a tutti i suoi dati e ai file di servizio, anche il software comprime automaticamente il repository interno del programma per ridurre lo spazio su disco richiesto; Aggiunto "Referrer iniziale" campo di testo nell'interfaccia utente. Alcuni siti Web possono visualizzare informazioni diverse a seconda del sito esterno da cui provengono. Il campo "Riferimento iniziale" consente di specificare l'indirizzo Web di tale sito; Abbiamo anche apportato varie modifiche e miglioramenti minori in base ai feedback dei nostri clienti - Versione 3.7 pubblicato il 2017-02-28
Miglioramento del lavoro della modalità "Motori di ricerca"Migliorato "Rimuovi tag HTML" e "La pagina deve contenere il testo seguente per estrarre i filtri dati"; Aggiunto "Usa filtro IP paese", che consente di escludere i risultati dei server che non sono correlati (per geolocalizzazione) al paese selezionato nell'opzione "Motori di ricerca; Parser e-mail significativamente migliorato e parser Custom Builder; Miglioramenti generali nell'individuazione e nell'estrazione dei dati; Abbiamo anche apportato varie modifiche e miglioramenti minori in base ai feedback dei nostri clienti - Versione 3.6 pubblicato il 2016-08-22
È stata aggiunta la casella di controllo "Ottieni URL reindirizzato" nel modulo "Editor dati personalizzato" per estrarre gli URL (ad esempio gli indirizzi del sito Web) presentati tramite un reindirizzamento; È stata aggiunta la casella di controllo "Contrassegna proxy che non rispondono come Inattivi automaticamente". Se durante il server proxy di sessione determinato come non funzionante, viene automaticamente contrassegnato come inattivo e non utilizzato nella sessione; Aggiunta una nuova opzione "Usa unione a riga singola" per unire i dati in un'unica stringa. Ad esempio, è possibile esportare colori di t-shirt come: "T-Shirt", "Nero, Giallo, Rosso, Verde; Caricamento significativamente migliorato dei server proxy pubblici da Internet; "Fattore umano" opzione è stata migliorata; Migliorato un parser di abiti e-mail chiusi da JS; Opzione migliorata di passaggio di Google-captcha durante la ricerca di dati tramite Google; Abbiamo anche apportato varie modifiche e miglioramenti minori in base ai feedback dei nostri clienti - Versione 2.0 pubblicato il 2012-08-29
Rielaborato l'algoritmo per determinare la profondità della scansione, viene aggiunta la sostenibilità del programma al danno fisico del database, il controllo dei flussi migliorato, che ha un impatto positivo sulle prestazioni complessive, Il lavoro migliorato con un ampio elenco di parole chiave in modalità "Motori di ricerca".
Dettagli del programma
- Categoria: Rete & Internet > Strumenti di ricerca/ricerca
- Editore: WebExtractor System
- Licenza: Prova gratuita
- Prezzo: $199.00
- Versione: 3.10
- Piattaforma: windows