DataparkSearch Engine è una ricerca basata sul Web a fonti aperte completa rilasciato sotto la GNU General Public License e progettato per organizzare la ricerca all'interno di un sito web, di un gruppo di siti web, di intranet o di un sistema locale. DataparkSearch è composto da due parti. La prima parte è il meccanismo di indicizzazione (indicizzatore). L'indicizzatore cammina su html Riferimenti ipertestuali e archivia parole trovate e nuovi riferimenti nel database. La seconda parte è web CGI front-end per fornire ricerca utilizzando i dati raccolti dall'indicizzatore. Caratteristiche principali: Supporto per schemi URL http, https, ftp, nntp e news; Supporto dello schema url virtuale htdb per l'indicizzazione dei database SQL; supporto incorporato per i tipi MIME text/html, text/xml, text/plain,audio/mpeg (MP3) e image/gif mime; Supporto dei parser esterni per altri tipi di documento; Capacità di indicizzare siti multilingue utilizzando la negoziazione del contenuto; Ricerca di tutti i moduli di parole utilizzando affissi e dizionari ispell; Ricerca sfocata basata su acronimi e abbreviazioni. Stopwords e liste di sinonimi; Supporto del linguaggio di query booleano; L'ordinamento dei risultati per pertinenza, rango di popolarità, ora dell'ultima modifica e per importanza (una moltiplicazione rilevanza e popolarità); Supporto di vari set di caratteri; Ricerca insensibile all'accento; Segmentazione delle frasi per le lingue cinese, giapponese, coreana e tailandese; mod_dpsearch - modulo di ricerca per server web Apache; Supporto internazionale dei nomi di dominio; Algoritmo di estrazione riepilogativo.
cronologia delle versioni
- Versione 4.53 pubblicato il 2010-01-24
Dettagli del programma
- Categoria: Rete & Internet > Strumenti di ricerca/ricerca
- Editore: Datapark Corp.
- Licenza: Gratuito
- Prezzo: N/A
- Versione: 4.53
- Piattaforma: linux