Arch Search Engine 1.15

Licenza: Gratuito ‎Dimensioni del file: 31.07 MB
‎Valutazione utenti: 3.5/5 - ‎2 ‎Voti

Arch è un'estensione open source di Apache Nutch (un popolare motore di ricerca generico altamente scalabile) per la ricerca intranet. Non sei soddisfatto del tuo motore di ricerca aziendale? Non sorprende, pochissime persone lo sono. Per quanto ne so, non ci sono motori intranet che funzionano così come fa la ricerca Web globale di Google. C'è una ragione fondamentale per questo: gli algoritmi utilizzati da Google sul Web globale (o simili) non funzionano altrettanto bene sulle intranet per la mancanza di dati statistici. Arch (finalmente!) risolve questo problema. Utilizza un nuovo metodo per fornire risultati di ricerca di alta precisione che funzionano alla grande. Non ci credi? Sono inclusi strumenti di valutazione dei test alla cieca. Puoi distribuire Arch e confrontare le sue prestazioni con il tuo motore di ricerca attuale e / o Google (nella parte pubblica del tuo sito) utilizzando una metodologia di test alla cieca. Oltre all'eccellente qualità di ricerca, Arch ha molte caratteristiche critiche per gli ambienti aziendali: - Sicurezza a livello di documento. Gli utenti possono trovare solo i documenti che sono autorizzati a vedere. - Aggiornamenti dell'indice economici. Arch è in grado di mantenere aggiornati gli indici ed evitare il normale recrawling completo del sito. - disponibilità 24 ore su 24, 7 giorni su 7. È sempre disponibile un indice di lavoro, anche se una ricerca per indicizzazione ha esito negativo. - Supporto per l'indicizzazione simultanea e la ricerca di più siti web, con la possibilità di cercare e amministrare qualsiasi sito separatamente, se necessario. L'aggiunta e la rimozione dinamiche di siti Web è facile. - Una directory del sito generata automaticamente. - Supporto a basso costo una volta distribuito. - Doppia interfaccia (PHP e Java) per una facile distribuzione e personalizzazione. - Ricerca sfaccettata "fuori dalla scatola". - Un ampio ed estensibile set di parser per l'analisi di una varietà di formati di file: HTML, PHP, PDF, MS Office, Open Office, ecc. - Un'architettura modulare basata su plugin che può essere facilmente personalizzata ed estesa. - Il codice sorgente è incluso. - Alte prestazioni e scalabilità. Arch può essere eseguito su cluster di computer per indicizzare set di dati molto grandi.

cronologia delle versioni

  • Versione 1.15 pubblicato il 2019-05-17
    Portato su Nutch 1.15
  • Versione 1.9.2 pubblicato il 2016-08-18
    Migliorata l'analisi dei documenti, consociata su Nutch 1.9.
  • Versione 1.2 pubblicato il 2010-09-17
    Portato su Apache Nutch 1.2, aggiornato il parser PDF, aggiunto strumenti di test e ottimizzazione, risolti i problemi riscontrati nella versione beta, abilitato l'uso dei cluster di computer.

Dettagli del programma