OCR Test - Works offline 0.6.0

Licenza: Gratuito ‎Dimensioni del file: 10.49 MB
‎Valutazione utenti: 2.8/5 - ‎6 ‎Voti

App sperimentale per il riconoscimento ottico dei caratteri (OCR) Questa app è un'app sperimentale che ho sviluppato diversi anni fa che dimostra l'uso del motore Tesseract OCR per riconoscere il testo nelle immagini catturate dalla fotocamera del dispositivo. Questa app esegue OCR sul tuo dispositivo – senza caricare le tue immagini su un server – ed è adatta per riconoscere singole parole o brevi frasi di testo, ma questa app è destinata a hobbisti e sviluppatori di software interessati a OCR e non a un pubblico generale. A differenza dell'API Mobile Vision di Google, questa app è in grado di riconoscere il testo stampato in caratteri non latini mentre è offline. Per raggiungere questo obiettivo, questa app incorpora una quantità insolitamente grande di dati di training per diverse lingue. Questi dati di allenamento vengono archiviati sul telefono e questa app occupa molto più spazio rispetto alle normali app. Nessuna pre-elaborazione delle immagini viene eseguita da questa app prima di consegnare i fotogrammi immagine acquisiti a Tesseract, quindi l'app non viene ottimizzata per alcun caso d'uso specifico e, di conseguenza, la sua precisione e velocità di riconoscimento dipendono fortemente da fattori siezionali come prospettiva, illuminazione e tipo di carattere. Il codice sorgente per questa app è disponibile su GitHub (con modifiche minori per soddisfare le restrizioni sulle dimensioni dei file GitHub). Il codice per questa app è una combinazione di codice open source relativo alla fotocamera del progetto scanner di codici a barre ZXing e codice di riconoscimento ottico dei caratteri open source del progetto Tesseract OCR. ACQUISIZIONE DEL TESTO L'acquisizione single-shot predefinita esegue OCR su un'immagine snapshot acquisita quando si fa clic sul pulsante dell'otturatore, come una foto normale. Quando la casella di controllo "anteprima continua" è selezionata, l'app mostra una visualizzazione dinamica in tempo reale di ciò che il dispositivo sta riconoscendo proprio accanto al mirino della fotocamera. La modalità di anteprima continua funziona meglio su un dispositivo veloce. USO DI QUESTA APP • Puntare il dispositivo su una piccola area di testo e toccare il pulsante dell'otturatore sullo schermo per avviare l'OCR. • Per riconoscere singoli caratteri cinesi/giapponesi/coreani, impostare la modalità di segmentazione della pagina su "carattere singolo". PRECISIONE DEL RICONOSCIMENTO • Vari fattori possono causare il fallimento dell'OCR: illuminazione irregolare, testo stilizzato o testo senza un contrasto sufficiente dallo sfondo. Cerca di avere una buona illuminazione. • Tieni il dispositivo fermo e assicurati che l'immagine sia a fuoco. • Se è necessario digitalizzare un blocco di testo di grandi dimensioni o un intero documento, provare invece un'app di scansione dei documenti come Fata testo. Lingue • Questa app supporta diverse lingue/script non riconosciuti da Google Translate. • Lingue supportate per L'OCR: Afrikaans Albanese Amarico Arabo Assamese Azero Azero (alfabeto cirillico) Basco Bielorusso Bengali Bosniaco Bulgaro Birmano Catalano Cebuano Cherokee Cinese (semplificato) Cinese (tradizionale) Croato Ceco Danese Olandese Dzongkha Inglese Inglese, Medio (1100-1500) Esperanto Estone Finlandese Frankish Francese Francese, Medio (ca. 1400-1600) Galiziano Georgiano Georgiano - Vecchio Tedesco Greco, Antico (-1453) Greco, moderno (1453-) Gujarati Haitiano Ebraico Hindi Ungherese Islandese Indonesiano Inuktitut Irlandese Italiano Italiano - Vecchio Giapponese Giavanese Kannada Kazaco Khmer Coreano Curdo Kirghiso Lao Latino Lettone Lituano Macedone Malese Malayalam Maltese Marathi Nepalese Norvegese Oriya Pashto Farsi Polacco Portoghese Punjabi Rumeno Russo Sanscrito Serbo Serbo (alfabeto latino) Sinhala Slovacco Sloveno Spagnolo Spagnolo - Vecchio Swahili Svedese Siriaco Tagalog Tajik Tamil Telugu Tailandese Tibetano Tigrinya Turco Ucraino Urdu Uigura Uzbeco Uzbeco (alfebeto cirillico) Vietnamita Gallese Yiddish NOTE SUL DISPOSITIVO SAMSUNG • Sui dispositivi Samsung Galaxy, potrebbe essere necessario premere a lungo il pulsante del menu per impostare le preferenze.

cronologia delle versioni

  • Versione 0.5.14 pubblicato il 2014-05-11
  • Versione 0.4.3 pubblicato il 2011-05-13
    Diverse correzioni e aggiornamenti

Dettagli del programma