OCR (Optical Character Recognition)

  • Testo
  • Links1
  • Voci correlate
Riconoscimento ottico di caratteri. È un software applicativo, spesso fornito come corredo ‘di serie’ al momento dell’acquisto di uno scanner, che converte una pagina di testo dal formato grafico a un formato testuale modificabile. I software OCR sono specializzati nelle operazioni di riconoscimento dei caratteri alfabetici, numerici e diacritici contenuti nelle pagine e nella loro conversione in un formato testuale adeguato ai programmi di elaborazione testi. Essi memorizzano i caratteri più diffusi e, nel corso delle operazioni di conversione, li confrontano con le varie porzioni dell’immagine analizzata ‘punto punto’ fino a realizzare un riconoscimento del carattere pertinente. La buona riuscita di un’operazione di riconoscimento ottico dipende da una pluralità di fattori che vanno dalla qualità (dimensioni e nitidezza) del testo sottoposto a scansione, alla risoluzione dello scanner (dpi, dots per inch, punti per pollice), fino alla potenza degli algoritmi di riconoscimento e del computer. I notevoli progressi realizzati negli ultimi anni in ciascuno di questi settori ha consentito il raggiungimento di ottimi risultati, con una fedeltà quasi totale all’originale (se ben leggibile). Tuttavia conviene sempre sottoporre il testo ottenuto a una veloce operazione di pulitura e correzione.

G. N.

Bibliografia

Non c'è bibliografia per questa voce

Documenti

Non ci sono documenti per questa voce
Come citare questa voce
Nicolosi Giuseppe , OCR (Optical Character Recognition), in Franco LEVER - Pier Cesare RIVOLTELLA - Adriano ZANACCHI (edd.), La comunicazione. Dizionario di scienze e tecniche, www.lacomunicazione.it (23/01/2021).
CC-BY-NC-SA Il testo è disponibile secondo la licenza CC-BY-NC-SA
Creative Commons Attribuzione-Non commerciale-Condividi allo stesso modo
889