Software per lavorare con lo scanner. Programmi di scansione

    La scansione da Acrobat accetta immagini nell'intervallo 10-3000 dpi. Quando selezioni l'opzione Immagine ricercabile o ClearScan nella sezione Stile di output PDF richiede una risoluzione dell'immagine di output di almeno 72 dpi. Inoltre, la risoluzione dell'immagine in uscita superiore a 600 dpi verrà ridotta a 600 dpi o meno.

    La compressione delle immagini senza perdite può essere eseguita solo su immagini monocromatiche. Per comprimere l'immagine scansionata senza perdere la qualità, selezionare una delle seguenti opzioni nella sezione Opzioni di ottimizzazione della finestra di dialogo Ottimizza PDF scansionato: CCITT Gruppo 4 o JBIG2 (Lossless) per immagini monocromatiche. Se questa immagine viene aggiunta a un documento PDF, puoi salvare il file utilizzando l'opzione Salva; l'immagine scansionata rimane non compressa. Quando si salva un documento PDF utilizzando la funzione Salva con nome, l'immagine scansionata potrebbe essere compressa.

    Per la maggior parte delle pagine, verrà prodotta la scansione in bianco e nero a 300 dpi migliori risultati per la conversione. Con una precisione di risoluzione di 150 dpi riconoscimento ottico dei caratteri il numero degli errori di riconoscimento dei font diminuisce leggermente e aumenta; A risoluzioni di 400 dpi e superiori, l'elaborazione rallenta e la dimensione dei file con pagine compresse aumenta. Se la pagina contiene molte parole non riconosciute o il testo non lo è grande taglia(9 punti o meno), prova a scansionarne di più alta risoluzione. Quando possibile, esegui la scansione in bianco e nero.

    Se la funzione Riconoscimento ottico dei caratteri disattivato, è possibile utilizzare una risoluzione compresa tra 10 e 3000 dpi, la risoluzione consigliata è 72 dpi e superiore. Per parametro compressione adattiva Risoluzioni di scansione consigliate: 300 dpi per immagini in scala di grigi e RGB e 600 dpi per immagini in bianco e nero.

    Le pagine digitalizzate a colori a 24 bit, 300 dpi, 8,5 x 11 pollici (21,59 x 27,94 cm) prima della compressione sono immagini di grandi dimensioni (25 MB). Il sistema potrebbe richiedere 50 MB di memoria virtuale o più per eseguire la scansione di un'immagine. A 600 dpi, la scansione e l'elaborazione sono in genere quattro volte più lente rispetto a 300 dpi.

    Evitare di regolare le impostazioni dei mezzitoni e della fusione di diffusione dello scanner. Questo potrebbe migliorare aspetto, ma diventerà difficile riconoscere il testo.

    Per i testi stampati su carta colorata si consiglia di aumentare la luminosità e il contrasto di circa il 10%. Se lo scanner fornisce un filtraggio della luce, è necessario sopprimere il colore dello sfondo utilizzando un filtro o una lampada speciale. Oppure, se il testo non viene soppresso, provare a regolare il contrasto e la luminosità dello scanner per rendere più nitido il documento scansionato.

    Se lo scanner è dotato di controllo manuale della luminosità, regolalo in modo che i caratteri siano chiari e forma corretta. Se i personaggi sono collegati, utilizza impostazioni più elevate (colori più luminosi). Se i caratteri sono separati, utilizzare le impostazioni inferiori (colore più scuro).

La nostra selezione ha esaminato un elenco dei programmi di scansione di testo più popolari. Un fattore importante per i programmi di questa categoria, è la capacità di decifrare il testo dei documenti, nonché la qualità della scansione: è necessario che le informazioni siano completamente leggibili e che lo scanner di immagini trasferisca chiaramente ogni riga dell'immagine nel documento.

Alcune applicazioni hanno un design in lingua russa, che può essere un altro fattore significativo nella scelta del miglior programma di scansione. Diamo quindi un'altra rapida occhiata ai programmi seguenti che possono riconoscere correttamente il testo e scansionare un documento in un file:

Il programma per computer ABBYY FineReader 10 Home è uno degli strumenti più comuni per la scansione di documenti. Può trovare blocchi in modo rapido ed efficiente e tradurre il testo scritto lingue differenti. Il vantaggio di ABBYY FineReader è la presenza di un'impressionante base linguistica. Non dimenticare la disponibilità di una versione Professional con funzionalità avanzate.

OCR CuneiForm si distingue tra i suoi concorrenti con buone prestazioni di cattura del testo fotografato. È interessante notare che è possibile scattare una fotografia anche con una fotocamera da 2 MP piuttosto obsoleta dispositivo mobile. Il programma vanta una funzione di controllo del dizionario, che garantisce alto grado qualità delle informazioni del materiale finito.

Scanitto Pro farà un ottimo lavoro con un lavoro più specifico. L'applicazione riconoscerà il testo molto rapidamente e sarà in grado di salvarlo nel formato documento richiesto. È interessante notare che il programma può trovare una determinata area della carta e migliorare l'aspetto del materiale prima di salvarlo sul supporto di memorizzazione. C'è una funzione per la scansione con un clic di un tasto.

VueScan dispone di un ampio database di dispositivi scanner comparabili. Tra gli analoghi, il programma dimostra di più alte prestazioni velocità di connessione allo scanner. Tra le opzioni aggiuntive piacevoli, vale la pena notare la comodità impostazioni manuali resa cromatica.

Quando scegli programmi gratuiti per la scansione di documenti, dovresti prestare attenzione a PaperScan Free. L'utilità è abbastanza semplice in termini di funzionalità, d'altra parte, esegue tutte le opzioni di scansione necessarie, inoltre sarai soddisfatto dell'esclusiva tecnologia di compressione, che può ridurre significativamente le dimensioni del file, lasciando la qualità di visualizzazione originale. Se ti piace la versione gratuita, puoi sempre acquistare la modifica Professional estesa con funzionalità più impressionanti.

RiDoc – ne basta un altro strumento potente per la scansione. Vale la pena notare che Ridoc include uno strumento specializzato per ridurre le dimensioni dei file senza degradare notevolmente l'aspetto del display. Le informazioni rimangono leggibili. Se necessario, lo scanner per documenti RiDoc ti aiuterà a esportare i formati dei documenti in estensioni grafiche. Il programma può installare filigrane sul materiale finito e inviare il documento tramite posta.

Il software OCR ti consente di convertire i documenti fotografati o scansionati direttamente in frasi.

Il fatto è che il testo nell'immagine è presentato sotto forma di raster, un insieme di punti. Il software menzionato converte una serie di punti in testo completo, disponibile per la modifica e il salvataggio.

Il riconoscimento delle lettere è progettato per ottimizzare il processo di digitalizzazione di libri e documenti stampati o scritti a mano.

Questo metodo di digitalizzazione è ordini di grandezza più veloce della velocità della digitazione manuale da un'immagine. Ampiamente utilizzato nella digitalizzazione di biblioteche e archivi. Successivamente, considereremo i cinque migliori rappresentanti della famiglia di programmi simili.

ABBYY FineReader 10

FineReader è il leader indiscusso tra tutti i programmi che riconoscono il testo nelle immagini. In particolare, non esiste un software che elabori l'alfabeto cirillico in modo più chiaro. In generale, FineReader ha 179 lingue, il cui testo viene riconosciuto con grande successo.

L'unica cosa che potrebbe deludere gli utenti è che il programma è a pagamento. Distribuito solo gratuitamente versione di prova per 15 giorni. Durante questo periodo è consentita la scansione di 50 pagine.

Dovrai quindi pagare per utilizzare il programma. FineReader “mangia” facilmente più o meno immagine di alta qualità. La fonte è del tutto irrilevante. Che si tratti di una fotografia, di una scansione di una pagina o di qualsiasi immagine con lettere.

Vantaggi:

  • riconoscimento accurato;
  • un numero enorme di lingue di lettura;
  • tolleranza alla qualità dell'immagine sorgente.

Difetto:

  • versione di prova per 15 giorni.

OCR CuneiForm

Programma gratuito per leggere informazioni di testo dalle immagini. L'accuratezza del riconoscimento è un ordine di grandezza inferiore a quella del precedente programma in esame. Ma per essere un'utilità gratuita, la funzionalità è comunque eccellente.

Interessante! CuneiForm riconosce blocchi di testo, immagini grafiche e anche vari tavoli. Inoltre è possibile leggere anche le tabelle non allineate.

Per garantire la precisione, al processo di riconoscimento sono collegati dizionari speciali, che si riempiono lessico dai documenti scansionati.

Vantaggi:

  • distribuzione gratuita;
  • utilizzare dizionari per verificare la correttezza del testo;
  • scansione di testo da fotocopie di scarsa qualità.

Screpolatura:

  • precisione relativamente bassa;
  • numero limitato di lingue supportate.

WinScan2PDF

Questo non è nemmeno un programma a tutti gli effetti, ma un'utilità. Non è richiesta alcuna installazione e il file eseguibile pesa solo pochi kilobyte. Il processo di riconoscimento è estremamente veloce, nonostante i documenti risultanti vengano salvati esclusivamente in formato PDF.

In effetti, l'intero processo viene eseguito premendo tre pulsanti: selezione della sorgente, destinazione e, appunto, avvio del programma.

L'utilità è progettata per l'elaborazione batch rapida di molti file. Per comodità degli utenti, viene fornito un ampio pacchetto di lingue per l'interfaccia.

Vantaggi:

Screpolatura:

OCR semplice

Un eccellente piccolo programma per riconoscere i testi dalle immagini. Supporta anche la lettura di manoscritti. Il problema è che il russo non è incluso nel pacchetto linguistico dell'interfaccia o nell'elenco delle lingue supportate per il riconoscimento.

Tuttavia, se hai bisogno di scansionare inglese, danese o francese, non troverai un'opzione gratuita migliore.

Nel suo ambito, il programma fornisce un'accurata decodifica dei caratteri, la rimozione del rumore e l'estrazione di immagini grafiche. Inoltre, l'interfaccia del programma dispone di un editor di testo integrato, quasi identico a WordPad, che aumenta notevolmente l'usabilità del programma.

Vantaggi:

  • riconoscimento accurato del testo;
  • comodo editor di testo;
  • rimuovere il rumore da un'immagine.

Screpolatura:

  • completa assenza della lingua russa.

Freemore OCR

Il programma ti consente di estrarre rapidamente testo e grafica dalle immagini. Il software supporta il lavoro con più scanner senza perdita di prestazioni. Il testo estratto può essere salvato in un documento di testo o in un formato documento MS Office.

Inoltre, viene fornita una funzione di riconoscimento di più pagine.

Freemore OCR è distribuito gratuitamente, tuttavia l'interfaccia è solo in inglese. Ma questa circostanza non pregiudica in alcun modo la facilità d'uso, perché i controlli sono organizzati in modo intuitivo.

Vantaggi:

  • distribuzione gratuita;
  • capacità di lavorare con più scanner;
  • la precisione del riconoscimento è discreta.

Screpolatura

  • Mancanza della lingua russa nell'interfaccia;
  • La necessità di scaricare il pacchetto in lingua russa per il riconoscimento.

Probabilmente tutti hanno familiarità con la situazione in cui la scansione di un documento, ad esempio una pagina di un libro, deve essere convertita in testo stampato. Per questo ci sono programmi speciali, ma la maggior parte di essi sono conosciuti da pochissime persone. Probabilmente tutti conoscono solo ABBYY FineReader. In effetti, FineReader è fuori concorrenza. Questo è il miglior programma per la scansione e il riconoscimento del testo in russo, ma è disponibile esclusivamente nelle versioni a pagamento ed è molto costoso. Quante persone sono disposte a pagare quasi 7.000 rubli per la licenza più economica se intendono elaborare uno o due libri all'anno?

Se ritieni ingiustificato l'acquisto di un prodotto commerciale costoso, perché non utilizzare analoghi, alcuni dei quali gratuiti? Sì, non sono così ricchi di funzioni, ma affrontano con successo molte attività che molti credono che solo FineReader possa gestire. Andiamo quindi a conoscerne alcuni alternative disponibili. E allo stesso tempo vediamo come differiscono dallo standard generalmente accettato.

Per confrontare altri programmi con ABBYY FineReader, scopriamo perché è così buono. Ecco un elenco delle sue principali funzioni:

  • Lavorare con fotografie, scansioni e documenti cartacei.
  • Modifica del contenuto dei file pdf: testo, singoli blocchi, elementi interattivi, ecc.
  • Converti pdf in formato Microsoft Word e viceversa. Crea file PDF da qualsiasi documento di testo.
  • Confronto del contenuto del documento in 35 lingue, ad esempio cartaceo scansionato ed elettronico (non in tutte le edizioni).
  • Riconoscimento e conversione di testi scansionati, tabelle, formule matematiche.
  • Esecuzione automatica delle operazioni di routine (non in tutte le edizioni).
  • Supporta 192 alfabeti nazionali.
  • Controllo ortografico del testo riconosciuto in russo, ucraino e in altre 46 lingue.
  • Supporta 10 formati di file di input grafici e 10 di testo, escluso PDF.
  • Salvataggio di file in grafica e formati di testo, e anche nella forma e-book EPUB e FB2.
  • Lettura dei codici a barre.
  • Interfaccia in 20 lingue, tra cui russo e ucraino.
  • Supporta la maggior parte dei modelli di scanner esistenti.

Le capacità del programma sono eccellenti, ma per gli utenti domestici che non elaborano documenti su scala industriale risultano ridondanti. Tuttavia, per coloro che necessitano di riconoscere solo poche pagine, ABBYY fornisce servizi gratuitamente tramite il servizio web FineReaderOnline. Dopo la registrazione, puoi elaborare 10 pagine di testo scansionato o fotografato, quindi 5 pagine al mese. Di più - a un costo aggiuntivo.

Il costo della licenza FineReader più economica per l'installazione su un computer è di 6.990 rubli (versione Standard).

Una piccola ed estremamente semplice utility gratuita, ovviamente, non è in grado di competere con il mostro, ma risolve il compito principale - riconoscere il testo scansionato - come previsto. Inoltre, per questo non necessita nemmeno dell'installazione su PC (portatile). Ed è controllato da soli tre pulsanti.

Per riconoscere il testo utilizzando WinScan2PDF, fare clic su "Seleziona sorgente" e specificare lo scanner collegato (il programma, sfortunatamente, non funziona con file già pronti). Posiziona il documento nello scanner e fai clic su Scansione. Se desideri annullare l'operazione, fai clic su Annulla. Queste sono tutte le istruzioni.

L'utilità supporta 23 lingue, incluso il russo, e funziona con file multipagina. Il risultato finale viene salvato in formato pdf, scansione di documenti - jpg.

Servizio Web Free-OCR.com

Free-OCR.com (OCR - Riconoscimento ottico dei caratteri) è un servizio Internet gratuito per il riconoscimento di testi scansionati o fotografati salvati in formato immagine grafica (jpg, gif, tiff, bmp) o pdf. Supporta 29 lingue, tra cui russo e ucraino, e l'utente può selezionarne non una, ma diverse, se il testo sorgente le contiene.

Free-OCR non richiede registrazione e non presenta restrizioni sul numero di documenti caricati. Solo la dimensione del file è limitata: fino a 6 Mb. Il servizio non elabora più precisamente i documenti multipagina, ignora tutto tranne il primo foglio;

La velocità di riconoscimento del testo scansionato è piuttosto elevata. Un foglio A4 con un frammento di un libro in russo è stato elaborato in circa 5 secondi, ma la qualità non era soddisfacente. Riconosce i caratteri grandi - come nei libri per bambini - al 100%, e i caratteri medi e piccoli - circa l'80%. Con i documenti in lingua inglese le cose vanno un po' meglio: i caratteri piccoli e a basso contrasto sono stati riconosciuti correttamente in circa il 95%.

Servizio web OCR online gratuito

- un altro servizio web gratuito, molto simile al precedente, ma con funzionalità ampliate. Lui:

  • Supporta 106 lingue.
  • Elabora documenti multipagina, compresi quelli in più lingue.
  • Riconosce testi su scansioni e documenti fotografici di molti tipi. Oltre a 10 formati di immagini grafiche, elabora documentipdf, djvu, doxc, odt, archivi zip e file compressi Unix.
  • Salva i file di output in uno dei 3 formati: txt, doc e pdf.
  • Supporta il riconoscimento equazioni matematiche.
  • Permette di ruotare l'immagine di 90-180° in entrambe le direzioni.
  • Riconosce correttamente il testo in più colonne su una pagina.
  • Può riconoscere un frammento selezionato.
  • Dopo l'elaborazione, offre la possibilità di copiare il file negli appunti, scaricarlo sul tuo computer, caricarlo su Google Docs o pubblicarlo su Internet. Puoi anche tradurre immediatamente il testo in un'altra lingua utilizzando Google Translate o Bing Translator.

Dobbiamo dare credito all'OCR online gratuito per il fatto che legge abbastanza bene le immagini a bassa risoluzione e a basso contrasto. Il risultato del riconoscimento di tutti i testi in lingua russa che gli sono stati forniti è stato del 100% o vicino ad esso.

L'OCR online gratuito è, a nostro avviso, una delle migliori alternative a FineReader, ma elabora solo 20 pagine gratuitamente (anche se non dice per quale periodo). L'ulteriore utilizzo del servizio costa da $ 0,5 per pagina.

Microsoft OneNote

Il programma per prendere appunti Microsoft OneNote, esclusa la vecchissima e ultima versione 17, contiene anche la funzionalità OCR. Non è così avanzato come in applicazioni specializzate, ma utilizzabile anche se non ci sono altre opzioni.

Per riconoscere il testo da un'immagine utilizzando OneNote, inserire l'immagine nel file (“Immagine” - “Inserisci”), fare clic con il tasto destro su di essa e selezionare “Copia testo dall'immagine”.

Successivamente, incolla il testo copiato in un punto qualsiasi della nota.

Per impostazione predefinita, la lingua di riconoscimento è impostata sull'inglese. Se hai bisogno del russo o di qualsiasi altro, modifica l'impostazione manualmente.

La qualità del riconoscimento del testo russo in Microsoft OneNote lascia molto a desiderare, quindi non può essere definito un sostituto completo di FineReader. E l'elaborazione di documenti di più pagine di grandi dimensioni al suo interno è molto scomoda.

OCR semplice

Vecchio programma gratuito SimpleOCR è anche uno strumento molto valido per riconoscere testi da immagini e scansioni elettroniche, ma sfortunatamente senza supporto per la lingua russa. Ma ha una funzione unica per leggere le parole scritte a mano, oltre a un editor che ti consente di correggere gli errori prima di salvare il risultato finale.

Altre caratteristiche di SimpleOCR:

  • Controllo ortografico con possibilità di aggiornare manualmente il dizionario.
  • Lettura di documenti a bassa risoluzione e con segni (c'è un'opzione per eliminare il "rumore").
  • La selezione più fedele possibile dei caratteri e il trasferimento degli stili di scrittura (grassetto, corsivo). Se lo si desidera, la funzione può essere disabilitata.
  • Elaborazione simultanea di più fogli o di un frammento separato.
  • Selezione possibili errori nel testo finito per la modifica manuale.
  • Supporta molte modifiche degli scanner.
  • Formati di input di documenti elettronici: tif, jpg, bmp, ink e scansioni.
  • Salvataggio del testo finito nei formati txt e doc.

La qualità di riconoscimento sia dei testi stampati che dei manoscritti è piuttosto elevata.

Il programma potrebbe essere definito universale se non fosse per il supporto linguistico limitato. Ultima versione Supporta solo inglese, francese e danese, probabilmente non è prevista l'aggiunta di altri. L'interfaccia è interamente in inglese, ma è di facile comprensione. Inoltre, nella finestra principale è presente un pulsante "Demo", che avvia un video di formazione su come lavorare con SimpleOCR.

Il programma della società di sviluppo belga I.R.I.S è davvero un vero concorrente del russo ABBYY FineReader. Potente, veloce, multipiattaforma, basato sul motore OCR proprietario utilizzato da Adobe, HP e Canon, riconosce perfettamente anche i testi più difficili da leggere. Supporta 137 lingue, tra cui russo e ucraino.

Caratteristiche e funzioni di Readiris:

  • Più ad alta velocità elaborazione di file tra le applicazioni di questa classe, progettate per grandi volumi.
  • Preservare la formattazione del testo sorgente (caratteri, dimensione, stile di scrittura).
  • Elaborazione di file singoli e batch, supporto per documenti multipagina.
  • Riconoscimento di equazioni matematiche, caratteri speciali e codici a barre.
  • Cancellazione del testo dal "rumore": linee, macchie, ecc.
  • Integrazione con vari servizi cloud: Google Docs, Evernote, Dropbox, SharePoint e alcuni altri.
  • Supporto per tutti modelli moderni scanner.
  • Formati dei dati di input: pdf, djvu, jpg, png e altri, in cui vengono salvate le immagini grafiche, nonché quelle ricevute direttamente dallo scanner.
  • Formati di output: doc, docx, xls, xlsx, txt, rtf, html, csv, pdf. È supportata la conversione in djvu.

L'interfaccia del programma è in lingua russa, l'uso è intuitivo. Non offre agli utenti la possibilità di modificare il contenuto dei file PDF, come FineReader, ma, a nostro avviso, affronta il compito principale: il riconoscimento del testo.

Readiris è disponibile in due versioni a pagamento. Il costo della licenza Pro è di 99,00€, Corporate - 199€. Quasi come ABBYY.

Freemore OCR

Freemore OCR - (! sito web del programma http://freemoresoft.com/freeocr/index.php potrebbe essere bloccato dagli antivirus a causa della "spazzatura" pubblicitaria incorporata nel programma di installazione) - un'altra utility semplice, compatta e gratuita che riconosce bene anche i testi, ma per impostazione predefinita solo in inglese. Altri pacchetti linguistici devono essere scaricati e installati separatamente.

Altre caratteristiche e capacità di Freemore OCR:

  • Lavoro simultaneo con diversi scanner.
  • Supporta molti formati di dati grafici, inclusi quelli proprietari come psd (file Adobe Photoshop). Sono supportati tutti i formati grafici standard.
  • Supporto PDF.
  • Per salvare il risultato finale in formato pdf, txt o docx e per esportare il testo in Word, basta fare clic su un pulsante sulla barra degli strumenti.
  • Editor integrato (purtroppo il programma non salva la formattazione del documento sorgente).
  • Visualizza le proprietà del documento.
  • Stampa il testo riconosciuto direttamente dalla finestra principale.
  • Protezione con password dei file pdf.

A prima vista l'interfaccia del programma può sembrare complicata, ma in realtà è molto facile da usare. Gli strumenti sono divisi in gruppi, simili alla barra multifunzione di Microsoft Office. Se li guardi più da vicino, lo scopo di questo o quel pulsante diventerà rapidamente chiaro.

Per caricare un documento elettronico nella finestra OCR di Freemore, seleziona prima il suo tipo: immagine o file PDF, quindi premere il pulsante "Carica" ​​corrispondente. Per avviare il processo di riconoscimento, fare clic sul pulsante "OCR" nel gruppo di strumenti con lo stesso nome accanto all'immagine della bacchetta magica (mostrata nello screenshot).

Il risultato della scansione di testi inglesi sia da immagini ben leggibili che da immagini difficili da leggere si è rivelato abbastanza soddisfacente. L'unica cosa che non mi è piaciuta è che insieme al programma sul computer sono installati tutti i tipi di spazzatura: alcuni falsi scanner antivirus, ottimizzatori e altre cose non necessarie e senza la possibilità di rifiutarli durante l'installazione. In una parola, se non fosse per questo inconveniente, l'applicazione potrebbe essere consigliata come una buona alternativa gratuita a FineReader.