Software de recoñecemento de texto

Polo xeral, cando se trata de programas de recoñecemento de texto dixitalizado (OCR, recoñecemento óptico de caracteres), a maioría dos usuarios recordan o único produto - ABBYY FineReader, que é sen dúbida o líder entre estes programas en Rusia e un dos líderes do mundo.

Non obstante, FineReader non é a única solución deste tipo: hai programas gratuítos para o recoñecemento de texto, servizos en liña para os mesmos fins e, ademais, estas funcións tamén están presentes nalgúns programas familiares que xa se poden instalar no seu computador. . Intentarei escribir sobre todo isto neste artigo. Todos os programas considerados funcionan en Windows 7, 8 e XP.

Líder de recoñecemento de texto - Finanzador ABBYY

Sobre FineReader (pronunciado como Fine Reader) escoitouse, probablemente, a maioría de vostedes. Este programa é o mellor ou o mellor para o recoñecemento de texto de alta calidade en ruso. O programa paga e o prezo dunha licenza para uso doméstico é algo menos de 2000 rublos. Tamén é posible descargar a versión de proba de FineReader ou utilizar o recoñecemento de texto en liña en ABBYY Fine Reader Online (pode recoñecer varias páxinas de forma gratuíta e, a continuación, por unha taxa). Todo isto está dispoñible no sitio web oficial do desarrollador //www.abbyy.ru.

Instalar a versión de proba de FineReader non causou ningún problema. O software pode integrarse con Microsoft Office e Windows Explorer para facilitar a execución do recoñecemento. Das limitacións da versión de proba gratuíta: 15 días de uso e capacidade para recoñecer non máis de 50 páxinas.

Captura de pantalla para probar o software de recoñecemento

Como non teño un escáner, usei unha instantánea dunha cámara de baixa calidade do teléfono, na que editei un pouco o contraste para comprobar. A calidade non é boa, vexamos quen pode manexalo.

Menú FineReader

FineReader pode obter unha imaxe gráfica do texto directamente desde o escáner, desde ficheiros gráficos ou da cámara. No meu caso, foi suficiente para abrir o ficheiro de imaxe. Estaba satisfeito co resultado: só un par de erros. Direi de inmediato que este é o mellor resultado de todos os programas probados cando se traballa con esta mostra: unha calidade de recoñecemento semellante foi só no servizo gratuíto en liña Free Online OCR (pero nesta revisión estamos falando só de software, non de recoñecemento en liña).

O resultado do recoñecemento de texto en FineReader

Francamente, FineReader probablemente non ten competidores para textos cirílicos. As vantaxes do programa non son só a calidade do recoñecemento de texto, senón tamén a ampla funcionalidade, soporte de formato, exportación competente a moitos formatos, incluíndo Word Docx, pdf e outras funcións. Así, se a tarefa OCR é algo que atopas constantemente, non se arrepinte dunha cantidade de diñeiro relativamente pequena e pagará a pena: aforrarás unha cantidade enorme de tempo, conseguindo rapidamente resultados de calidade en FineReader. Por certo, non fago propaganda de nada, realmente creo que os que necesitan recoñecer máis dunha ducia de páxinas deberían pensar en comprar tal software.

CuneiForm é un programa de recoñecemento de texto gratuíto.

Na miña opinión, o segundo programa máis popular de OCR en Rusia é o gratuíto CuneiForm, que se pode descargar desde o sitio oficial //cognitiveforms.ru/products/cuneiform/.

A instalación do programa tamén é moi sinxela, non intenta instalar ningún software de terceiros (tanto software libre). A interface é clara e concisa. Nalgúns casos, o xeito máis doado de usar o asistente, que é o primeiro das iconas do menú.

Coa mostra que empregei en FineReader, o programa non se enfrontou ou, máis precisamente, deu algo mal legible e fragmentos de palabras. O segundo intento fíxose cunha captura de pantalla do texto do sitio web deste programa, que, con todo, tivo que incrementarse (necesita escanear cunha resolución de 200 dpi e superior, non lee capturas de pantalla con anchos de liña de fonte de 1-2 píxeles). Aquí fíxoo ben (parte do texto non foi recoñecido, xa que só se elixiu o ruso).

Recoñecemento de texto CuneiForm

Así, podemos supoñer que CuneiForm é algo que debes probar, especialmente se tes páxinas escaneadas de alta calidade e queres recoñecelas gratuitamente.

Microsoft OneNote: un programa que xa pode ter

No Microsoft Office, comezando pola versión 2007 e rematando co actual 2013, hai un programa para tomar notas - OneNote. Tamén ten funcións de recoñecemento de texto. Para utilizalo, simplemente pegue a nota escaneada ou calquera outra imaxe de texto, prema nel e use o menú de contexto. Observo que o estándar para o recoñecemento está definido en inglés.

Recoñecemento en Microsoft OneNote

Non podo dicir que o texto sexa recoñecido perfectamente, pero, polo que podo dicir, é algo mellor aínda que en CuneiForm. Ademais o programa, como xa se mencionou, é que con considerable probabilidade xa está instalado no seu computador. Aínda que, por suposto, o seu uso en caso de necesidade de traballar cun gran número de documentos dixitalizados é pouco probable que sexa cómodo, é axeitado para o recoñecemento rápido de tarxetas de visita.

OmniPage Ultimate, OmniPage 18 - debe ser algo moi legal

Non sei o bo que ten o software de recoñecemento de texto de OmniPage: non hai versións de proba, non quero descargalo nalgún lugar. Pero, se o seu prezo está xustificado e custará uns 5.000 rublos na versión para uso individual e non Ultimate, entón isto debería ser algo impresionante. Páxina do programa: //www.nuance.com/for-individuals/by-product/omnipage/index.htm

Prezo do software OmniPage

Se leas as características e comentarios, incluídas as publicacións en lingua rusa, observan que OmniPage realmente proporciona un recoñecemento preciso e de alta calidade, incluído en ruso, é relativamente fácil desmontar as pescudas de alta calidade e ofrece un conxunto de ferramentas adicionais. Entre os inconvenientes, non é o máis cómodo, especialmente para un usuario novato, a interface. En calquera caso, no mercado occidental OmniPage é un competidor directo de FineReader e en avaliacións en lingua inglesa están a loitar precisamente entre si e, polo tanto, creo que o programa debería ser digno.

Non se trata de todos os programas deste tipo, tamén hai varias opcións para pequenos programas gratuítos, pero ao experimentar con eles atopei dous principais inconvenientes inherentes a eles: falta de soporte cirílico ou software diferente e non moi útil no kit de instalación e por iso decidín non mencionar aquí