Este artigo será ademais do anterior (e máis detalladamente revelará a esencia do recoñecemento de texto directo.
Empecemos pola esencia, que moitos usuarios non comprenden completamente.
Despois de explorar un libro, un xornal, unha revista, etc., obtén un conxunto de imaxes (é dicir, ficheiros gráficos, non ficheiros de texto) que precisan ser recoñecidos nun programa especial (un dos mellores para iso é ABBYY FineReader). Recoñecemento: este é o proceso de obtención de texto a partir de gráficos e é este proceso que escribiremos con máis detalle.
No meu exemplo, farei unha captura de pantalla deste sitio e intentarei obter o texto.
1) Abrir un ficheiro
Abra as imaxes que pretendemos recoñecer.
Por certo, aquí hai que ter en conta que pode abrir non só formatos de imaxe, senón tamén, por exemplo, ficheiros DJVU e PDF. Isto permitirache recoñecer rapidamente o libro enteiro, que, por rede, normalmente distribúese nestes formatos.
2) Edición
De acordo inmediatamente co recoñecemento automático non ten moito sentido. Se, por suposto, tes un libro no que só o texto, as imaxes e as tabletas, ademais de escanear en excelente calidade, entón podes. Noutros casos, é mellor configurar todas as áreas manualmente.
Normalmente, primeiro ten que eliminar áreas innecesarias da páxina. Para facelo, fai clic no botón de edición do panel.
Entón tes que deixar só a área coa que queres traballar máis tempo. Para iso hai unha ferramenta para recortar fronteiras innecesarias. Seleccione o modo na columna dereita. cortar.
A continuación, seleccione a área que quere saír. Na seguinte imaxe resáltase en vermello.
Por certo, se tes varias fotos abertas, podes aplicar o recorte a todas as imaxes á vez! Conveniente para non cortar cada un por separado. Ten en conta que na parte inferior deste panel hai outra gran ferramenta:goma de borrar. Coa axuda diso, pode borrar os divorcios innecesarios, números de páxinas, motas, caracteres especiais innecesarios e seccións individuais da imaxe.
Despois de premer para cortar os bordos, a súa imaxe orixinal debería cambiar: só permanecerá o espazo de traballo.
Entón podes saír do editor de imaxes.
3) Selección de áreas
No panel, por riba da imaxe aberta, hai pequenos rectángulos que definen a área de dixitalización. Hai varios deles, imos considerar brevemente os máis comúns.
Imaxe: o programa non recoñecerá esta área, simplemente copiará o rectángulo especificado e pégao no documento recoñecido.
O texto é a área principal na que se enfocará o programa e tentará obter texto da imaxe. Destacaremos esta área no noso exemplo.
Despois da selección, a zona está pintada cunha cor verde claro. Entón podes seguir o seguinte paso.
4) recoñecemento de texto
Despois de definir todas as áreas, faga clic no comando de menú para recoñecer. Afortunadamente, neste paso non é necesario nada máis.
O tempo de recoñecemento depende do número de páxinas do documento e da potencia do ordenador.
En media, unha páxina completa escaneada de boa calidade leva 10-20 segundos. en potencia media de PC (segundo os estándares actuais).
5) Comprobación de erros
Sexa cal sexa a calidade orixinal das imaxes, normalmente sempre hai erros despois do recoñecemento. De todos os xeitos, ata agora ningún programa pode eliminar completamente o traballo dunha persoa.
Prema na opción de compra e ABBYY FineReader comezará a enviarlle, á súa vez, os lugares do documento onde tropezou. A túa tarefa, comparando a imaxe orixinal (por certo, mostrarache este lugar nunha versión ampliada) coa variante de recoñecemento - para responder afirmativamente, ou corrixir e aprobar. Entón o programa irá ao seguinte lugar difícil e así sucesivamente ata que se comproba todo o documento.
En xeral, este proceso pode ser longo e aburrido ...
6) Conservación
ABBYY FineReader ofrece varias opcións para gardar o traballo. O máis utilizado é unha "copia exacta". É dicir o documento completo, o texto nel, será formatado do mesmo xeito que na fonte. Unha opción conveniente é transferilo a Word. Entón fixemos neste exemplo.
Despois verá o seu texto recoñecido nun documento de Word familiar. Creo que non ten sentido describir máis que facer con el ...
Así, analizamos cun exemplo concreto como traducir unha imaxe a texto sen formato. Este proceso non sempre é sinxelo e rápido.
En calquera caso, todo dependerá da calidade de imaxe orixinal, da súa experiencia e da velocidade do ordenador.
¡Teña un bo traballo!