Servizos de recoñecemento de texto en liña

¡Saúdos a todos os lectores do blogue!

Creo que aqueles que traballan a miúdo na computadora (non xoga, pero funciona), tiveron que lidar co recoñecemento de texto. Ben, por exemplo, dixitalizaches un fragmento do libro e agora tes que pegar esta parte no teu documento. Pero o documento dixitalizado é unha imaxe, e necesitamos texto; para iso necesitamos programas especiais e servizos en liña para recoñecer texto das imaxes.

Sobre programas para o recoñecemento, xa escribín en posts anteriores:

- Escanear texto e recoñecemento en FineReader (programa de pago);

- Traballar en FineReader analóxico - CuneiForm (programa gratuíto).

No mesmo artigo gustaríame centrarme en servizos en liña para o recoñecemento de texto. Despois de todo, se precisa obter rapidamente o texto con 1-2 imaxes, non ten sentido incomodarse coa instalación de varios programas ...

¡É importante! A calidade do recoñecemento (o número de erros, a lexibilidade, etc.) depende moito da calidade de imaxe orixinal. Polo tanto, ao escanear (fotografar, etc.), seleccione a calidade máis alta posible. Na maioría dos casos, a calidade de 300-400 dpi será suficiente (o dpi é o parámetro que caracteriza a calidade da imaxe. Na configuración de case todos os escáneres, normalmente indícase este parámetro).

Servizos en liña

Para mostrar o traballo dos servizos, fixen unha captura de pantalla dun dos meus artigos. Esta captura de pantalla cargarase en todos os servizos, cuxa descrición se presenta a continuación.

1) //www.ocrconvert.com/

Gústame moito este servizo pola súa sinxeleza. Aínda que o sitio é inglés, tamén funciona ben coa lingua rusa. Non necesita rexistrarse. Para iniciar o recoñecemento, cómpre facer 3 pasos:

- Carga a túa imaxe;

- Selecciona o idioma do texto, que está na imaxe;

- preme o botón de recoñecemento de inicio.

Soporte de formato: PDF, GIF, BMP, JPEG.

O resultado móstrase a continuación na foto. Debo dicir que o texto está ben recoñecido. Ademais, moi rapidamente, eu esperaba literalmente 5-10 segundos.

2) //www.i2ocr.com/

Este servizo funciona de xeito similar ao anterior. Aquí tamén ten que descargar o ficheiro, seleccionar a lingua de recoñecemento e premer no botón de extraer texto. O servizo funciona moi rápido: 5-6 segundos. unha páxina.

Formatos soportados: TIF, JPEG, PNG, BMP, GIF, PBM, PGM, PPM.

O resultado deste servizo en liña é moito máis cómodo: verás de inmediato dúas ventás - no primeiro o resultado do recoñecemento, no segundo - a imaxe orixinal. Polo tanto, é moi doado facer edicións no curso da edición. Rexistrarse no servizo, por certo, tampouco é necesario.

3) //www.newocr.com/

Este servizo é único de varias maneiras. En primeiro lugar, soporta o formato "novo" DJVU (por certo, a lista completa de formatos: JPEG, PNG, GIF, BMP, TIFF, PDF, DjVu). En segundo lugar, soporta a selección de áreas de texto na imaxe. Isto é moi útil cando tes na foto non só áreas de texto, senón tamén gráficas que non necesitas recoñecer.

A calidade de recoñecemento é superior á media, non hai necesidade de rexistrarse.

4) //www.free-ocr.com/

Un servizo moi sinxelo para o recoñecemento: cargar unha imaxe, especificar o idioma, introducir captcha (por certo, o único servizo deste artigo onde ten que facelo) e premer o botón para traducir a imaxe en texto. En realidade todo!

Formatos soportados: PDF, JPG, GIF, TIFF, BMP.

O resultado do recoñecemento é medio. Hai erros, pero non moitos. Non obstante, se a calidade da captura de pantalla orixinal sería maior, habería unha orde de magnitude menos erros.

PS

Isto é todo para hoxe. Se coñeces máis servizos interesantes para o recoñecemento de texto - comparte os comentarios, agradecerémosvos. Unha condición: é desexable que non sexa necesario rexistrarse e que o servizo sexa gratuíto.

Saúdos!