Programi prepoznavanja teksta

Programi prepoznavanja teksta

U pravilu, ako su u pitanju programi za prepoznavanje skeniranog teksta (OCR, optičko prepoznavanje simbola), većina se korisnika sjeća jedinog proizvoda - Abbyy FineReader, koji je, nesumnjivo, lider među takvim softverom u Rusiji i jedan od vođa u svijet.

Unatoč tome, fineReader nije jedino takvo rješenje: postoje besplatni programi za prepoznavanje teksta, internetske usluge u iste svrhe i, osim toga, takve su funkcije također prisutne u nekim programima koje znate, a koji su možda već instalirani na vašem računalu. Pokušat ću pisati o svemu tome u ovom članku. Svi programi koji se smatraju radom u sustavu Windows 7, 8 i XP.

Voditelj prepoznavanja teksta - Abbyy FineReader Program

O fineReaderu (izgovara se kao čitatelj vatre), vjerojatno je većina vas čula. Ovaj je program najbolji ili jedan od najboljih za prepoznavanje teksta visoke kvalitete na ruskom. Program je plaćen, a cijena licence za kućnu upotrebu nešto je manja od 2000 rubalja. Također je moguće preuzeti probnu verziju kaznitelja ili koristiti internetsko prepoznavanje teksta u Abbyy Fine Reader Online (možete besplatno prepoznati nekoliko stranica, a zatim - uz naknadu). Sve je to dostupno na službenoj web stranici programera http: // www.Abbyy.ru.

Instalacija probne verzije fineReader -a nije uzrokovala nikakve probleme. PO može se integrirati s Microsoft Office i Windows vodič kako bi bio prikladniji za pokretanje prepoznavanja. Ograničenja na besplatnoj probnoj verziji - 15 dana korištenja i mogućnosti prepoznavanja ne više od 50 stranica.

Schold za testiranje programa prepoznavanja

Budući da nemam skener, sliku sam koristio s fotoaparata s lošom kvalitetom za provjeru, u kojoj sam imao malo uređenog kontrasta. Kvaliteta nije dobra, da vidimo tko se može nositi.

Izbornik programa FineReader

FineReader može dobiti grafičku sliku teksta izravno iz skenera, iz grafičkih datoteka ili kamere. U mom slučaju bilo je dovoljno otvoriti slikovnu datoteku. Rezultat je zadovoljan - samo nekoliko pogrešaka. Moram odmah reći da je ovo najbolji rezultat svih dokazanih programa pri radu s ovim uzorkom - slična kvaliteta prepoznavanja bila je samo na besplatnoj internetskoj usluzi besplatno online OCR (ali u ovom pregledu govorimo samo o softveru, a ne internetsko prepoznavanje).

Rezultat prepoznavanja teksta u fineReaderu

Iskreno, za ćirilne tekstove, fineReader, vjerojatno, nemaju konkurente. Prednosti programa nisu samo kvaliteta prepoznavanja teksta, već i široka funkcionalnost, podrška za oblikovanje, kompetentni izvoz u mnoge formate, uključujući Word DOCX, PDF i druge mogućnosti. Dakle, ako su zadaci OCR -a ono s čim se stalno susrećete, ne žalite zbog relativno malim količinama novca i to će se u potpunosti isplatiti: uštedjet ćete ogromnu količinu vremena, brzo dobivajući kvalitativni rezultat u FINEREREDERA. Usput, ne reklamiram ništa - stvarno mislim da bi oni koji trebaju prepoznati više od desetak stranica trebali razmišljati o kupnji takvih.

CUNEEFORM - Program za prepoznavanje besplatnog teksta

U mojoj procjeni, drugi najpopularniji OCR program u Rusiji je besplatni Cuneear, koji se može preuzeti sa službene web stranice http: // cognitiveforms.ru/proizvodi/cuneeform/.

Instalacija programa je također vrlo jednostavna, ne pokušava instalirati niti jedan treći softver (poput puno besplatnog softvera). Sučelje je sažeto i razumljivo. U nekim je slučajevima najlakši način korištenja majstora, za koje je namijenjena prva od ikona u izborniku.

S uzorkom koji sam koristio u fineReaderu, program se nije mogao nositi ili, točnije, izdao nešto loše pročitano i ostatke riječi. Drugi je pokušaj napravljen s snimkom zaslona teksta s mjesta samog ovog programa, koji je, međutim, morao povećati (treba skeniranje s rezolucijom od 200 dpi i više, ona ne čita snimke zaslona s debljinom 1 -2 linije fontova piksela). Ovdje se dobro snašla (dio teksta nije prepoznat, jer je odabran samo ruski jezik).

Prepoznavanje teksta u Cuneeform

Stoga se može pretpostaviti da je Cuneeform ono što biste trebali isprobati, pogotovo ako ste kvalitativno skenirane stranice i želite ih prepoznati besplatno.

Microsoft OneNote - program koji možda već imate

Sastav Microsoft Officea, počevši od verzije 2007. i završava s trenutnom 2013., ima program za vođenje bilješki - OneNote. Sadrži i funkcije prepoznavanja teksta. Da biste ga iskoristili, samo umetnite skeniranu ili bilo koju drugu sliku teksta u bilješku, kliknite na desni tipki miš na njemu i koristite kontekstni izbornik. Napominjem da je engleski jezik postavljen za prepoznavanje.

Priznanje u Microsoft OneNoteu

Ne mogu reći da je tekst prepoznat savršeno, ali, koliko mogu prosuditi, nešto je bolje čak i u Cuneiform. Plus programa, kao što je već spomenuto, jest da je s znatnom vjerojatnošću već instaliran na vašem računalu. Iako je, naravno, njegova upotreba, ako je potrebno raditi s velikim brojem skeniranih dokumenata, vjerojatno neće biti prikladna, radije je prikladna za brzo prepoznavanje posjetnica.

Omnipage Ultimate, Omnipage 18 - Mora postojati nešto vrlo cool

Ne znam koliko je dobar program za prepoznavanje omnipage tekstova: Nema probnih verzija, ne želim negdje preuzeti. Ali, ako je njegova cijena opravdana i koštat će oko 5000 rubalja u verziji za individualnu upotrebu, a ne konačno, to bi trebalo biti nešto impresivno. Stranica programa: http: // www.Utančanost.Com/for-individuals/nusproizvod/omnipage/indeks.Htm

Svemoć

Ako se upoznate s karakteristikama i recenzijama, uključujući i u ruskim publikacijama, primjećuje da Omnipage zaista pruža visoku kvalitetu i točno priznanje, uključujući na ruskom, relativno lako rastavljaju skeniranje najviše kvalitete i pruža set dodatnih alata. Od nedostataka, nije najpovoljnije, posebno za početnika, razlikuje se. Na ovaj ili onaj način, na zapadnom tržištu omnipage je izravni konkurent Feyrereader -u i u ocjeni na engleskom jeziku, oni se međusobno bore, i stoga mislim da bi program trebao biti dostojan.

To je daleko od svih programa ove vrste, postoje i razne opcije za male besplatne programe, ali dok sam eksperimentirao s njima, našao sam dva glavna nedostatka urođenih: nedostatak potpore Ćirilskoj abecedi ili drugačije, ne previše korisno u smislu u smislu instalacije, i stoga ih je odlučio da ih ovdje ne spominjemo.