REKLAMA

REKLAMA

Kategorie
Zaloguj się

Zarejestruj się

Proszę podać poprawny adres e-mail Hasło musi zawierać min. 3 znaki i max. 12 znaków
* - pole obowiązkowe
Przypomnij hasło
Witaj
Usuń konto
Aktualizacja danych
  Informacja
Twoje dane będą wykorzystywane do certyfikatów.
Porada Infor.pl

Jak dokładnie działa rozpoznawanie znaków?

Kamil Rogala
OCR, czyli optyczne rozpoznawanie tekstu sprawdza się szczególnie w firmach, w których wymagane jest przenoszenie dokumentów papierowych do komputera.
OCR, czyli optyczne rozpoznawanie tekstu sprawdza się szczególnie w firmach, w których wymagane jest przenoszenie dokumentów papierowych do komputera.
inforCMS

REKLAMA

REKLAMA

OCR, czyli optyczne rozpoznawanie tekstu sprawdza się szczególnie w firmach, w których wymagane jest przenoszenie dokumentów papierowych do komputera. Niewiele osób jednak wie, jak działają programy OCR. Warto wiedzieć, że programy te stosują wiele rozmaitych technik pozwalających na rozpoznanie poszczególnych znaków.

Jedną z technik wykorzystywanych przez programy OCR jest technika rozpoznawania cech. Istnieje dokładnie dziesięć różnych metod, jednak najważniejsze i najczęściej stosowane techniki to rozpoznawanie rastra, rozpoznawanie cech i klasyfikacja struktur. Program do rozpoznawania tekstu wie, że każdy znak ma określone cechy.

REKLAMA

Dla przykładu, typowymi cechami litery A są dwie ukośne linie spotykające się u wierzchołka i kreska w środku. Cechy te są niezmienne bez względu na wielkość czcionki albo sposób wydrukowania tekstu, na przykład kursywę lub wytłuszczenie. My również znamy te zasady od dziecka i doskonale wiemy, że nie ulegną one zmianie.

Zobacz również: Click 2 SMS – co to takiego i czy to działa?

REKLAMA

Podczas rozpoznawania cech, program stosuje kilka metod identyfikacji po kolei. Ciekawostka jest fakt, że dokładne zasady ich działania są najpilniej strzeżonymi tajemnicami producentów oprogramowania stosowanego do rozpoznawania tekstu. Najogólniej proces ten wygląda następująco: program porównuje i waży wyniki wszystkich użytych w celu rozpoznania znaku metod. Do końcowego wyniku, czyli gotowego tekstu trafia ten znak, dla którego ustalono najwyższe prawdopodobieństwo skutecznego rozpoznania.

Kolejną techniką jest rozpoznawanie wzorców. Metoda ta polega na porównywaniu każdego jednego znaku z zadanej strony z biblioteką znaków programu. Programy wykorzystują do tego duże bazy danych z różnymi krojami pisma, czyli czcionkami, wielkością tekstu, ze znakami zniekształconymi etc. Jeśli znaleziony znak zgadza się ze znakiem z bazy danych, program uznaje go za rozpoznany.

Dalszy ciąg materiału pod wideo

Na pierwszy rzut oka brzmi to bardzo prosto, jednak w praktyce czynności te są bardzo czasochłonne i nie gwarantują stuprocentowej skuteczności, bo czcionka na rozpoznawanej stronie musi absolutnie zgadzać się z wzorcem w bazie danych, włącznie ze wszystkimi elementami formatowania, takimi jak wytłuszczenie lub kursywa. Bardzo często programy mylą się i końcowy wynik nie zgadza się w 100 procentach z pierwowzorem.

Zobacz również: Reklama w mobilnym Internecie – jak przewidzieć reakcję odbiorcy?

Ostatnim aspektem podczas optycznego rozpoznawania tekstu jest rozpoznawanie kolorów. Można wprawdzie skanować strony z kolorowymi zdjęciami lub grafikami, ale programy do OCR wykorzystują tylko odcienie szarości. Czemu? Otóż z praktycznego punktu widzenia, kolory nie odgrywają żadnej roli podczas rozpoznawania tekstu, a pliki z materiałami do analizy zajmują mniej miejsca.

Autopromocja

REKLAMA

Źródło: INFOR

Oceń jakość naszego artykułu

Dziękujemy za Twoją ocenę!

Twoja opinia jest dla nas bardzo ważna

Powiedz nam, jak możemy poprawić artykuł.
Zaznacz określenie, które dotyczy przeczytanej treści:

REKLAMA

QR Code

© Materiał chroniony prawem autorskim - wszelkie prawa zastrzeżone. Dalsze rozpowszechnianie artykułu za zgodą wydawcy INFOR PL S.A.

Moja firma
Zapisz się na newsletter
Zobacz przykładowy newsletter
Zapisz się
Wpisz poprawny e-mail
Dzień Matki. Jak wygląda rynek pracy kobiet?

W ciągu ostatnich kilku lat sytuacja kobiet na rynku pracy mocno ewoluowała. Pomimo podejmowania przez firmy działań na rzecz równouprawnienia płci panie bywają niejednokrotnie w nieco gorszej sytuacji zawodowej niż panowie. Jak wygląda rynek pracy kobiet? Czy pracodawcy oferują dodatkowe benefity dla rodziców? Co jest dla nich ważne u pracodawcy?

Pablo Escobar jako znak towarowy? Sąd odmawia

Sąd UE odmówił rejestracji oznaczenia słownego „Pablo Escobar” pod unijnym znakiem towarowym. Sąd uznał je za sprzeczne z porządkiem publicznym i dobrymi obyczajami. Za bardzo kojarzy się z handlem narkotykami i zbrodnią.

Ogromne grzywny za niewdrożenie dyrektywy NIS2. Do kiedy trzeba to zrobić?

Dyrektywa Unii Europejskiej w sprawie środków na rzecz wysokiego wspólnego poziomu cyberbezpieczeństwa na terytorium Unii (NIS2) ma duże znaczenie dla poprawy cyberbezpieczeństwa UE. Jej wejście w życie nastąpiło w styczniu 2023 r. - z terminem na dostosowanie niezbędnych do wykonania niniejszej dyrektywy przepisów krajowych do 18 października 2024 r. Kto powinien przygotować się do działania w zgodzie z NIS2-  analizuje Michał Borowiecki, dyrektor Netskope na Polskę i Europę Wschodnią.

Nowa usługa dla indywidualnych przedsiębiorców w aplikacji mObywatel 2.0

W aplikacji mObywatel 2.0 pojawiła się usługa "Firma" skierowana do osób prowadzących jednoosobową działalność gospodarczą. Jak z niej skorzystać?

REKLAMA

Onboarding w hybrydowym modelu pracy

Czym jest onboarding? Jak wygląda w pracy hybrydowej? 

Efekt Marywilskiej i fali pożarów: przedsiębiorcy pytają o ubezpieczenia i podatki pod względem strat

Tragedia tysięcy kupców, którzy prowadzili swoje biznesy często poniżej poziomu ryzyka skłania wielu przedsiębiorców do refleksji nad warunkami w jakich oni sami prowadzą swoją działalność. Efekt Marywilskiej i fali pożarów w ogóle: dwie ważne kwestie, w których doradzają eksperci to rozliczanie strat i inne aspekty podatkowe nieszczęścia oraz skuteczność polis jako zabezpieczenia przed skutkami nieszczęść.

Jak zbudować dobre „candidate experience”

Czym jest candidate experience? Na co wpływa? Jak zmierzyć candidate experience i jak zbudować dobre?

31 maja 2024 r. upływa ważny termin dla rolników-przedsiębiorców

Do 31 maja 2024 r. należy złożyć zaświadczenie/oświadczenie o nieprzekroczeniu rocznej kwoty granicznej należnego podatku dochodowego za 2023 rok od przychodów z pozarolniczej działalności gospodarczej.

REKLAMA

Twórcy i wykonawcy utworów audiowizualnych dostaną tantiemy za udostępnianie ich dzieł w Internecie. Czy coś się zmieni dla osób korzystających z internetu?

Rada Ministrów 14 maja 2024 r. przyjęła projekt nowelizacji ustawy o prawie autorskim i prawach pokrewnych. Na mocy tych przepisów twórcy i wykonawcy utworów audiowizualnych oraz wykonawcy utworów muzycznych (i słowno-muzycznych) będą mieli prawo do tantiem z tytułu eksploatacji ich dzieł w internecie.

Firma prosi klienta o dane by spersonalizować ofertę, jak reaguje polski konsument

Firmy chcą wiedzieć coraz więcej o swoich klientach po to by łatwiej konkurować z innymi, dostarczając na rynek produkty lepiej dostosowane do oczekiwań i potrzeb nabywców. Konsumenci z kolei są gotowi przekazać więcej danych o sobie, ale nie za darmo – wiedzą już, że takie dane to towar, który ma swoją cenę oczekują więc w zamian dla siebie korzyści. Jakich?

REKLAMA