REKLAMA

REKLAMA

Kategorie
Zaloguj się

Zarejestruj się

Proszę podać poprawny adres e-mail Hasło musi zawierać min. 3 znaki i max. 12 znaków
* - pole obowiązkowe
Przypomnij hasło
Witaj
Usuń konto
Aktualizacja danych
  Informacja
Twoje dane będą wykorzystywane do certyfikatów.
Porada Infor.pl

Jak dokładnie działa rozpoznawanie znaków?

Kamil Rogala
OCR, czyli optyczne rozpoznawanie tekstu sprawdza się szczególnie w firmach, w których wymagane jest przenoszenie dokumentów papierowych do komputera.
OCR, czyli optyczne rozpoznawanie tekstu sprawdza się szczególnie w firmach, w których wymagane jest przenoszenie dokumentów papierowych do komputera.
inforCMS

REKLAMA

REKLAMA

OCR, czyli optyczne rozpoznawanie tekstu sprawdza się szczególnie w firmach, w których wymagane jest przenoszenie dokumentów papierowych do komputera. Niewiele osób jednak wie, jak działają programy OCR. Warto wiedzieć, że programy te stosują wiele rozmaitych technik pozwalających na rozpoznanie poszczególnych znaków.

Jedną z technik wykorzystywanych przez programy OCR jest technika rozpoznawania cech. Istnieje dokładnie dziesięć różnych metod, jednak najważniejsze i najczęściej stosowane techniki to rozpoznawanie rastra, rozpoznawanie cech i klasyfikacja struktur. Program do rozpoznawania tekstu wie, że każdy znak ma określone cechy.

REKLAMA

Dla przykładu, typowymi cechami litery A są dwie ukośne linie spotykające się u wierzchołka i kreska w środku. Cechy te są niezmienne bez względu na wielkość czcionki albo sposób wydrukowania tekstu, na przykład kursywę lub wytłuszczenie. My również znamy te zasady od dziecka i doskonale wiemy, że nie ulegną one zmianie.

Zobacz również: Click 2 SMS – co to takiego i czy to działa?

REKLAMA

Podczas rozpoznawania cech, program stosuje kilka metod identyfikacji po kolei. Ciekawostka jest fakt, że dokładne zasady ich działania są najpilniej strzeżonymi tajemnicami producentów oprogramowania stosowanego do rozpoznawania tekstu. Najogólniej proces ten wygląda następująco: program porównuje i waży wyniki wszystkich użytych w celu rozpoznania znaku metod. Do końcowego wyniku, czyli gotowego tekstu trafia ten znak, dla którego ustalono najwyższe prawdopodobieństwo skutecznego rozpoznania.

Kolejną techniką jest rozpoznawanie wzorców. Metoda ta polega na porównywaniu każdego jednego znaku z zadanej strony z biblioteką znaków programu. Programy wykorzystują do tego duże bazy danych z różnymi krojami pisma, czyli czcionkami, wielkością tekstu, ze znakami zniekształconymi etc. Jeśli znaleziony znak zgadza się ze znakiem z bazy danych, program uznaje go za rozpoznany.

Dalszy ciąg materiału pod wideo

Na pierwszy rzut oka brzmi to bardzo prosto, jednak w praktyce czynności te są bardzo czasochłonne i nie gwarantują stuprocentowej skuteczności, bo czcionka na rozpoznawanej stronie musi absolutnie zgadzać się z wzorcem w bazie danych, włącznie ze wszystkimi elementami formatowania, takimi jak wytłuszczenie lub kursywa. Bardzo często programy mylą się i końcowy wynik nie zgadza się w 100 procentach z pierwowzorem.

Zobacz również: Reklama w mobilnym Internecie – jak przewidzieć reakcję odbiorcy?

Ostatnim aspektem podczas optycznego rozpoznawania tekstu jest rozpoznawanie kolorów. Można wprawdzie skanować strony z kolorowymi zdjęciami lub grafikami, ale programy do OCR wykorzystują tylko odcienie szarości. Czemu? Otóż z praktycznego punktu widzenia, kolory nie odgrywają żadnej roli podczas rozpoznawania tekstu, a pliki z materiałami do analizy zajmują mniej miejsca.

Autopromocja

REKLAMA

Źródło: INFOR

Oceń jakość naszego artykułu

Dziękujemy za Twoją ocenę!

Twoja opinia jest dla nas bardzo ważna

Powiedz nam, jak możemy poprawić artykuł.
Zaznacz określenie, które dotyczy przeczytanej treści:

REKLAMA

QR Code

© Materiał chroniony prawem autorskim - wszelkie prawa zastrzeżone. Dalsze rozpowszechnianie artykułu za zgodą wydawcy INFOR PL S.A.

Moja firma
Zapisz się na newsletter
Zobacz przykładowy newsletter
Zapisz się
Wpisz poprawny e-mail
Wyższe cła na rosyjskie i białoruskie zboża i inne produkty rolne już obowiązują [Lista produktów]

W dniu 1 lipca 2024 r. weszło w życie rozporządzenie Rady Unii Europejskiej podwyższające cła na rosyjskie i białoruskie zboża, nasiona oleiste i produkty pochodne, a także inne produkty.

Cyberbezpieczeństwo w polskich firmach - nie jest zbyt dobrze

Polskie firmy powinny poważnie zadbać o swoje cyberbezpieczeństwo. Z nowego raportu Eurostatu „Cyfryzacja w Europie” wynika, że Polska znajduje się na drugim miejscu pod względem liczby firm, w których cyfrowe bezpieczeństwo zostało naruszone. 3 na 10 przebadanych organizacji z Polski zgłosiło przynajmniej jeden tego typu incydent.  

Te metody sprawdzą się w nauce języków obcych

Jakie metody najlepiej sprawdzają się w nauce wymowy języków obcych? Czy oglądanie filmów wystarczy? Podpowiadają eksperci z platformy do nauki języków.

Pszenica, kukurydza i rzepak - notowania cen

Pszenica, kukurydza i rzepak na europejskim rynku - notowania cen w czerwcu 2024 r.

REKLAMA

Patent lidera. Dlaczego rozwój menedżera jest koniecznością w niepewnych czasach? Pobierz BEZPŁATNIE wydanie specjalne "Menedżer ODnowa"

Wyobraź sobie statek w środku burzy, którym dowodzi kapitan nieznający nowoczesnych narzędzi nawigacyjnych ani technik zarządzania załogą, która w dodatku nie ma do niego zaufania. Czy powierzyłbyś swój statek takiej osobie? Jakie są szanse, że doprowadzi go ona do celu? Podobnie jak w żegludze, świat biznesu wymaga od menedżerów ciągłego doskonalenia i nauki. W dzisiejszych czasach, gdy zmiany są jedyną stałą, wygląda na to, że rozwój menedżera stał się czymś więcej niż opcją – jest absolutną koniecznością. Bezpłatne wydanie specjalne "Menedżer ODnowa" jest już dostępne do pobrania. 

Czego najbardziej boją się Polacy? Drugie miejsce zaskakuje

93,9% społeczeństwa boi się przynajmniej jednego spośród 37 możliwych czarnych scenariuszy. Tak wynika z raportu „Bieżące lęki i obawy Polaków”. Czego Polacy boją się najbardziej?

Ochrona budżetu i środowiska. Firmy coraz częściej naprawiają sprzęty, zamiast wymieniać je na nowe

95 proc. uszkodzonych urządzeń elektronicznych można przywrócić do pełnej sprawności, a średni czas naprawy telefonu lub laptopa to zaledwie 48 godzin. Filozofia “napraw zamiast wyrzucać” redukuje liczbę odpadów i zapewnia firmom oszczędności, ale jej wykorzystanie wymaga przyjęcia cyrkularnego modelu biznesowego. Jak to zrobić?   

Zmiany dla małych firm od 1 stycznia 2025 r. Chodzi o zwolnienia z VAT

Małe firmy będą miały możliwość korzystania ze zwolnienia z VAT w państwach Unii Europejskiej, niezależnie od kraju, w którym mają swoją siedzibę. Projekt nowelizacji ustawy o podatku od towarów i usług, opracowany przez Ministerstwo Finansów, zakłada wprowadzenie szczególnej procedury zwolnień dla małych przedsiębiorstw.

REKLAMA

Jakie narzędzia oparte na sztucznej inteligencji są najczęściej wykorzystywane przez firmy?

Z generatywną sztuczną inteligencją spotkała się już większość firm. Tak wynika z raportu firmy konsultingowej Bain & Company. Teraz przyszedł czas na kolejne etapy wdrażania tej technologii. 

Komisja Europejska: Microsoft naruszył przepisy UE. Chodzi o narzędzie Teams

Komisja Europejska wszczęła 25 czerwca 2024 r. nowe postępowanie antymonopolowe przeciwko Microsoftowi. Jej zdaniem amerykański koncern naruszył unijne przepisy, wiążąc swój produkt do komunikacji Teams ze swoimi popularnymi aplikacjami do zwiększania produktywności zawartymi w pakietach dla firm Office 365 i Microsoft 365.

REKLAMA