REKLAMA

REKLAMA

Kategorie
Zaloguj się

Zarejestruj się

Proszę podać poprawny adres e-mail Hasło musi zawierać min. 3 znaki i max. 12 znaków
* - pole obowiązkowe
Przypomnij hasło
Witaj
Usuń konto
Aktualizacja danych
  Informacja
Twoje dane będą wykorzystywane do certyfikatów.
Porada Infor.pl

Co sprawia najwięcej problemów programom do OCR?

Kamil Rogala
Rozpoznawanie tekstu OCR z pewnością pomaga nam w pracy w biurze lub w domu.
Rozpoznawanie tekstu OCR z pewnością pomaga nam w pracy w biurze lub w domu.
inforCMS

REKLAMA

REKLAMA

Rozpoznawanie tekstu OCR z pewnością pomaga nam w pracy w biurze lub w domu, ale czasami sprawia ogromne problemy programom do rozpoznawania tekstu i komputerom, które muszą sobie poradzić z dużą ilością operacji. Co sprawia największe problemy podczas rozpoznawania tekstu?

Oprócz fikuśnych czcionek i wielu stron, programy do OCR nie najlepiej radzą sobie z fachowymi terminami i językami obcymi. Najpopularniejsze programy do OCR zawierają słowniki do wielu języków obcych i radzą sobie z popularnymi zapożyczeniami i terminami fachowymi. Niestety niektóre wyrazy mogą sprawić programom do OCR sporo trudności. Nawet, jeśli program rozpozna wszystkie znaki frazy "kwas dezoksyrybonukleinowy", to będzie to dopiero połowa sukcesu.

REKLAMA

REKLAMA

Problem pojawi się w momencie, gdy dane słowo nie występuje w słowniku programu. Na szczęście w takim momencie programy do OCR wyróżniają takie słowo, aby użytkownik w razie potrzeby mógł skorygować je ręcznie. Osoby pracujące z tekstami zawierającymi dużo słownictwa specjalistycznego powinny używać programu do rozpoznawania tekstu ze słownikiem użytkownika, który można uzupełniać o nowe pojęcia, dodając skomplikowane wyrazy do słownika programu.

Kolejnym problemem mogą być brudne, zanieczyszczone lub wielokrotnie kopiowane strony z tekstem. W takim przypadku program do OCR może po prostu zgłupieć. Wystarczy mała plamka z kawy lub kropla atramentu na wydruku, a z litery O zrobi się nagle liter Ó lub Q. Aby uniknąć takich sytuacji, zaawansowane programy do OCR wyposażone są w mechanizmy korekcji, które automatycznie rozpoznają zabrudzenia i usuwają je z cyfrowego obrazu. Niestety w wielu przypadkach, gdy strona jest mocno zanieczyszczona, funkcja ta i tak nie spełni w 100% swojego zadania.

Polecamy: Czy za wysyłanie spamu firmie grozi kara grzywny?

REKLAMA

Kolejne problemy mogą pojawić się przy rozpoznawaniu tekstu na ilustracjach. Podczas analizy layoutu programy badają, w których częściach znajduje się tekst, a gdzie zbędne z punktu widzenia rozpoznawania tekstu zdjęcia. W niektórych przypadkach program powinien jednak uwzględniać również ilustracje. Przydaje się to w momencie, gdy w późniejszym czasie będziemy chcieli dopasować podpisy do zastosowanych grafik.

Dalszy ciąg materiału pod wideo

Profesjonalne programy do OCR mają funkcję rozpoznawania tekstów zamieszczonych na zdjęciach. Program robi to metodą wyrywkowych próbek. Polega to na tym, że jeśli program rozpozna na stronie element, który mógłby być tekstem, testuje go metodą rozpoznawania znaków. Jeśli test da pozytywny wynik, program może zarejestrować również te teksty nadrukowane na zdjęciach. Niestety działa to dość wybiórczo, a skuteczność rozpoznawania zależy od jakości zdjęcia i widoczności tekstu na fotografii.

Sporo problemów sprawiają również tabele, które część programów do OCR rozpoznaje, jako mieszanina tekstu i obrazu. Aby program do OCR rozpoznał prawidłowo jak najwięcej wpisów do tabeli, programiści dodają do niego specjalne moduły do rozpoznawania tabel. Program rozpoznaje tabelę po liniach siatki, poprawnie odczytane tabele można później edytować w Excelu lub Wordzie.

Zobacz również: Microsoft Office 2010 – jak się odnaleźć po przesiadce z Office 2003?

Rozpoznawanie tekstu za pomocą programów OCR i skanera to świetne rozwiązanie szczególnie w firmach, w których codziennie przepisuje się lub archiwizuje duże ilości dokumentów. OCR jest w stanie zaoszczędzić mnóstwo czasu i jednocześnie zwiększyć wydajność o kilkaset procent w skali miesiąca.

Autopromocja

REKLAMA

Źródło: INFOR

Oceń jakość naszego artykułu

Dziękujemy za Twoją ocenę!

Twoja opinia jest dla nas bardzo ważna

Powiedz nam, jak możemy poprawić artykuł.
Zaznacz określenie, które dotyczy przeczytanej treści:

REKLAMA

QR Code

© Materiał chroniony prawem autorskim - wszelkie prawa zastrzeżone. Dalsze rozpowszechnianie artykułu za zgodą wydawcy INFOR PL S.A.

Moja firma
Zapisz się na newsletter
Zobacz przykładowy newsletter
Zapisz się
Wpisz poprawny e-mail
Skuteczne zarządzanie zespołem: relacje i współpraca

W dzisiejszym, dynamicznie zmieniającym się środowisku biznesowym, skuteczne zarządzanie zespołem jest kluczowym czynnikiem sukcesu każdej organizacji. Budowanie relacji, współpraca oraz efektywna komunikacja stanowią fundamenty, na których opiera się sprawne funkcjonowanie zespołu.

Wniosek o zwrot nadpłaty składki zdrowotnej warto złożyć do 3 czerwca 2024 r.

Przedsiębiorcy do 3 czerwca 2024 r. mają czas na złożenie wniosku o zwrot nadpłaty składki zdrowotnej. Co, jeśli przedsiębiorca nie złoży wniosku o zwrot nadpłaty?

Walka o przetrwanie. W ciągu dekady zniknie większość sklepów internetowych

Na rynku e-commerce, który jest niezwykle konkurencyjny, już w pierwszym roku działalności zanika 5% firm. Po upływie dziesięciu lat nadal funkcjonuje jedynie 37% z nich - informuje wtorkowe wydanie "Rzeczpospolitej".

Handel w dwie niedziele w każdym miesiącu - jest wniosek o odrzucenia projektu nowelizacji

Polska Izba Handlu wnioskuje o odrzucenie w całości poselskiego projektu przywracającego handel w 2 niedziele w miesiącu - wynika z opinii PIH złożonego w trakcie procesu legislacyjnego.

REKLAMA

Dzień Matki. Jak wygląda rynek pracy kobiet?

W ciągu ostatnich kilku lat sytuacja kobiet na rynku pracy mocno ewoluowała. Pomimo podejmowania przez firmy działań na rzecz równouprawnienia płci panie bywają niejednokrotnie w nieco gorszej sytuacji zawodowej niż panowie. Jak wygląda rynek pracy kobiet? Czy pracodawcy oferują dodatkowe benefity dla rodziców? Co jest dla nich ważne u pracodawcy?

Pablo Escobar jako znak towarowy? Sąd odmawia

Sąd UE odmówił rejestracji oznaczenia słownego „Pablo Escobar” pod unijnym znakiem towarowym. Sąd uznał je za sprzeczne z porządkiem publicznym i dobrymi obyczajami. Za bardzo kojarzy się z handlem narkotykami i zbrodnią.

Ogromne grzywny za niewdrożenie dyrektywy NIS2. Do kiedy trzeba to zrobić?

Dyrektywa Unii Europejskiej w sprawie środków na rzecz wysokiego wspólnego poziomu cyberbezpieczeństwa na terytorium Unii (NIS2) ma duże znaczenie dla poprawy cyberbezpieczeństwa UE. Jej wejście w życie nastąpiło w styczniu 2023 r. - z terminem na dostosowanie niezbędnych do wykonania niniejszej dyrektywy przepisów krajowych do 18 października 2024 r. Kto powinien przygotować się do działania w zgodzie z NIS2-  analizuje Michał Borowiecki, dyrektor Netskope na Polskę i Europę Wschodnią.

Nowa usługa dla indywidualnych przedsiębiorców w aplikacji mObywatel 2.0

W aplikacji mObywatel 2.0 pojawiła się usługa "Firma" skierowana do osób prowadzących jednoosobową działalność gospodarczą. Jak z niej skorzystać?

REKLAMA

Onboarding w hybrydowym modelu pracy

Czym jest onboarding? Jak wygląda w pracy hybrydowej? 

Efekt Marywilskiej i fali pożarów: przedsiębiorcy pytają o ubezpieczenia i podatki pod względem strat

Tragedia tysięcy kupców, którzy prowadzili swoje biznesy często poniżej poziomu ryzyka skłania wielu przedsiębiorców do refleksji nad warunkami w jakich oni sami prowadzą swoją działalność. Efekt Marywilskiej i fali pożarów w ogóle: dwie ważne kwestie, w których doradzają eksperci to rozliczanie strat i inne aspekty podatkowe nieszczęścia oraz skuteczność polis jako zabezpieczenia przed skutkami nieszczęść.

REKLAMA