REKLAMA

REKLAMA

Kategorie
Zaloguj się

Zarejestruj się

Proszę podać poprawny adres e-mail Hasło musi zawierać min. 3 znaki i max. 12 znaków
* - pole obowiązkowe
Przypomnij hasło
Witaj
Usuń konto
Aktualizacja danych
  Informacja
Twoje dane będą wykorzystywane do certyfikatów.
Porada Infor.pl

Co sprawia najwięcej problemów programom do OCR?

Kamil Rogala
Rozpoznawanie tekstu OCR z pewnością pomaga nam w pracy w biurze lub w domu.
Rozpoznawanie tekstu OCR z pewnością pomaga nam w pracy w biurze lub w domu.
inforCMS

REKLAMA

REKLAMA

Rozpoznawanie tekstu OCR z pewnością pomaga nam w pracy w biurze lub w domu, ale czasami sprawia ogromne problemy programom do rozpoznawania tekstu i komputerom, które muszą sobie poradzić z dużą ilością operacji. Co sprawia największe problemy podczas rozpoznawania tekstu?

Oprócz fikuśnych czcionek i wielu stron, programy do OCR nie najlepiej radzą sobie z fachowymi terminami i językami obcymi. Najpopularniejsze programy do OCR zawierają słowniki do wielu języków obcych i radzą sobie z popularnymi zapożyczeniami i terminami fachowymi. Niestety niektóre wyrazy mogą sprawić programom do OCR sporo trudności. Nawet, jeśli program rozpozna wszystkie znaki frazy "kwas dezoksyrybonukleinowy", to będzie to dopiero połowa sukcesu.

REKLAMA

REKLAMA

Problem pojawi się w momencie, gdy dane słowo nie występuje w słowniku programu. Na szczęście w takim momencie programy do OCR wyróżniają takie słowo, aby użytkownik w razie potrzeby mógł skorygować je ręcznie. Osoby pracujące z tekstami zawierającymi dużo słownictwa specjalistycznego powinny używać programu do rozpoznawania tekstu ze słownikiem użytkownika, który można uzupełniać o nowe pojęcia, dodając skomplikowane wyrazy do słownika programu.

Kolejnym problemem mogą być brudne, zanieczyszczone lub wielokrotnie kopiowane strony z tekstem. W takim przypadku program do OCR może po prostu zgłupieć. Wystarczy mała plamka z kawy lub kropla atramentu na wydruku, a z litery O zrobi się nagle liter Ó lub Q. Aby uniknąć takich sytuacji, zaawansowane programy do OCR wyposażone są w mechanizmy korekcji, które automatycznie rozpoznają zabrudzenia i usuwają je z cyfrowego obrazu. Niestety w wielu przypadkach, gdy strona jest mocno zanieczyszczona, funkcja ta i tak nie spełni w 100% swojego zadania.

Polecamy: Czy za wysyłanie spamu firmie grozi kara grzywny?

REKLAMA

Kolejne problemy mogą pojawić się przy rozpoznawaniu tekstu na ilustracjach. Podczas analizy layoutu programy badają, w których częściach znajduje się tekst, a gdzie zbędne z punktu widzenia rozpoznawania tekstu zdjęcia. W niektórych przypadkach program powinien jednak uwzględniać również ilustracje. Przydaje się to w momencie, gdy w późniejszym czasie będziemy chcieli dopasować podpisy do zastosowanych grafik.

Dalszy ciąg materiału pod wideo

Profesjonalne programy do OCR mają funkcję rozpoznawania tekstów zamieszczonych na zdjęciach. Program robi to metodą wyrywkowych próbek. Polega to na tym, że jeśli program rozpozna na stronie element, który mógłby być tekstem, testuje go metodą rozpoznawania znaków. Jeśli test da pozytywny wynik, program może zarejestrować również te teksty nadrukowane na zdjęciach. Niestety działa to dość wybiórczo, a skuteczność rozpoznawania zależy od jakości zdjęcia i widoczności tekstu na fotografii.

Sporo problemów sprawiają również tabele, które część programów do OCR rozpoznaje, jako mieszanina tekstu i obrazu. Aby program do OCR rozpoznał prawidłowo jak najwięcej wpisów do tabeli, programiści dodają do niego specjalne moduły do rozpoznawania tabel. Program rozpoznaje tabelę po liniach siatki, poprawnie odczytane tabele można później edytować w Excelu lub Wordzie.

Zobacz również: Microsoft Office 2010 – jak się odnaleźć po przesiadce z Office 2003?

Rozpoznawanie tekstu za pomocą programów OCR i skanera to świetne rozwiązanie szczególnie w firmach, w których codziennie przepisuje się lub archiwizuje duże ilości dokumentów. OCR jest w stanie zaoszczędzić mnóstwo czasu i jednocześnie zwiększyć wydajność o kilkaset procent w skali miesiąca.

Autopromocja

REKLAMA

Źródło: INFOR

Oceń jakość naszego artykułu

Dziękujemy za Twoją ocenę!

Twoja opinia jest dla nas bardzo ważna

Powiedz nam, jak możemy poprawić artykuł.
Zaznacz określenie, które dotyczy przeczytanej treści:

REKLAMA

QR Code

© Materiał chroniony prawem autorskim - wszelkie prawa zastrzeżone. Dalsze rozpowszechnianie artykułu za zgodą wydawcy INFOR PL S.A.

Moja firma
Zapisz się na newsletter
Zobacz przykładowy newsletter
Zapisz się
Wpisz poprawny e-mail
KAS: Nowe funkcjonalności konta organizacji w e-Urzędzie Skarbowym

Spółki, fundacje i stowarzyszenia nie muszą już upoważniać pełnomocników do składania deklaracji drogą elektroniczną, aby rozliczać się elektronicznie. Krajowa Administracja Skarbowa wprowadziła nowe funkcjonalności konta organizacji w e-US.

Sztuczna inteligencja będzie dyktować ceny?

Sztuczna inteligencja wykorzystywana jest coraz chętniej, sięgają po nią także handlowcy. Jak detaliści mogą zwiększyć zyski dzięki sztucznej inteligencji? Coraz więcej z nich wykorzystuje AI do kalkulacji cen. 

Coraz więcej firm zatrudnia freelancerów. Przedsiębiorcy opowiadają dlaczego

Czy firmy wolą teraz zatrudniać freelancerów niż pracowników na etat? Jakie są zalety takiego modelu współpracy? 

Lavard - kara UOKiK na ponad 3,8 mln zł, Lord - ponad 213 tys. zł. Firmy wprowadzały w błąd konsumentów kupujących odzież

UOKiK wymierzył kary finansowe na przedsiębiorstwa odzieżowe: Polskie Sklepy Odzieżowe (Lavard) - ponad 3,8 mln zł, Lord - ponad 213 tys. zł. Konsumenci byli wprowadzani w błąd przez nieprawdziwe informacje o składzie ubrań. Zafałszowanie składu ubrań potwierdziły kontrole Inspekcji Handlowej i badania w laboratorium UOKiK.

REKLAMA

Składka zdrowotna to parapodatek! Odkręcanie Polskiego Ładu powinno nastąpić jak najszybciej

Składka zdrowotna to parapodatek! Zmiany w składce zdrowotnej muszą nastąpić jak najszybciej. Odkręcanie Polskiego Ładu dopiero od stycznia 2025 r. nie satysfakcjonuje przedsiębiorców. Czy składka zdrowotna wróci do stanu sprzed Polskiego Ładu?

Dotacje KPO wzmocnią ofertę konkursów ABM 2024 dla przedsiębiorców

Dotacje ABM (Agencji Badań Medycznych) finansowane były dotychczas przede wszystkim z krajowych środków publicznych. W 2024 roku ulegnie to zmianie za sprawą środków z KPO. Zgodnie z zapowiedziami, już w 3 i 4 kwartale możemy spodziewać się rozszerzenia oferty dotacyjnej dla przedsiębiorstw.

"DGP": Ceneo wygrywa z Google. Sąd zakazał wyszukiwarce Google faworyzowania własnej porównywarki cenowej

Warszawski sąd zakazał wyszukiwarce Google faworyzowania własnej porównywarki cenowej. Nie wolno mu też przekierowywać ruchu do Google Shopping kosztem Ceneo ani utrudniać dostępu do polskiej porównywarki przez usuwanie prowadzących do niej wyników wyszukiwania – pisze we wtorek "Dziennik Gazeta Prawna".

Drogie podróże zarządu Orlenu. Nowe "porażające" informacje

"Tylko w 2022 roku zarząd Orlenu wydał ponad pół miliona euro na loty prywatnymi samolotami" - poinformował w poniedziałek minister aktywów państwowych Borys Budka. Dodał, że w listopadzie ub.r. wdano też 400 tys. zł na wyjazd na wyścig Formuły 1 w USA.

REKLAMA

Cable pooling - nowy model inwestycji w OZE. Warunki przyłączenia, umowa

W wyniku ostatniej nowelizacji ustawy Prawo energetyczne, która weszła w życie 1 października 2023 roku, do polskiego porządku prawnego wprowadzono długo wyczekiwane przez polską branżę energetyczną przepisy regulujące instytucję zbiorczego przyłącza, tzw. cable poolingu. Co warto wiedzieć o tej instytucji i przepisach jej dotyczących?

Wakacje składkowe. Od kiedy, jakie kryteria trzeba spełnić?

12 kwietnia 2024 r. w Sejmie odbyło się I czytanie projektu nowelizacji ustawy o systemie ubezpieczeń społecznych. Projekt nowelizacji przewiduje zwolnienie z opłacania składek ZUS (tzw. wakacje składkowe) dla małych przedsiębiorców. 

REKLAMA