REKLAMA

REKLAMA

Kategorie
Zaloguj się

Zarejestruj się

Proszę podać poprawny adres e-mail Hasło musi zawierać min. 3 znaki i max. 12 znaków
* - pole obowiązkowe
Przypomnij hasło
Witaj
Usuń konto
Aktualizacja danych
  Informacja
Twoje dane będą wykorzystywane do certyfikatów.
Porada Infor.pl

Jak działa rozpoznawanie tekstu w komputerze?

Subskrybuj nas na Youtube
Dołącz do ekspertów Dołącz do grona ekspertów
Kamil Rogala
Rozpoznawanie znaków jest najważniejszą fazą rozpoznawania tekstu.
Rozpoznawanie znaków jest najważniejszą fazą rozpoznawania tekstu.

REKLAMA

REKLAMA

Wiemy już, jak uciążliwe jest ręczne przepisywanie tekstów do komputera. Wiemy również, że istnieje idealne rozwiązanie, które wyręczy nas z tej uciążliwej pracy. Rozwiązanie to nazywa się OCR. Poznajmy teraz tajniki działania optycznego rozpoznawania tekstu, czyli zmiany grafiki na tekst.

Cały proces składa się z pięciu kroków, a pierwszym z nich jest początkowe wczytanie strony. W tej fazie strona, jako plik graficzny musi trafić do komputera, na przykład, jako skan. Jest to pierwsza, podstawowa faza zamiany grafiki na tekst. W następnym kroku następuje podział strony.

REKLAMA

REKLAMA

Podział strony polega na rozpoznaniu teksty przez program i podzielenie go na poszczególne elementy. Dzięki tak zwanej analizie layoutu, czyli układu strony, program do OCR ustala, gdzie na stronie znajduje się tekst, a gdzie inne elementy, na przykład grafiki i zdjęcia. Ponadto program automatycznie dzieli tekst na akapity, potem na zdania, słowa i znaki. Na koniec analizy layoutu program tworzy z dokumentu zbiór pojedynczych znaków i zapamiętuje, gdzie znajdują się pojedyncze słowa i zdania. Tego typu zależności logiczne zostaną później wykorzystane podczas rozpoznawania. W kolejnym kroku system przeprowadza rozpoznawanie znaków.

Zobacz również: Reklama w mobilnym Internecie – jak przewidzieć reakcję odbiorcy?

Rozpoznawanie znaków jest najważniejszą fazą rozpoznawania tekstu. W tym procesie program musi poradzić sobie z wieloma problemami i wątpliwościami, na przykład rozpoznanie w dokumencie, czy znak to litera B, a może cyfra 8. Bywa, że program myli się w tym miejscu i wynik całego procesu nie jest taki, jakiego się spodziewaliśmy.

REKLAMA

Aby rozpoznać tekst możliwie bezbłędnie, programy wykorzystują kombinacje różnych metod, które z grubsza można podzielić na dwie kategorie: rozpoznawanie wzorów (pattern matching) i rozpoznawanie cech (feature matching). W następnej części poradnika zgłębimy te definicje. Tym czasem przejdźmy do kolejnej fazy, czyli budowania tekstu.

Dalszy ciąg materiału pod wideo

Po skończeniu procedury rozpoznawania znaków program znów zaczyna zajmować się dokumentem jako całością. Za pomocą wbudowanego słownika program z poszczególnych znaków tworzy słowa, ze słów zdania, potem akapity, aż do odtworzenia kompletnego tekstu, na kształt oryginału w formie papierowej.

Najważniejszą sztuczką jest wykorzystanie informacji uzyskanych podczas analizy layoutu, którą opisujemy wyżej w drugim kroku. Dzięki tym informacjom możliwe jest szybsze zbudowanie tekstu. Programy uwzględniają również reguły gramatyczne, aby w efekcie końcowym otrzymać poprawne zdania.

 Sprawdź też: Nowy wymiar zakupów – Facebook Deals wkracza do Europy

Oczywiście ostatnim krokiem jest zapisanie rozpoznanej strony, jako plik. Najczęściej jest to plik tekstowy .txt lub plik, który uwzględnia format dokumentu źródłowego, na przykład PDF lub plik Word’a.

Zapisz się na newsletter
Zakładasz firmę? A może ją rozwijasz? Chcesz jak najbardziej efektywnie prowadzić swój biznes? Z naszym newsletterem będziesz zawsze na bieżąco.
Zaznacz wymagane zgody
loading
Zapisując się na newsletter wyrażasz zgodę na otrzymywanie treści reklam również podmiotów trzecich
Administratorem danych osobowych jest INFOR PL S.A. Dane są przetwarzane w celu wysyłki newslettera. Po więcej informacji kliknij tutaj.
success

Potwierdź zapis

Sprawdź maila, żeby potwierdzić swój zapis na newsletter. Jeśli nie widzisz wiadomości, sprawdź folder SPAM w swojej skrzynce.

failure

Coś poszło nie tak

Źródło: INFOR

Oceń jakość naszego artykułu

Dziękujemy za Twoją ocenę!

Twoja opinia jest dla nas bardzo ważna

Powiedz nam, jak możemy poprawić artykuł.
Zaznacz określenie, które dotyczy przeczytanej treści:
Autopromocja

REKLAMA

QR Code

© Materiał chroniony prawem autorskim - wszelkie prawa zastrzeżone. Dalsze rozpowszechnianie artykułu za zgodą wydawcy INFOR PL S.A.

REKLAMA

Moja firma
Zapisz się na newsletter
Zobacz przykładowy newsletter
Zapisz się
Wpisz poprawny e-mail
Ekspert BCC o wysokości minimalnego wynagrodzenia w 2026 r.: „po raz pierwszy od wielu lat (rząd) pozwolił zadziałać algorytmowi wpisanemu w ustawę”. W ocenie eksperta, jest to ulga dla pracodawców

Od stycznia 2026 r. wzrośnie zarówno płaca minimalna, jak i minimalna stawka godzinowa. Rząd przyjął w tej sprawie rozporządzenie. Rozporządzenie z 11 września 2025 r. w sprawie wysokości minimalnego wynagrodzenia za pracę oraz wysokości minimalnej stawki godzinowej w 2026 r. zostało ogłoszone w Dzienniku Urzędowym Rzeczypospolitej Polskiej.

Zamknięcie granicy z Białorusią 2025 a siła wyższa w kontraktach handlowych. Konsekwencje dla biznesu

Czy zamknięcie granicy z Białorusią w 2025 roku to trzęsienie ziemi w kontraktach handlowych i biznesie? Nie. To test zarządzania ryzykiem kontraktowym w łańcuchu dostaw. Czy można powołać się na siłę wyższą?

Dłuższy okres kontroli drogowej: nic się nie ukryje przed inspekcją? Jak firmy transportowe mogą uniknąć częstszych i wyższych kar?

Mija kilka miesięcy od wprowadzenia nowych zasad sprawdzania kierowców na drodze. Zmiana przepisów, wynikająca z pakietu mobilności, dwukrotnie wydłużyła okres kontroli drogowej: z 28 do 56 dni wstecz. Dla inspekcji transportowych w UE to znacznie rozszerzone możliwości nadzoru, dla przedsiębiorstw transportowych – szereg kolejnych wyzwań. Jak sobie radzić w zupełnie innej rzeczywistości kontrolnej, by unikać kar finansowych i innych poważnych konsekwencji?

Gdy przedsiębiorca jest w trudnej sytuacji, ZUS może przejąć wypłatę zasiłków

Brak płynności finansowej płatnika składek, który zatrudnia powyżej 20 osób, może utrudniać mu regulowanie świadczeń na rzecz pracowników. Takimi świadczeniami są zasiłek chorobowy, zasiłek macierzyński czy świadczenie rehabilitacyjne. W takiej sytuacji Zakład Ubezpieczeń Społecznych może pomóc i przejąć wypłatę świadczeń. Potrzebny jest jednak wniosek płatnika lub ubezpieczonego.

REKLAMA

Bezpłatny webinar: Czas na e-porządek w fakturach zakupowych

Zapanuj nad kosztami, przyspiesz pracę, zredukuj błędy. Obowiązkowy KseF przyspieszył procesy digitalizacji obiegu faktur. Wykorzystaj ten trend do kolejnych automatyzacji, również w obsłudze faktur przychodzących. Lepsza kontrola nad kosztami, eliminacja dokumentów papierowych i mniej pomyłek to mniej pracy dla finansów.

Pracodawcy będą musieli bardziej chronić pracowników przed upałami. Zmiany już od 1 stycznia 2027 r.

Dotychczas polskie prawo regulowało jedynie minimalne temperatury w miejscu pracy. Wkrótce może się to zmienić – rząd przygotował projekt przepisów wprowadzających limity także dla upałów. To odpowiedź na coraz częstsze fale wysokich temperatur w Polsce.

Przywództwo to wspólna misja

Rozmowa z Piotrem Kolmasem, konsultantem biznesowym, i Sławomirem Faconem, dyrektorem odpowiedzialnym za rekrutację i rozwój pracowników w PLL LOT, autorami książki „The Team. Nowoczesne przywództwo Mission Command”, o koncepcji wywodzącej się z elitarnych sił specjalnych, która z powodzeniem sprawdza się w biznesie

Rośnie liczba donosów do skarbówki, ale tylko kilka procent informacji się potwierdza [DANE Z KAS]

Jak wynika z danych przekazanych przez 16 Izb Administracji Skarbowej, w I połowie br. liczba informacji sygnalnych, a więc tzw. donosów, skierowanych do jednostek KAS wyniosła 37,2 tys. Przy tym zestawienie nie jest pełne, bowiem nie zakończył się obowiązek sprawozdawczy urzędów skarbowych w tym zakresie. Zatem na chwilę obecną to o 4,2% więcej niż w analogicznym okresie 2024 roku, kiedy było ich 35,7 tys. Natomiast, zestawiając tegoroczne dane z tymi z I połowy 2023 roku, widać wzrost o 6%. Wówczas odnotowano 35,1 tys. takich przypadków. Poniżej omówienie dotychczasowych danych z Krajowej Administracji Skarbowej.

REKLAMA

Wygoda, bezpieczeństwo, prestiż – trzy filary nowoczesnego biznesu

Cyfryzacja, zielona transformacja i konieczność reagowania na coraz szybsze zmiany rynkowe sprawiają, że współczesnym firmom potrzebne są nie tylko tradycyjne narzędzia finansowe. Przedsiębiorcy oczekują nowoczesnych rozwiązań, które usprawnią zarządzanie biznesem, oszczędzą czas i zminimalizują ryzyko. Bank BNP Paribas odpowiada na te potrzeby, oferując innowacyjne pakiety rachunków oraz prestiżową kartę Mastercard Business World Elite. To narzędzia, które pomagają firmom z różnych branż - od e-commerce, przez usługi i budownictwo, aż po handel międzynarodowy - zachować stabilność i skutecznie rozwijać biznes.

Webinar: Architekci zmiany

Jak dobrać zespół, który skutecznie przeprowadzi transformację?

REKLAMA