REKLAMA

REKLAMA

Kategorie
Zaloguj się

Zarejestruj się

Proszę podać poprawny adres e-mail Hasło musi zawierać min. 3 znaki i max. 12 znaków
* - pole obowiązkowe
Przypomnij hasło
Witaj
Usuń konto
Aktualizacja danych
  Informacja
Twoje dane będą wykorzystywane do certyfikatów.
Porada Infor.pl

Jak działa rozpoznawanie tekstu w komputerze?

Kamil Rogala
Rozpoznawanie znaków jest najważniejszą fazą rozpoznawania tekstu.
Rozpoznawanie znaków jest najważniejszą fazą rozpoznawania tekstu.

REKLAMA

REKLAMA

Wiemy już, jak uciążliwe jest ręczne przepisywanie tekstów do komputera. Wiemy również, że istnieje idealne rozwiązanie, które wyręczy nas z tej uciążliwej pracy. Rozwiązanie to nazywa się OCR. Poznajmy teraz tajniki działania optycznego rozpoznawania tekstu, czyli zmiany grafiki na tekst.

Cały proces składa się z pięciu kroków, a pierwszym z nich jest początkowe wczytanie strony. W tej fazie strona, jako plik graficzny musi trafić do komputera, na przykład, jako skan. Jest to pierwsza, podstawowa faza zamiany grafiki na tekst. W następnym kroku następuje podział strony.

REKLAMA

REKLAMA

Podział strony polega na rozpoznaniu teksty przez program i podzielenie go na poszczególne elementy. Dzięki tak zwanej analizie layoutu, czyli układu strony, program do OCR ustala, gdzie na stronie znajduje się tekst, a gdzie inne elementy, na przykład grafiki i zdjęcia. Ponadto program automatycznie dzieli tekst na akapity, potem na zdania, słowa i znaki. Na koniec analizy layoutu program tworzy z dokumentu zbiór pojedynczych znaków i zapamiętuje, gdzie znajdują się pojedyncze słowa i zdania. Tego typu zależności logiczne zostaną później wykorzystane podczas rozpoznawania. W kolejnym kroku system przeprowadza rozpoznawanie znaków.

Zobacz również: Reklama w mobilnym Internecie – jak przewidzieć reakcję odbiorcy?

Rozpoznawanie znaków jest najważniejszą fazą rozpoznawania tekstu. W tym procesie program musi poradzić sobie z wieloma problemami i wątpliwościami, na przykład rozpoznanie w dokumencie, czy znak to litera B, a może cyfra 8. Bywa, że program myli się w tym miejscu i wynik całego procesu nie jest taki, jakiego się spodziewaliśmy.

REKLAMA

Aby rozpoznać tekst możliwie bezbłędnie, programy wykorzystują kombinacje różnych metod, które z grubsza można podzielić na dwie kategorie: rozpoznawanie wzorów (pattern matching) i rozpoznawanie cech (feature matching). W następnej części poradnika zgłębimy te definicje. Tym czasem przejdźmy do kolejnej fazy, czyli budowania tekstu.

Dalszy ciąg materiału pod wideo

Po skończeniu procedury rozpoznawania znaków program znów zaczyna zajmować się dokumentem jako całością. Za pomocą wbudowanego słownika program z poszczególnych znaków tworzy słowa, ze słów zdania, potem akapity, aż do odtworzenia kompletnego tekstu, na kształt oryginału w formie papierowej.

Najważniejszą sztuczką jest wykorzystanie informacji uzyskanych podczas analizy layoutu, którą opisujemy wyżej w drugim kroku. Dzięki tym informacjom możliwe jest szybsze zbudowanie tekstu. Programy uwzględniają również reguły gramatyczne, aby w efekcie końcowym otrzymać poprawne zdania.

 Sprawdź też: Nowy wymiar zakupów – Facebook Deals wkracza do Europy

Oczywiście ostatnim krokiem jest zapisanie rozpoznanej strony, jako plik. Najczęściej jest to plik tekstowy .txt lub plik, który uwzględnia format dokumentu źródłowego, na przykład PDF lub plik Word’a.

Źródło: INFOR

Oceń jakość naszego artykułu

Dziękujemy za Twoją ocenę!

Twoja opinia jest dla nas bardzo ważna

Powiedz nam, jak możemy poprawić artykuł.
Zaznacz określenie, które dotyczy przeczytanej treści:
Autopromocja

REKLAMA

QR Code

© Materiał chroniony prawem autorskim - wszelkie prawa zastrzeżone. Dalsze rozpowszechnianie artykułu za zgodą wydawcy INFOR PL S.A.

REKLAMA

Moja firma
Mały ZUS Plus: nowe zasady od 2026 r.

Mały ZUS Plus 2026: nowe zasady określają w jaki sposób liczy się okresy ulgi. Przedsiębiorcy mogą płacić mniejsze składki aż przez 36 miesięcy kalendarzowych w każdym okresie 60 miesięcy (5 lat) prowadzenia działalności gospodarczej.

AI napędza przychody, ale w Polsce tylko garstka firm naprawdę na tym zarabia

5 proc. polskich firm generuje dzięki AI ponad jedną czwartą swoich przychodów, podczas gdy średnia dla Europy wynosi 22 proc. - wynika z raportu Deloitte. Jednocześnie ponad połowa polskich firm przeznacza powyżej 10 proc. budżetu technologicznego na AI.

KSeF: gdzie jesteśmy i jakie ryzyka wciąż pozostają

Wdrożenie obowiązkowego Krajowego Systemu e-Faktur (KSeF) wchodzi w decydującą fazę. Po okresie niepewności regulacyjnej i technicznej wiele firm deklaruje gotowość do przejścia na fakturowanie ustrukturyzowane, jednak praktyka pokazuje, że rzeczywisty poziom przygotowania bywa znacznie bardziej zróżnicowany. Opóźnienia w publikacji szczegółowych danych technicznych oraz zmiany w specyfikacjach sprawiły, że część rozwiązań dostępnych dziś na rynku nie pozwala na wykonanie pełnych testów w warunkach zbliżonych do produkcyjnych. W konsekwencji przedsiębiorcy często opierają się na założeniach, a nie na sprawdzonych procesach.

Masz firmę lub księgujesz? ZUS wprowadza pilną zmianę w Płatniku. Bez tego nie wyślesz dokumentów

Każdy, kto zajmuje się rozliczeniami z Zakładem Ubezpieczeń Społecznych, wie, jak stresujące potrafią być techniczne niespodzianki w dniach wysyłki deklaracji. ZUS właśnie opublikował ważny komunikat dotyczący programu Płatnik. Wygasa dotychczasowy certyfikat zabezpieczający transmisję danych. Jeśli go nie zaktualizujesz, system odrzuci Twoje dokumenty. Sprawdź, jak to naprawić w kilka minut.

REKLAMA

Pracownik marznie w biurze? Pracodawco, sprawdź, co grozi za złamanie przepisów zimą

W czasie mrozów pracodawca ma obowiązek zapewnić odpowiednie warunki pracy. Na przykład temperatura w biurze nie powinna spaść poniżej 18 st. C – przypomina Państwowa Inspekcja Pracy. Szczególną ochroną, nawet jeśli nie ma mrozu, należy objąć osoby pracujące na zewnątrz.

Rejestracja polskiej spółki do VAT w Czechach – kiedy jest konieczna

Wielu przedsiębiorców błędnie zakłada, że skoro firma jest zarejestrowana w Polsce i posiada polski VAT UE, to może swobodnie rozliczać transakcje w innych krajach. W rzeczywistości czeskie przepisy bardzo precyzyjnie określają, kiedy zagraniczny podmiot musi dokonać lokalnej rejestracji VAT.

Ponad połowa firm ocenia swoją sytuację finansową pozytywnie. Oto sektory z największym optymizmem

W grudniu 2025 r. ponad połowa przedsiębiorstw oceniła swoją sytuację finansową jako dobrą lub bardzo dobrą - wynika z badania przeprowadzonego przez Polski Instytut Ekonomiczny (PIE). Zdaniem 43 proc. przedsiębiorstw ich kondycja w 2026 r. będzie dobra lub bardzo dobra.

Wysokie koszty pracy główną barierą dla firm w 2025 r. GUS wskazuje sektory najbardziej dotknięte problemem

Wysokie koszty zatrudnienia były w 2025 r. najczęściej wskazywaną barierą w prowadzeniu działalności gospodarczej – wynika z badania koniunktury gospodarczej opublikowanego w poniedziałek przez GUS. Problem ten szczególnie dotyczył przedsiębiorstw z sektora budownictwa, zakwaterowania i gastronomii.

REKLAMA

Koszty pracy najtrudniejsze w prowadzeniu firm w 2025 r. [GUS]

Najtrudniejsze w prowadzeniu firm w 2025 r. okazują się wysokie koszty pracy. Takie dane podał Główny Urząd Statystyczny. Negatywne nastroje dominowały w budownictwie, handlu hurtowym i detalicznym oraz w przetwórstwie przemysłowym.

Public affairs strategicznym narzędziem zarządzania wpływem i budowania odporności biznesowej

Jeszcze niedawno o sile przedsiębiorstw decydowały przede wszystkim przychody, tempo wzrostu i udział w rynku. Dziś coraz częściej o ich rozwoju przesądzają czynniki zewnętrzne: regulacje, oczekiwania społeczne i presja interesariuszy. W tej rzeczywistości strategicznym narzędziem zarządzania wpływem i budowania odporności biznesowej staje się public affairs (PA).

Zapisz się na newsletter
Zakładasz firmę? A może ją rozwijasz? Chcesz jak najbardziej efektywnie prowadzić swój biznes? Z naszym newsletterem będziesz zawsze na bieżąco.
Zaznacz wymagane zgody
loading
Zapisując się na newsletter wyrażasz zgodę na otrzymywanie treści reklam również podmiotów trzecich
Administratorem danych osobowych jest INFOR PL S.A. Dane są przetwarzane w celu wysyłki newslettera. Po więcej informacji kliknij tutaj.
success

Potwierdź zapis

Sprawdź maila, żeby potwierdzić swój zapis na newsletter. Jeśli nie widzisz wiadomości, sprawdź folder SPAM w swojej skrzynce.

failure

Coś poszło nie tak

REKLAMA