REKLAMA

REKLAMA

Kategorie
Zaloguj się

Zarejestruj się

Proszę podać poprawny adres e-mail Hasło musi zawierać min. 3 znaki i max. 12 znaków
* - pole obowiązkowe
Przypomnij hasło
Witaj
Usuń konto
Aktualizacja danych
  Informacja
Twoje dane będą wykorzystywane do certyfikatów.
Porada Infor.pl

Jak działa rozpoznawanie tekstu w komputerze?

Kamil Rogala
Rozpoznawanie znaków jest najważniejszą fazą rozpoznawania tekstu.
Rozpoznawanie znaków jest najważniejszą fazą rozpoznawania tekstu.

REKLAMA

REKLAMA

Wiemy już, jak uciążliwe jest ręczne przepisywanie tekstów do komputera. Wiemy również, że istnieje idealne rozwiązanie, które wyręczy nas z tej uciążliwej pracy. Rozwiązanie to nazywa się OCR. Poznajmy teraz tajniki działania optycznego rozpoznawania tekstu, czyli zmiany grafiki na tekst.

Cały proces składa się z pięciu kroków, a pierwszym z nich jest początkowe wczytanie strony. W tej fazie strona, jako plik graficzny musi trafić do komputera, na przykład, jako skan. Jest to pierwsza, podstawowa faza zamiany grafiki na tekst. W następnym kroku następuje podział strony.

REKLAMA

REKLAMA

Podział strony polega na rozpoznaniu teksty przez program i podzielenie go na poszczególne elementy. Dzięki tak zwanej analizie layoutu, czyli układu strony, program do OCR ustala, gdzie na stronie znajduje się tekst, a gdzie inne elementy, na przykład grafiki i zdjęcia. Ponadto program automatycznie dzieli tekst na akapity, potem na zdania, słowa i znaki. Na koniec analizy layoutu program tworzy z dokumentu zbiór pojedynczych znaków i zapamiętuje, gdzie znajdują się pojedyncze słowa i zdania. Tego typu zależności logiczne zostaną później wykorzystane podczas rozpoznawania. W kolejnym kroku system przeprowadza rozpoznawanie znaków.

Zobacz również: Reklama w mobilnym Internecie – jak przewidzieć reakcję odbiorcy?

Rozpoznawanie znaków jest najważniejszą fazą rozpoznawania tekstu. W tym procesie program musi poradzić sobie z wieloma problemami i wątpliwościami, na przykład rozpoznanie w dokumencie, czy znak to litera B, a może cyfra 8. Bywa, że program myli się w tym miejscu i wynik całego procesu nie jest taki, jakiego się spodziewaliśmy.

REKLAMA

Aby rozpoznać tekst możliwie bezbłędnie, programy wykorzystują kombinacje różnych metod, które z grubsza można podzielić na dwie kategorie: rozpoznawanie wzorów (pattern matching) i rozpoznawanie cech (feature matching). W następnej części poradnika zgłębimy te definicje. Tym czasem przejdźmy do kolejnej fazy, czyli budowania tekstu.

Dalszy ciąg materiału pod wideo

Po skończeniu procedury rozpoznawania znaków program znów zaczyna zajmować się dokumentem jako całością. Za pomocą wbudowanego słownika program z poszczególnych znaków tworzy słowa, ze słów zdania, potem akapity, aż do odtworzenia kompletnego tekstu, na kształt oryginału w formie papierowej.

Najważniejszą sztuczką jest wykorzystanie informacji uzyskanych podczas analizy layoutu, którą opisujemy wyżej w drugim kroku. Dzięki tym informacjom możliwe jest szybsze zbudowanie tekstu. Programy uwzględniają również reguły gramatyczne, aby w efekcie końcowym otrzymać poprawne zdania.

 Sprawdź też: Nowy wymiar zakupów – Facebook Deals wkracza do Europy

Oczywiście ostatnim krokiem jest zapisanie rozpoznanej strony, jako plik. Najczęściej jest to plik tekstowy .txt lub plik, który uwzględnia format dokumentu źródłowego, na przykład PDF lub plik Word’a.

Źródło: INFOR

Oceń jakość naszego artykułu

Dziękujemy za Twoją ocenę!

Twoja opinia jest dla nas bardzo ważna

Powiedz nam, jak możemy poprawić artykuł.
Zaznacz określenie, które dotyczy przeczytanej treści:
Autopromocja

REKLAMA

QR Code

© Materiał chroniony prawem autorskim - wszelkie prawa zastrzeżone. Dalsze rozpowszechnianie artykułu za zgodą wydawcy INFOR PL S.A.

REKLAMA

Moja firma
Targowisko to każde miejsce, w którym jest prowadzona sprzedaż. Wystawisz towar przed sklep, zapłacisz opłatę targową

Choć każdy sprzedawca prowadzi działania mające na celu zainteresowanie potencjalnych klientów oferowanym przez nich towarem, to jednak działania te mogą przynieść niespodziewane skutki. Niestety o wymiarze finansowym.

Paczki z ubraniami niedługo bez zgłoszenia w SENT - MF zmieni przepisy po fali skarg

MF wycofuje się z obowiązku zgłaszania w systemie SENT krajowych przewozów odzieży i obuwia. Projekt nowego rozporządzenia trafił 15 czerwca 2026 r. do konsultacji publicznych. To efekt dwóch miesięcy protestów branży modowej, logistycznej i e-commerce. Dla importu i WNT progi zostają podwyższone trzykrotnie. Firmy handlujące ubraniami i butami mogą odetchnąć.

E-commerce w Polsce przyspiesza. Sprzedaż rośnie szybciej niż inflacja

Maj przyniósł wyraźne ożywienie w polskim sektorze e-commerce. Sprzedaż rosła znacznie szybciej niż inflacja. Najbardziej dynamicznie rósł popyt z zagranicy. To w dużej mierze zasługa AI - czytamy w „Pb".

Będzie więcej kobiet w organach spółek publicznych - minimum 33%. Nawet 500 tys. zł kary za nierespektowanie nowych przepisów

Będzie więcej kobiet w organach spółek publicznych - minimum 33%. To wynik opóźnionej implementacji przez Polskę unijnej dyrektywy Women on Boards. Nawet 500 tys. zł kary za nierespektowanie nowych przepisów. Na jakim etapie są prace legislacyjne?

REKLAMA

UE wprowadza standardy równości płac. Pracodawców czekają zmiany

Po wejściu w życie przepisów unijnej dyrektywy pracodawcy będą musieli przyjrzeć się wzorom umów i zrezygnować z rozwiązań, które zabraniają pracownikom mówić o swoim wynagrodzeniu - powiedziała w środę ekspertka prawa pracy dr Monika Wieczorek.

Polskie firmy chcą inwestować w AI. Problemem są rosnące koszty oprogramowania

Firmy chcą przeznaczać środki na sztuczną inteligencję, ale znaczną część budżetów pochłania utrzymanie istniejących systemów. Rosnące koszty subskrypcji oprogramowania niepokoją już ponad połowę przedsiębiorstw, podczas gdy 52% planuje inwestycje w AI i rozwój własnych aplikacji.

33 procent kobiet w zarządach spółek – nowy obowiązek. Których firm dotyczy? Kary do pół mln zł

Rada Ministrów przyjęła 09.06.2026 r. projekt ustawy, który wprowadza obowiązek zapewnienia minimum 33% udziału kobiet w zarządach i radach nadzorczych spółek giełdowych. Nowe przepisy wdrażają unijną dyrektywę i oznaczają konkretne obowiązki dla firm: politykę równowagi płci, raporty oraz przejrzyste kryteria wyboru kandydatów. Za brak dostosowania grozi kara do 500 000 zł.

Sprzedawcy elektroniki i AGD tylko do 31 lipca 2026 mają czas na wdrożenie systemu napraw - nowe obowiązki

Do końca lipca 2026 roku firmy z branży elektroniki i AGD muszą wdrożyć dyrektywę Right to Repair. Nowe przepisy oznaczają obowiązek naprawy sprzętu nawet po gwarancji, dostęp do części zamiennych i dokumentacji technicznej. Brak dostosowania to ryzyko sporów z klientami i sankcji prawnych. Sprawdź szczegóły, obowiązki sprzedawców i uprawnienia kupujących.

REKLAMA

Brak kobiet na najwyższych stanowiskach to nie naturalny efekt procesów rynkowych, a konsekwencja barier. Rada Ministrów pracuje nad Women on Boards

Brak kobiet na najwyższych stanowiskach to nie naturalny efekt procesów rynkowych, a konsekwencja barier. Rada Ministrów pracuje nad rozwiązaniami z dyrektywy Women on Boards. Parytety - czy płeć zacznie liczyć się bardziej niż kompetencje? To błędne założenie, że dziś o awansach i nominacjach decydują wyłącznie kwalifikacje. Gdyby tak było, trudno byłoby wyjaśnić, dlaczego kobiety – stanowiące połowę społeczeństwa, coraz częściej lepiej wykształcone od mężczyzn i osiągają porównywalne wyniki biznesowe – pozostają tak słabo reprezentowane na najwyższych szczeblach zarządzania.

Inteligencja emocjonalna, pomnażanie majątku, kobiety liderki i AI w firmach rodzinnych - III edycja Family Business Future Summit tym inspirowała liderów firm rodzinnych

Ponad 160 uczestników, reprezentujących firmy rodzinne, spotkało się podczas III edycji Family Business Future Summit 2026, aby rozmawiać o sukcesji, odpowiedzialności, relacjach międzypokoleniowych i przyszłości polskiego biznesu rodzinnego. Tegoroczna edycja wydarzenia pokazała, że firmy rodzinne potrzebują dziś nie tylko eksperckiej wiedzy, ale także przestrzeni do szczerej rozmowy o wartościach, zmianie i ciągłości.

Zapisz się na newsletter
Zakładasz firmę? A może ją rozwijasz? Chcesz jak najbardziej efektywnie prowadzić swój biznes? Z naszym newsletterem będziesz zawsze na bieżąco.
Zaznacz wymagane zgody
loading
Zapisując się na newsletter wyrażasz zgodę na otrzymywanie treści reklam również podmiotów trzecich
Administratorem danych osobowych jest INFOR PL S.A. Dane są przetwarzane w celu wysyłki newslettera. Po więcej informacji kliknij tutaj.
success

Potwierdź zapis

Sprawdź maila, żeby potwierdzić swój zapis na newsletter. Jeśli nie widzisz wiadomości, sprawdź folder SPAM w swojej skrzynce.

failure

Coś poszło nie tak

REKLAMA