REKLAMA

REKLAMA

Kategorie
Zaloguj się

Zarejestruj się

Proszę podać poprawny adres e-mail Hasło musi zawierać min. 3 znaki i max. 12 znaków
* - pole obowiązkowe
Przypomnij hasło
Witaj
Usuń konto
Aktualizacja danych
  Informacja
Twoje dane będą wykorzystywane do certyfikatów.
Porada Infor.pl

Jak działa rozpoznawanie tekstu w komputerze?

Subskrybuj nas na Youtube
Dołącz do ekspertów Dołącz do grona ekspertów
Kamil Rogala
Rozpoznawanie znaków jest najważniejszą fazą rozpoznawania tekstu.
Rozpoznawanie znaków jest najważniejszą fazą rozpoznawania tekstu.

REKLAMA

REKLAMA

Wiemy już, jak uciążliwe jest ręczne przepisywanie tekstów do komputera. Wiemy również, że istnieje idealne rozwiązanie, które wyręczy nas z tej uciążliwej pracy. Rozwiązanie to nazywa się OCR. Poznajmy teraz tajniki działania optycznego rozpoznawania tekstu, czyli zmiany grafiki na tekst.

Cały proces składa się z pięciu kroków, a pierwszym z nich jest początkowe wczytanie strony. W tej fazie strona, jako plik graficzny musi trafić do komputera, na przykład, jako skan. Jest to pierwsza, podstawowa faza zamiany grafiki na tekst. W następnym kroku następuje podział strony.

REKLAMA

REKLAMA

Podział strony polega na rozpoznaniu teksty przez program i podzielenie go na poszczególne elementy. Dzięki tak zwanej analizie layoutu, czyli układu strony, program do OCR ustala, gdzie na stronie znajduje się tekst, a gdzie inne elementy, na przykład grafiki i zdjęcia. Ponadto program automatycznie dzieli tekst na akapity, potem na zdania, słowa i znaki. Na koniec analizy layoutu program tworzy z dokumentu zbiór pojedynczych znaków i zapamiętuje, gdzie znajdują się pojedyncze słowa i zdania. Tego typu zależności logiczne zostaną później wykorzystane podczas rozpoznawania. W kolejnym kroku system przeprowadza rozpoznawanie znaków.

Zobacz również: Reklama w mobilnym Internecie – jak przewidzieć reakcję odbiorcy?

Rozpoznawanie znaków jest najważniejszą fazą rozpoznawania tekstu. W tym procesie program musi poradzić sobie z wieloma problemami i wątpliwościami, na przykład rozpoznanie w dokumencie, czy znak to litera B, a może cyfra 8. Bywa, że program myli się w tym miejscu i wynik całego procesu nie jest taki, jakiego się spodziewaliśmy.

REKLAMA

Aby rozpoznać tekst możliwie bezbłędnie, programy wykorzystują kombinacje różnych metod, które z grubsza można podzielić na dwie kategorie: rozpoznawanie wzorów (pattern matching) i rozpoznawanie cech (feature matching). W następnej części poradnika zgłębimy te definicje. Tym czasem przejdźmy do kolejnej fazy, czyli budowania tekstu.

Dalszy ciąg materiału pod wideo

Po skończeniu procedury rozpoznawania znaków program znów zaczyna zajmować się dokumentem jako całością. Za pomocą wbudowanego słownika program z poszczególnych znaków tworzy słowa, ze słów zdania, potem akapity, aż do odtworzenia kompletnego tekstu, na kształt oryginału w formie papierowej.

Najważniejszą sztuczką jest wykorzystanie informacji uzyskanych podczas analizy layoutu, którą opisujemy wyżej w drugim kroku. Dzięki tym informacjom możliwe jest szybsze zbudowanie tekstu. Programy uwzględniają również reguły gramatyczne, aby w efekcie końcowym otrzymać poprawne zdania.

 Sprawdź też: Nowy wymiar zakupów – Facebook Deals wkracza do Europy

Oczywiście ostatnim krokiem jest zapisanie rozpoznanej strony, jako plik. Najczęściej jest to plik tekstowy .txt lub plik, który uwzględnia format dokumentu źródłowego, na przykład PDF lub plik Word’a.

Zapisz się na newsletter
Zakładasz firmę? A może ją rozwijasz? Chcesz jak najbardziej efektywnie prowadzić swój biznes? Z naszym newsletterem będziesz zawsze na bieżąco.
Zaznacz wymagane zgody
loading
Zapisując się na newsletter wyrażasz zgodę na otrzymywanie treści reklam również podmiotów trzecich
Administratorem danych osobowych jest INFOR PL S.A. Dane są przetwarzane w celu wysyłki newslettera. Po więcej informacji kliknij tutaj.
success

Potwierdź zapis

Sprawdź maila, żeby potwierdzić swój zapis na newsletter. Jeśli nie widzisz wiadomości, sprawdź folder SPAM w swojej skrzynce.

failure

Coś poszło nie tak

Źródło: INFOR

Oceń jakość naszego artykułu

Dziękujemy za Twoją ocenę!

Twoja opinia jest dla nas bardzo ważna

Powiedz nam, jak możemy poprawić artykuł.
Zaznacz określenie, które dotyczy przeczytanej treści:
Autopromocja

REKLAMA

QR Code

© Materiał chroniony prawem autorskim - wszelkie prawa zastrzeżone. Dalsze rozpowszechnianie artykułu za zgodą wydawcy INFOR PL S.A.

REKLAMA

Moja firma
Zapisz się na newsletter
Zobacz przykładowy newsletter
Zapisz się
Wpisz poprawny e-mail
Brak aktualizacji tej informacji w rejestrze oznacza poważne straty - utrata ulg, zwroty dotacji, jeżeli nie dopełnisz tego obowiązku w terminie

Od 1 stycznia 2025 roku obowiązuje już zmiana, która dotyka każdego przedsiębiorcy w Polsce. Nowa edycja Polskiej Klasyfikacji Działalności (PKD) to nie tylko zwykła aktualizacja – to rewolucja w sposobie opisywania polskiego biznesu. Czy wiesz, że wybór niewłaściwego kodu może zamknąć Ci drogę do dotacji lub ulgi podatkowej?

Jak stoper i koncentracja ratują nas przed światem dystraktorów?

Przez lata próbowałem różnych systemów zarządzania sobą w czasie. Aplikacje, kalendarze, kanbany, mapy myśli. Wszystko ładnie wyglądało na prezentacjach, ale w codziennym chaosie pracy menedżera czy konsultanta – niewiele z tego zostawało.

Odpowiedzialność prawna salonów beauty

Wraz z rozszerzającą się gamą ofert salonów świadczących usługi kosmetyczne, rośnie odpowiedzialność prawna osób wykonujących zabiegi za ich prawidłowe wykonanie. W wielu przypadkach zwrot pieniędzy za źle wykonaną usługę to najmniejsza dolegliwość z grożących konsekwencji.

Od 30 grudnia 2025 r. duże i średnie firmy będą musiały udowodnić, że nie przyczyniają się do wylesiania. Nowe przepisy i obowiązki z rozporządzenia EUDR

Dnia 30 grudnia 2025 r. wchodzi w życie rozporządzenie EUDR. Duże i średnie firmy będą musiały udowodnić, że nie przyczyniają się do wylesiania. Kogo dokładnie dotyczą nowe obowiązki?

REKLAMA

Śmierć wspólnika sp. z o.o. a udziały w spółce

Życie pisze różne scenariusze, a dalekosiężne plany nie zawsze udają się zrealizować. Czasem najlepszy biznesplan nie zdoła uwzględnić nieprzewidzianego. Trudno zakładać, że intensywny i odnoszący sukcesy biznesmen nagle zakończy swoją przygodę, a to wszystko przez śmierć. W takich smutnych sytuacjach spółka z o.o. nie przestaje istnieć. Powstaje pytanie – co dalej? Co dzieje się z udziałami zmarłego wspólnika?

Cesja umowy leasingu samochodu osobowego – ujęcie podatkowe po stronie "przejmującego" leasing

W praktyce gospodarczej często zdarza się, że leasingobiorca korzystający z samochodu osobowego na podstawie umowy leasingu operacyjnego decyduje się przenieść swoje prawa i obowiązki na inny podmiot. Taka transakcja nazywana jest cesją umowy leasingu.

Startupy, AI i biznes: Polska coraz mocniej w grze o rynek USA [Gość Infor.pl]

Współpraca polsko-amerykańska to temat, który od lat przyciąga uwagę — nie tylko polityków, ale też przedsiębiorców, naukowców i ludzi kultury. Fundacja Kościuszkowska, działająca już od stu lat, jest jednym z filarów tej relacji. W rozmowie z Szymonem Glonkiem w programie Gość Infor.pl, Wojciech Voytek Jackowski — powiernik Fundacji i prawnik pracujący w Nowym Jorku — opowiedział o tym, jak dziś wyglądają kontakty gospodarcze między Polską a Stanami Zjednoczonymi, jak rozwijają się polskie startupy za oceanem i jakie szanse przynosi era sztucznej inteligencji.

Coraz większe kłopoty polskich firm z terminowym płaceniem faktur. Niewypłacalnych firm przybywa w zastraszającym tempie

Kolejny rekord niewypłacalności i coraz większa świadomość polskich firm. Od stycznia do końca września 2025 roku aż 5215 polskich firm ogłosiło niewypłacalność. To o 17% więcej niż w tym samym okresie w 2024 roku i o 39% więcej niż po pierwszym półroczu 2025 roku.

REKLAMA

Gdy motywacja spada. Sprawdzone sposoby na odzyskanie chęci do działania

Zaangażowanie pracowników to nie tylko wskaźnik nastrojów w zespołach, lecz realny czynnik decydujący o efektywności i kondycji finansowej organizacji. Jak pokazuje raport Gallupa „State of the Global Workplace 2025”, firmy z wysokim poziomem zaangażowania osiągają o 23 proc. wyższą rentowność i o 18 proc. lepszą produktywność niż konkurencja. Jednocześnie dane z tego samego badania są alarmujące – globalny poziom zaangażowania spadł z 23 do 21 proc., co oznacza, że aż czterech na pięciu pracowników nie czuje silnej więzi z miejscem pracy. Jak odwrócić ten trend?

Niezwykli ludzie. Jak wzbogacać kulturę organizacji dzięki talentom osób z niepełnosprawnością?

Najważniejszym kapitałem każdej organizacji są ludzie – to oni kształtują kulturę, rozwój i pozycję firmy na rynku. Dobrze dobrany zespół udźwignie ogromne wymagania, często przewyższając pokładane w nich oczekiwania, natomiast niewłaściwie dobrany lub źle zarządzany – może osłabić firmę i jej relacje z klientami. Integralnym elementem dojrzałej kultury organizacyjnej staje się dziś świadome włączanie różnorodności, w tym także osób z niepełnosprawnością.

REKLAMA