REKLAMA

REKLAMA

Kategorie
Zaloguj się

Zarejestruj się

Proszę podać poprawny adres e-mail Hasło musi zawierać min. 3 znaki i max. 12 znaków
* - pole obowiązkowe
Przypomnij hasło
Witaj
Usuń konto
Aktualizacja danych
  Informacja
Twoje dane będą wykorzystywane do certyfikatów.
Porada Infor.pl

Jak działa rozpoznawanie tekstu w komputerze?

Kamil Rogala
Rozpoznawanie znaków jest najważniejszą fazą rozpoznawania tekstu.
Rozpoznawanie znaków jest najważniejszą fazą rozpoznawania tekstu.

REKLAMA

REKLAMA

Wiemy już, jak uciążliwe jest ręczne przepisywanie tekstów do komputera. Wiemy również, że istnieje idealne rozwiązanie, które wyręczy nas z tej uciążliwej pracy. Rozwiązanie to nazywa się OCR. Poznajmy teraz tajniki działania optycznego rozpoznawania tekstu, czyli zmiany grafiki na tekst.

Cały proces składa się z pięciu kroków, a pierwszym z nich jest początkowe wczytanie strony. W tej fazie strona, jako plik graficzny musi trafić do komputera, na przykład, jako skan. Jest to pierwsza, podstawowa faza zamiany grafiki na tekst. W następnym kroku następuje podział strony.

REKLAMA

Podział strony polega na rozpoznaniu teksty przez program i podzielenie go na poszczególne elementy. Dzięki tak zwanej analizie layoutu, czyli układu strony, program do OCR ustala, gdzie na stronie znajduje się tekst, a gdzie inne elementy, na przykład grafiki i zdjęcia. Ponadto program automatycznie dzieli tekst na akapity, potem na zdania, słowa i znaki. Na koniec analizy layoutu program tworzy z dokumentu zbiór pojedynczych znaków i zapamiętuje, gdzie znajdują się pojedyncze słowa i zdania. Tego typu zależności logiczne zostaną później wykorzystane podczas rozpoznawania. W kolejnym kroku system przeprowadza rozpoznawanie znaków.

Zobacz również: Reklama w mobilnym Internecie – jak przewidzieć reakcję odbiorcy?

REKLAMA

Rozpoznawanie znaków jest najważniejszą fazą rozpoznawania tekstu. W tym procesie program musi poradzić sobie z wieloma problemami i wątpliwościami, na przykład rozpoznanie w dokumencie, czy znak to litera B, a może cyfra 8. Bywa, że program myli się w tym miejscu i wynik całego procesu nie jest taki, jakiego się spodziewaliśmy.

Aby rozpoznać tekst możliwie bezbłędnie, programy wykorzystują kombinacje różnych metod, które z grubsza można podzielić na dwie kategorie: rozpoznawanie wzorów (pattern matching) i rozpoznawanie cech (feature matching). W następnej części poradnika zgłębimy te definicje. Tym czasem przejdźmy do kolejnej fazy, czyli budowania tekstu.

Dalszy ciąg materiału pod wideo

Po skończeniu procedury rozpoznawania znaków program znów zaczyna zajmować się dokumentem jako całością. Za pomocą wbudowanego słownika program z poszczególnych znaków tworzy słowa, ze słów zdania, potem akapity, aż do odtworzenia kompletnego tekstu, na kształt oryginału w formie papierowej.

Najważniejszą sztuczką jest wykorzystanie informacji uzyskanych podczas analizy layoutu, którą opisujemy wyżej w drugim kroku. Dzięki tym informacjom możliwe jest szybsze zbudowanie tekstu. Programy uwzględniają również reguły gramatyczne, aby w efekcie końcowym otrzymać poprawne zdania.

 Sprawdź też: Nowy wymiar zakupów – Facebook Deals wkracza do Europy

Oczywiście ostatnim krokiem jest zapisanie rozpoznanej strony, jako plik. Najczęściej jest to plik tekstowy .txt lub plik, który uwzględnia format dokumentu źródłowego, na przykład PDF lub plik Word’a.

Autopromocja

REKLAMA

Źródło: INFOR

Oceń jakość naszego artykułu

Dziękujemy za Twoją ocenę!

Twoja opinia jest dla nas bardzo ważna

Powiedz nam, jak możemy poprawić artykuł.
Zaznacz określenie, które dotyczy przeczytanej treści:

REKLAMA

QR Code

© Materiał chroniony prawem autorskim - wszelkie prawa zastrzeżone. Dalsze rozpowszechnianie artykułu za zgodą wydawcy INFOR PL S.A.

Moja firma
Zapisz się na newsletter
Zobacz przykładowy newsletter
Zapisz się
Wpisz poprawny e-mail
Urlop od płacenia składek ZUS dla mikroprzedsiębiorców. Nowe rozwiązania coraz bliżej?

Sejm uchwalił ustawę o tzw. wakacjach składkowych. Nowe przepisy są skierowane do mikroprzedsiębiorców, wpisanych do CEIDG, którzy ubezpieczają do 10 osób, a ich roczny obrót nie przekracza 2 mln euro. Teraz ustawa trafi do Senatu.

Jest decyzja Rady Polityki Pieniężnej w sprawie stóp procentowych. Ile wynoszą?

Rada Polityki Pieniężnej na posiedzeniu w dn. 8-9 maja 2024 r. utrzymała wszystkie stopy procentowe NBP na niezmienionym poziomie, referencyjna wynosi nadal 5,75 proc. - podał w komunikacie bank centralny.

Polacy już nie oglądają telewizji?

Polacy coraz rzadziej oglądają telewizję, a coraz częściej wybierają platformy streamingowe. Według ekspertów to te oferujące treści sportowe będą wybierane najczęściej. 

Co to jest sztuka cyfrowa i dlaczego warto w nią inwestować

– Dzięki łączeniu sztuki i nowych technologii możemy dziś pokazać w każdym miejscu na Ziemi wybitnych polskich artystów i nasz wyjątkowy kraj. To również absolutny strzał w dziesiątkę dla branży inwestycyjnej! – mówi Tomasz Jaworski, promotor Polski na świecie, mecenas sztuki, kolekcjoner, Prezes grupy innowacyjnych projektów SMARTVerum.

REKLAMA

Brak chętnych do pracy. Restaurator oferuje prawie 1300 zł za pomoc w znalezieniu kelnera

Sezon letni jeszcze się nie rozpoczął, a w branży gastronomicznej i hotelowej już, tak jak co roku, brakuje pracowników. Właściciel bistro w Aoście na północy Włoch oferuje bon wartości 300 euro osobie, która pomoże mu znaleźć kelnera. 

Ogromne zmiany na rynku pracy w ciągu najbliższych 5 lat

Najbliższe 5 lat na rynku pracy ma przynieść ogromne zmiany. Według Adecco zniknie 83 miliony miejsc pracy, a na ich miejsce powstanie jedynie 69 milionów innych. Jakie posady są zagrożone? 

Nowa usługa finansowa dla prowadzących działalność gospodarczą: gotówka na niski procent

Teraz gotówka na niski procent lub przy spełnieniu dodatkowych warunków całkowicie nieoprocentowana, staje się nową usługą dla przedsiębiorców korzystających w mikrofaktoringu lub dopiero mających w planach skorzystanie z takiego instrumentu. W uproszczeniu ten nowy produkt przypomina zaliczkę tytułem wpływów z przyszłej faktury i pozwala na zachowanie płynności finansowej w okresie gdy jeszcze produkt nie został sprzedany a więc i faktura nie może być wystawiona.

Wartościowe środowisko pracy - czym jest, jak je stworzyć?

Dobra atmosfera w pracy przedkłada się na lojalność pracowników, ich motywację i zaangażowanie. Jak zapewnić pracownikom najlepsze employee journey? 

REKLAMA

Jak Nvidia może zyskać na wartości dzięki inwestorom w akcje memy

Dzięki fantastycznemu rocznemu zwrotowi, przekraczającemu obecnie 220%, Nvidia stałą się jedną z najczęściej dyskutowanych spółek w ostatnim okresie i dowodem na to, że rynek technologiczny trzyma się dobrze. Czy spółka należy również do kategorii akcji memów, czy raczej jej wycena jest oparta o solidne podstawy?

Drogi prąd będzie przyczyną zahamowania sztucznej inteligencji?

Wykorzystanie sztucznej inteligencji to duże koszty energetyczne. Czy bez inwestycji w strukturę centrodanową i energetyczną rozwój AI wyhamuje? 

REKLAMA