REKLAMA

REKLAMA

Kategorie
Zaloguj się

Zarejestruj się

Proszę podać poprawny adres e-mail Hasło musi zawierać min. 3 znaki i max. 12 znaków
* - pole obowiązkowe
Przypomnij hasło
Witaj
Usuń konto
Aktualizacja danych
  Informacja
Twoje dane będą wykorzystywane do certyfikatów.

Rozpoznawanie tekstu oszczędza czas pracowników

Subskrybuj nas na Youtube
Dołącz do ekspertów Dołącz do grona ekspertów
Łukasz Plewa

REKLAMA

REKLAMA

Przepisywanie tekstów jest nie tylko uciążliwe ale w sposób zatrważający kradnie pracownikom czas, który poświęcić mogliby na pożyteczniejsze zajęcia. Komputery są w tej kwestii o wiele szybsze – poznajmy oprogramowanie do rozpoznawania tekstu.

Programy do rozpoznawania tekstu upowszechniły się wraz ze skanerami. Dzisiaj firma, która nie korzysta z ich dobrodziejstwa zlecając przepisywanie pracownikowi marnuje w rzeczywistości jego potencjał i własne pieniądze. Sam skaner, bez programu pozwoli nam jedynie zeskanować stronę która będzie zapisana w formie obrazu. Aby taki plik edytować obraz należy przetworzyć na tekst. Optyczne rozpoznawanie znaków – bo tak nazywa się ten proces (OCR – Optical Character Recognition) dzieli się na kilka kroków, w których aplikacja po kolei tworzy w pełni czytelny zapis tekstowy.

REKLAMA

REKLAMA

Po wczytaniu strony (obrazu) następuje podział strony. Polega on na analizie „powierzchni” kartki dzięki czemu ustalone zostaje położenie tekstu, grafiki czy tabeli. Na samo koniec stworzona zostaje mapa znaków gdzie zaznaczone są pojedyncze słowa i zdania.

W procesie rozpoznawania znaków program ma za zadanie poprawnie rozpoznać każdą literę, cyfrę czy symbol. Jest to najważniejsza faza gdyż ewentualna pomyłka odbije się na rozpoznaniu całego tekstu. Oprogramowanie typu OCR ulepszane jest już od ponad 40 lat, a wypracowane metody tj. rozpoznawanie wzoru i cech eliminują większość błędów.

Rozpoznawanie cech polega w skrócie na sprawdzaniu pewnych założeń dotyczących każdego ze znaków. Cechy te są niezmienne nawet w gdy tekst pisany jest czcionką pogrubioną lub przechyloną. Za dobry przykład może służyć litera A, która składa się ukośnych linii spotykających się u wierzchołka i poziomej kreski w środku. Programy wykorzystują po kolei kilka metod, które następnie są ze sobą porównywane aby zmniejszyć do minimum ryzyko błędu.

REKLAMA

Rozpoznawanie wzorców to inaczej porównywanie znaków z bazą, która dysponuje program. Zazwyczaj znajdują się w niej różne kroje pisma, które dopasowywane są metodą zero jedynkową. Jest to bardzo czasochłonny proces gdyż każdy element wzorca musi się zgadzać – krój, wytłuszczenie i kursywa.

Dalszy ciąg materiału pod wideo

W następnym kroku program rozpoczyna budowę tekstu posługując się wbudowanymi słownikami. Tworzy on z poszczególnych znaków wyrazy i zdania. Łączą się tu dwie poprzednie fazy (analiza strony i rozpoznawanie tekstu) dzięki czemu tworzenie zdań jest znacznie szybsze.

Po zakończeniu pracy odtworzony tekst zostaje zapisany automatycznie w popularnych formatach jak txt, doc czy PDF.

Wymagania sprzętowe

Programy typu OCR dokonują wielu obliczeń co wiąże się z dość dużym obciążeniem komputera. Wszystko zależy od trudności tekstu, która rozpoznajemy na podstawie kilku czynników:

Ilość stron – duża ilość stron znacznie wydłuża pracę programów OCR, które rozkładają najpierw cały materiał na pojedyncze strony i dopiero potem go analizują

Czystość strony – jeśli strony są zabrudzone litera a mogła by zostać rozpoznana jako ą. Miało by to katastroficzne skutki dlatego programy te wyposażono w system rozpoznania i eliminowania zabrudzeń z cyfrowego obrazu.

Czcionki – Im bardziej skomplikowana czcionka tym gorzej dla OCR-a. Im większa i prostsza czcionka tym szybciej zakończy się praca programu, i tym mniej popełni on błędów.

Kierunek tekstu – nietypowy format lub kierunek tekstu wprowadzają w błąd oprogramowanie przez co sprawdzanie układu trwa dłużej. To samo tyczy się stron zeskanowanych odwrotnie lub krzywo.

Języki obce i specjalistyczne – mimo iż programy mają wbudowane słowniki gramatyczne, językowe i specjalistyczne to niektóre słowa mogą im sprawić problem. Gdy słowo zostanie rozpoznane, a nie będzie go w słowniku zostanie oznaczone jako wymagające sprawdzenia.

Tabele – OCR-y traktują tabele jak obraz, dlatego więcej czasu zajmuje im ich analiza i oddzielenie od siebie tekstu i linii. Później takie materiały są eksportowane do arkuszy kalkulacyjnych.

Pismo odręczne

Niestety algorytmy programów typu OCR nie są jeszcze tak rozbudowane aby odczytywać pismo odręczne. Jednym z powodów jest łączenie przez nas liter i znaków. W miarę zadowalające efekty można osiągnąć pisząc drukowanymi literami. 

Porady internetowe, newsy i ciekawostki - czytaj na internet.wieszjak.pl

Zapisz się na newsletter
Zakładasz firmę? A może ją rozwijasz? Chcesz jak najbardziej efektywnie prowadzić swój biznes? Z naszym newsletterem będziesz zawsze na bieżąco.
Zaznacz wymagane zgody
loading
Zapisując się na newsletter wyrażasz zgodę na otrzymywanie treści reklam również podmiotów trzecich
Administratorem danych osobowych jest INFOR PL S.A. Dane są przetwarzane w celu wysyłki newslettera. Po więcej informacji kliknij tutaj.
success

Potwierdź zapis

Sprawdź maila, żeby potwierdzić swój zapis na newsletter. Jeśli nie widzisz wiadomości, sprawdź folder SPAM w swojej skrzynce.

failure

Coś poszło nie tak

Źródło: Własne

Oceń jakość naszego artykułu

Dziękujemy za Twoją ocenę!

Twoja opinia jest dla nas bardzo ważna

Powiedz nam, jak możemy poprawić artykuł.
Zaznacz określenie, które dotyczy przeczytanej treści:
Autopromocja

REKLAMA

QR Code

REKLAMA

Moja firma
Zapisz się na newsletter
Zobacz przykładowy newsletter
Zapisz się
Wpisz poprawny e-mail
E-rezydencja w Estonii. Już 2,6 tys. Polaków posiada kartę e-Residency. Założenie firmy trwa 5 minut

E-rezydencja w Estonii cieszy się dużą popularnością. Już 2,6 tys. Polaków posiada kartę e-Residency. Firmę zakłada się online i trwa to 5 minut. Następnie wypełnianie dokumentacji i raportowania podatkowego zajmuje około 2-3 minut.

Warszawa tworzy nowy model pomocy społecznej! [Gość Infor.pl]

Jak Warszawa łączy biznes, NGO-sy i samorząd w imię dobra społecznego? W świecie, w którym biznes liczy zyski, organizacje społeczne liczą każdą złotówkę, a samorządy mierzą się z ograniczonymi budżetami, pojawia się pomysł, który może realnie zmienić zasady gry. To Synergia RIKX – projekt Warszawskiego Laboratorium Innowacji Społecznych Synergia To MY, który pokazuje, że wspólne działanie trzech sektorów: biznesu, organizacji pozarządowych i samorządu, może przynieść nie tylko społeczne, ale też wymierne ekonomicznie korzyści.

Spółka w Delaware w 2026 to "must have" międzynarodowego biznesu?

Zbliżający się koniec roku to dla przedsiębiorców czas podsumowań, ale też strategicznego planowania. Dla firm działających międzynarodowo lub myślących o ekspansji za granicę, to idealny moment, by spojrzeć na swoją strukturę biznesową i podatkową z szerszej perspektywy. W dynamicznie zmieniającym się otoczeniu prawnym i gospodarczym, coraz więcej właścicieli firm poszukuje stabilnych, przejrzystych i przyjaznych jurysdykcji, które pozwalają skupić się na rozwoju, a nie na walce z biurokracją. Jednym z najczęściej wybieranych kierunków jest Delaware – amerykański stan, który od lat uchodzi za światowe centrum przyjazne dla biznesu.

ZUS da 1500 zł! Wystarczy złożyć wniosek do 30 listopada 2025. Sprawdź, dla kogo te pieniądze

To jedna z tych ulg, o której wielu przedsiębiorców dowiaduje się za późno. Program „wakacji składkowych” ma dać właścicielom firm chwilę oddechu od comiesięcznych przelewów do ZUS-u. Można zyskać nawet 1500 zł, ale tylko pod warunkiem, że wniosek trafi do urzędu najpóźniej 30 listopada 2025 roku.

REKLAMA

Brak aktualizacji tej informacji w rejestrze oznacza poważne straty - utrata ulg, zwroty dotacji, jeżeli nie dopełnisz tego obowiązku w terminie

Od 1 stycznia 2025 roku obowiązuje już zmiana, która dotyka każdego przedsiębiorcy w Polsce. Nowa edycja Polskiej Klasyfikacji Działalności (PKD) to nie tylko zwykła aktualizacja – to rewolucja w sposobie opisywania polskiego biznesu. Czy wiesz, że wybór niewłaściwego kodu może zamknąć Ci drogę do dotacji lub ulgi podatkowej?

Jak stoper i koncentracja ratują nas przed światem dystraktorów?

Przez lata próbowałem różnych systemów zarządzania sobą w czasie. Aplikacje, kalendarze, kanbany, mapy myśli. Wszystko ładnie wyglądało na prezentacjach, ale w codziennym chaosie pracy menedżera czy konsultanta – niewiele z tego zostawało.

Odpowiedzialność prawna salonów beauty

Wraz z rozszerzającą się gamą ofert salonów świadczących usługi kosmetyczne, rośnie odpowiedzialność prawna osób wykonujących zabiegi za ich prawidłowe wykonanie. W wielu przypadkach zwrot pieniędzy za źle wykonaną usługę to najmniejsza dolegliwość z grożących konsekwencji.

Od 30 grudnia 2025 r. duże i średnie firmy będą musiały udowodnić, że nie przyczyniają się do wylesiania. Nowe przepisy i obowiązki z rozporządzenia EUDR

Dnia 30 grudnia 2025 r. wchodzi w życie rozporządzenie EUDR. Duże i średnie firmy będą musiały udowodnić, że nie przyczyniają się do wylesiania. Kogo dokładnie dotyczą nowe obowiązki?

REKLAMA

Śmierć wspólnika sp. z o.o. a udziały w spółce

Życie pisze różne scenariusze, a dalekosiężne plany nie zawsze udają się zrealizować. Czasem najlepszy biznesplan nie zdoła uwzględnić nieprzewidzianego. Trudno zakładać, że intensywny i odnoszący sukcesy biznesmen nagle zakończy swoją przygodę, a to wszystko przez śmierć. W takich smutnych sytuacjach spółka z o.o. nie przestaje istnieć. Powstaje pytanie – co dalej? Co dzieje się z udziałami zmarłego wspólnika?

Cesja umowy leasingu samochodu osobowego – ujęcie podatkowe po stronie "przejmującego" leasing

W praktyce gospodarczej często zdarza się, że leasingobiorca korzystający z samochodu osobowego na podstawie umowy leasingu operacyjnego decyduje się przenieść swoje prawa i obowiązki na inny podmiot. Taka transakcja nazywana jest cesją umowy leasingu.

REKLAMA