REKLAMA

REKLAMA

Kategorie
Zaloguj się

Zarejestruj się

Proszę podać poprawny adres e-mail Hasło musi zawierać min. 3 znaki i max. 12 znaków
* - pole obowiązkowe
Przypomnij hasło
Witaj
Usuń konto
Aktualizacja danych
  Informacja
Twoje dane będą wykorzystywane do certyfikatów.

Rozpoznawanie tekstu oszczędza czas pracowników

Łukasz Plewa

REKLAMA

REKLAMA

Przepisywanie tekstów jest nie tylko uciążliwe ale w sposób zatrważający kradnie pracownikom czas, który poświęcić mogliby na pożyteczniejsze zajęcia. Komputery są w tej kwestii o wiele szybsze – poznajmy oprogramowanie do rozpoznawania tekstu.

Programy do rozpoznawania tekstu upowszechniły się wraz ze skanerami. Dzisiaj firma, która nie korzysta z ich dobrodziejstwa zlecając przepisywanie pracownikowi marnuje w rzeczywistości jego potencjał i własne pieniądze. Sam skaner, bez programu pozwoli nam jedynie zeskanować stronę która będzie zapisana w formie obrazu. Aby taki plik edytować obraz należy przetworzyć na tekst. Optyczne rozpoznawanie znaków – bo tak nazywa się ten proces (OCR – Optical Character Recognition) dzieli się na kilka kroków, w których aplikacja po kolei tworzy w pełni czytelny zapis tekstowy.

REKLAMA

REKLAMA

Po wczytaniu strony (obrazu) następuje podział strony. Polega on na analizie „powierzchni” kartki dzięki czemu ustalone zostaje położenie tekstu, grafiki czy tabeli. Na samo koniec stworzona zostaje mapa znaków gdzie zaznaczone są pojedyncze słowa i zdania.

W procesie rozpoznawania znaków program ma za zadanie poprawnie rozpoznać każdą literę, cyfrę czy symbol. Jest to najważniejsza faza gdyż ewentualna pomyłka odbije się na rozpoznaniu całego tekstu. Oprogramowanie typu OCR ulepszane jest już od ponad 40 lat, a wypracowane metody tj. rozpoznawanie wzoru i cech eliminują większość błędów.

Rozpoznawanie cech polega w skrócie na sprawdzaniu pewnych założeń dotyczących każdego ze znaków. Cechy te są niezmienne nawet w gdy tekst pisany jest czcionką pogrubioną lub przechyloną. Za dobry przykład może służyć litera A, która składa się ukośnych linii spotykających się u wierzchołka i poziomej kreski w środku. Programy wykorzystują po kolei kilka metod, które następnie są ze sobą porównywane aby zmniejszyć do minimum ryzyko błędu.

REKLAMA

Rozpoznawanie wzorców to inaczej porównywanie znaków z bazą, która dysponuje program. Zazwyczaj znajdują się w niej różne kroje pisma, które dopasowywane są metodą zero jedynkową. Jest to bardzo czasochłonny proces gdyż każdy element wzorca musi się zgadzać – krój, wytłuszczenie i kursywa.

Dalszy ciąg materiału pod wideo

W następnym kroku program rozpoczyna budowę tekstu posługując się wbudowanymi słownikami. Tworzy on z poszczególnych znaków wyrazy i zdania. Łączą się tu dwie poprzednie fazy (analiza strony i rozpoznawanie tekstu) dzięki czemu tworzenie zdań jest znacznie szybsze.

Po zakończeniu pracy odtworzony tekst zostaje zapisany automatycznie w popularnych formatach jak txt, doc czy PDF.

Wymagania sprzętowe

Programy typu OCR dokonują wielu obliczeń co wiąże się z dość dużym obciążeniem komputera. Wszystko zależy od trudności tekstu, która rozpoznajemy na podstawie kilku czynników:

Ilość stron – duża ilość stron znacznie wydłuża pracę programów OCR, które rozkładają najpierw cały materiał na pojedyncze strony i dopiero potem go analizują

Czystość strony – jeśli strony są zabrudzone litera a mogła by zostać rozpoznana jako ą. Miało by to katastroficzne skutki dlatego programy te wyposażono w system rozpoznania i eliminowania zabrudzeń z cyfrowego obrazu.

Czcionki – Im bardziej skomplikowana czcionka tym gorzej dla OCR-a. Im większa i prostsza czcionka tym szybciej zakończy się praca programu, i tym mniej popełni on błędów.

Kierunek tekstu – nietypowy format lub kierunek tekstu wprowadzają w błąd oprogramowanie przez co sprawdzanie układu trwa dłużej. To samo tyczy się stron zeskanowanych odwrotnie lub krzywo.

Języki obce i specjalistyczne – mimo iż programy mają wbudowane słowniki gramatyczne, językowe i specjalistyczne to niektóre słowa mogą im sprawić problem. Gdy słowo zostanie rozpoznane, a nie będzie go w słowniku zostanie oznaczone jako wymagające sprawdzenia.

Tabele – OCR-y traktują tabele jak obraz, dlatego więcej czasu zajmuje im ich analiza i oddzielenie od siebie tekstu i linii. Później takie materiały są eksportowane do arkuszy kalkulacyjnych.

Pismo odręczne

Niestety algorytmy programów typu OCR nie są jeszcze tak rozbudowane aby odczytywać pismo odręczne. Jednym z powodów jest łączenie przez nas liter i znaków. W miarę zadowalające efekty można osiągnąć pisząc drukowanymi literami. 

Porady internetowe, newsy i ciekawostki - czytaj na internet.wieszjak.pl

Autopromocja

REKLAMA

Źródło: Własne

Oceń jakość naszego artykułu

Dziękujemy za Twoją ocenę!

Twoja opinia jest dla nas bardzo ważna

Powiedz nam, jak możemy poprawić artykuł.
Zaznacz określenie, które dotyczy przeczytanej treści:

REKLAMA

QR Code
Moja firma
Zapisz się na newsletter
Zobacz przykładowy newsletter
Zapisz się
Wpisz poprawny e-mail
Polska prezydencja w UE 2025: priorytety przedsiębiorców to m.in. wzmocnienie i ochrona jednolitego rynku UE w związku z rosnącą rolą Chin i wyborami prezydenckimi w USA

Już z początkiem 2025 roku Polska obejmie prezydencję w Radzie UE. Przedsiębiorcy widzą w tym szanse na kształtowanie unijnej polityki, wspieranie jednolitego rynku oraz odpowiedź na wyzwania związane z globalną konkurencją, rosnącą rolą Chin i zmianami politycznymi w USA. Wśród priorytetów są zwiększenie konkurencyjności UE, bezpieczeństwo energetyczne i poszerzenie Unii o Ukrainę i Mołdawię.

Regulacje ESG w transporcie. Z czym to się wiąże?

Branża TSL nie ma łatwo. Firmy z tego sektora muszą zmierzyć się z nowymi wymogami regulacyjnymi i raportowymi – ESG (Environmental, Social, Governance). Chodzi o poprawę standardów środowiskowych, społecznych i zarządzania korporacyjnego. Któe regulacje już są w Europie obowiązkowe, a na które jeszcze czekamy? I najważniejsze - ile trzeba na to wydać i co grozi za ignorowanie tych zmian? 

Na jakie reformy czeka rynek pracy?

Przedsiębiorcy oczekują większego wsparcia od rządu, zwłaszcza w kwestii aktywizacji grup niedoreprezentowanych na rynku pracy. Chcieliby również zmniejszenia kosztów zatrudnienia i zapewnienia dostępu do kandydatów z państw trzecich. Nawołują także do stworzenia warunków sprzyjających rozwojowi kompetencji i kwalifikacji zawodowych. 

Maksymalizacja bezpieczeństwa: Dlaczego oprogramowanie on-premise ma kluczowe znaczenie w świecie zdominowanym przez SaaS?

Jak wynika z szacunków Gartnera, już za 3 lata aż 75 proc. przedsiębiorstw będzie traktować tworzenie kopii zapasowych aplikacji typu SaaS (Oprogramowanie jako Usługa) jako wymóg krytyczny. Jeszcze w tym roku było to 15 proc . Ta istotna różnica wynika z oceny ryzyka. O ile oprogramowanie dostępne w modelu SaaS jest coraz częstszym wyborem organizacji na całym świecie, kluczowe staje się zapewnienie, że przechowywane tam dane są zarówno dobrze chronione, jak i możliwe do odzyskania. W tym kontekście zasadne może być pytanie o dostępne alternatywy, a zwłaszcza możliwość korzystania z tradycyjnego oprogramowania on-premise, które jest instalowane i zarządzane lokalnie.

REKLAMA

3 cechy innowacyjnego przedsiębiorstwa. Jak ważna jest ochrona środowiska? [WYWIAD]

Co dziś często przesądza o wyborze kontrahenta? Jak ważna jest ochrona środowiska w świecie biznesu? Jakie proste rozwiązania mogą wprowadzić wszystkie przedsiębiorstwa branży ogrodniczej? O 3 głównych cechach innowacyjności opowiada członek zarządu przedsiębiorstwa W.Legutko, Adam Legutko.

Jak chronić firmowe pieniądze przez utratą wartości

Wielu przedsiębiorców zastanawia się jak uchronić swój kapitał w czasach wysokiej inflacji. Podobnie jak oni, ich pieniądze powinny pracować. Bank Pekao ma propozycję dla prowadzących działalność gospodarczą, spółkę cywilną lub osobową z uproszczoną księgowością, pozwalającą łączyć wysokie oprocentowanie z elastycznością

Nowe zasady naliczania składki zdrowotnej od 1 stycznia 2025 r. Rząd jest za wprowadzeniem zmian. Co się zmieni?

Nowe zasady naliczania składki zdrowotnej od 1 stycznia 2025 r. Rząd jest za wprowadzeniem zmian. Co się zmieni? Szacuje się, że z tego rozwiązania skorzysta ok. 2,4 mln przedsiębiorców. Rada ministrów przyjęła projekt nowelizacji.

Prognozy na 2025 rok: jakie trendy będą kształtować przyszłość biznesu e-commerce?

Jakie trendy ukształtują branżę e-commerce w nadchodzącym 2025 roku? Jakie narzędzia powinny wykorzystać firmy, żeby się rozwijać?

REKLAMA

InPost Pay – rewolucyjna usługa dla Twojego e-sklepu

W dobie ogromnej konkurencji na rynku e-commerce kluczem do sukcesu jest wyróżnienie się i zwiększenie wygody zakupów dla klientów. InPost Pay to rozwiązanie, które może odmienić oblicze Twojego sklepu internetowego, pomagając zwiększyć konwersję dzięki nowoczesnym udogodnieniom. Dowiedz się, dlaczego warto wdrożyć tę usługę i co możesz dzięki niej zyskać!

Wakacje składkowe 2024 tylko za grudzień. Wniosek trzeba złożyć już w listopadzie

Z wakacji składkowych w 2024 roku można skorzystać już tylko za grudzień. Natomiast wniosek trzeba złożyć już w listopadzie. Państwo opłaci składki za jeden miesiąc za mikroprzedsiębiorców i komorników sądowych. Jakie warunki trzeba spełnić?

REKLAMA