| IFK | IRB | INFORLEX | GAZETA PRAWNA | INFORORGANIZER | APLIKACJA MOBILNA | PRACA W INFOR | SKLEP
reklama
Jesteś tutaj: STRONA GŁÓWNA > Moja firma > Biznes > Firma > e-Firma > Sprzęt biurowy i sieci > Dlaczego rozpoznawanie tekstu jest pracochłonne?

Dlaczego rozpoznawanie tekstu jest pracochłonne?

Rozpoznawanie tekstu to ciężka praca nawet dla wydajnych komputerów. Aby jak najbardziej odciążyć maszynę, opracowywano nawet specjalne czcionki, których znaki są łatwiejsze do rozpoznania. Doskonale wiemy, jak funkcja OCR może ułatwić pracę w biurze i domu. Dlaczego proces OCR tak mocno obciąża komputer?

Zacznijmy od początku, a mianowicie od nietypowego kierunku tekstu, który ma znaczący wpływ na cały proces rozpoznawania tekstu. Teksty o nietypowym formacie, przebiegające na przykład w poprzek strony, mogą zakłócić proces rozpoznawania tekstu. W związku z tym, program OCR musi najpierw poznać układ tekstu, aby przejść do dalszych etapów. Jeśli strona jest zeskanowana do góry nogami lub krzywo, program automatycznie przywróci jej prawidłowe ustawienie. Niestety wszystkie te operacje wymagają sporych zasobów komputera, i w przypadku słabszych maszyn działają dość wolno.

Zobacz również: Sklepy internetowe i serwisy społecznościowe – dobre połączenie?

Największym wyzwaniem dla programów OCR i oczywiście dla komputera jest rozpoznawanie wielu stron z rzędu. Po prostu wszystkie metody rozpoznawania są skuteczne tylko na pojedynczych stronach. Na wielu stronach program musi powtarzać operacje dla każdej kartki z osobna. Aby „ogarnąć” taki plik dokumentów, programy zaczynają od dzielenia wielostronicowych dokumentów, na przykład dwustronicowych tabel, na pojedyncze strony, następnie rozpoznają tekst strona po stronie. Dopiero na koniec znów łączą wyniki w wielostronicowy dokument, a to zajmuje czas i spore zasoby systemowe.

Sprawdź: Co jest największym wrogiem komputerów?

Kolejne problemy mogą sprawić czcionki. Warto pamiętać, że rozpoznawanie tekstu działa najlepiej na dobrze czytelnych czcionkach, takich jak Times lub Courier. Jeśli czcionki w dokumencie są małe lub wyjątkowo ozdobne, sprawią programowi do OCR sporo problemów. Im mniejsza i bardziej zawiła czcionka, tym więcej błędów użytkownik musi poprawiać ręcznie, a niekiedy poprawianie drobnych błędów i późniejsze sprawdzanie, czy wszystko jest w porządku trwa dłużej, niż ręczne przepisanie całej strony.

reklama

Narzędzia przedsiębiorcy

POLECANE

Dotacje dla firm

reklama

Ostatnio na forum

Fundusze unijne

Pomysł na biznes

Eksperci portalu infor.pl

Enadis

Oprogramowanie dla biznesu

Zostań ekspertem portalu Infor.pl »