Gane rubutu a cikin fayil na PDF a kan layi.


Ba koyaushe yana iya cire rubutu daga fayil ɗin PDF ba ta amfani da kwafi na al'ada. Sau da yawa shafukan irin wannan takardun su ne abubuwan da aka ƙididdige su a cikin takardun su. Don sauya irin fayiloli zuwa cikakkun bayanai na rubutu, za a yi amfani da shirye-shirye na musamman tare da aiki na Tsira na Abubuwa (Optical Character Recognition (OCR).

Irin wannan matsala suna da matukar wuya a aiwatar da, sabili da haka, farashi mai yawa kudi. Idan kana buƙatar fahimtar rubutu tare da PDF a kai a kai, yana da kyau don sayen shirin da ya dace. Ga wasu lokuta masu wuya, zai zama mafi mahimmanci don amfani da ɗaya daga cikin ayyukan kan layi tare da ayyuka masu kama da juna.

Yadda za a gane rubutu daga PDF a layi

Tabbas, ayyukan saitunan OCR da aka samar a kan layi sun fi iyaka idan an kwatanta su da mafita. Amma zaka iya aiki tare da irin wannan albarkatun ko dai don kyauta, ko don kuɗi maras muhimmanci. Abu mafi mahimmanci shi ne cewa aikace-aikacen yanar gizon da aka dace su jimre da babban aikin su, wato ƙwarewar rubutu, kazalika.

Hanyar 1: ABBYY FineReader Online

Kamfanin ci gaba na sabis yana daya daga cikin shugabannin a cikin filin kayan aiki mai kyan gani. ABBYY FineReader na Windows da kuma Mac yana da mahimman bayani don canza PDF zuwa rubutu da aiki tare da shi.

Abokan yanar gizo na shirin, ba shakka, ba shi da ƙari a ciki a cikin aiki. Duk da haka, sabis ɗin zai iya gane rubutu daga lakabi da hotuna a fiye da harsuna 190. Tana goyon bayan sake fasalin fayiloli PDF zuwa takardun Kalma, Excel, da dai sauransu.

ABBYY FineReader Online sabis na kan layi

  1. Kafin ka fara aiki tare da kayan aiki, ƙirƙirar asusu akan shafin ko shiga ta amfani da Facebook, Google ko asusun Microsoft.

    Don zuwa taga mai shiga, danna kan maballin. "Shiga" a saman mashaya na menu.
  2. Da zarar an shiga, shigo da rubutun da ake bukata a PDF zuwa FineReader ta amfani da maballin "Shigar da Fayilolin".

    Sa'an nan kuma danna "Zaɓi lambobin shafi" kuma saka lokacin da ake bukata domin fahimtar rubutu.
  3. Kusa, zaɓi harsunan da aka gabatar a cikin takardun, yadda tsarin fayil ɗin ya fito kuma danna maballin "Gane".
  4. Bayan aiki, tsawon lokaci ya dogara ne akan girman takardun, zaka iya sauke fayil ɗin da aka kammala tare da bayanan rubutu kawai ta latsa sunansa.

    Ko kuma aika shi zuwa ɗaya daga cikin sabis na girgije mai samuwa.

Ana rarrabe sabis ɗin, watakila, ta hanyar mafi daidaitattun rubutu an gane algorithms a cikin hotuna da fayilolin PDF. Amma, da rashin alheri, ana amfani da ita kyauta ga shafuka guda biyar da aka sarrafa kowace wata. Don yin aiki tare da wasu takardun mota, dole ka saya takardar shekara daya.

Duk da haka, idan ana buƙatar aikin OCR sosai, ABBYY FineReader Online shine babban zaɓi don cirewa daga matakan kananan fayilolin PDF.

Hanyar 2: Free OCR Kan layi

Sabis mai sauƙi da m don ƙin rubutu. Ba tare da bukatar yin rajistar ba, hanya zata ba ka damar ganewa shafukan PDF 15 a kowace awa. Aikin OCR na yau da kullum yana aiki tare da takardu a cikin harsuna 46 kuma ba tare da izinin goyon bayan samfurin fitarwa guda uku - DOCX, XLSX da TXT ba.

A lokacin yin rijistar, mai amfani yana iya aiwatar da takardu masu yawa, amma yawan kyauta na waɗannan shafukan suna iyakance zuwa raka'a 50.

Sabis na kan layi ta OCR kyauta na kan layi

  1. Don gane rubutun daga PDF a matsayin "bako", ba tare da izni a kan hanya ba, yi amfani da hanyar da ta dace a kan shafin yanar gizon.

    Zaɓi rubutun da ake bukata ta amfani da maɓallin "Fayil", saka ainihin harshen rubutu, tsarin fitarwa, sa'annan jira fayil don ɗaukarwa kuma danna "Sanya".
  2. A ƙarshen tsarin digitization, danna "Sauke fayil ɗin fitarwa" don ajiye rubutun da aka kammala tare da rubutu a kan kwamfutar.

Ga masu amfani masu izini, jerin ayyukan suna da bambanci.

  1. Yi amfani da maɓallin "Rajista" ko "Shiga" a cikin jerin menu na sama don, bi da bi, ƙirƙirar asusun yanar gizon kyauta ta yanar gizo kyauta ko shiga cikin shi.
  2. Bayan izini a cikin panel, ka riƙe maɓallin kewayawa "CTRL", zaɓi har zuwa harsuna biyu na rubutun tushe daga jerin da aka bayar.
  3. Saka ƙarin zaɓuɓɓuka domin cirewa daga rubutu daga PDF kuma danna maballin. "Zaɓi Fayil" don ɗaukar daftarin aiki a cikin sabis.

    Sa'an nan, don fara ganewa, danna "Sanya".
  4. Bayan yin aiki da takardun, danna kan mahaɗin da sunan fayil ɗin fitarwa a cikin shafi na daidai.

    Sakamakon yakamata za a ajiye shi nan da nan a ƙwaƙwalwar ajiyar kwamfutarka.

Idan kana buƙatar cire rubutu daga karamin takardun PDF, zaka iya samun damar yin amfani da kayan aiki da aka bayyana a sama. Don yin aiki tare da manyan fayiloli, dole ne ku saya ƙarin alamomi a cikin OCR na Kan layi kyauta ko ku nemi wani bayani.

Hanyar 3: NewOCR

Sabis ɗin OCR kyauta kyauta wanda ke ba ka damar cire rubutu daga kusan kowane kayan aikin fasaha kamar na DjVu da PDF. Wannan hanya ba ta sanya haruffa a kan girman da yawan fayiloli masu ganewa ba, bazai buƙatar rajista, kuma yana ba da dama ga ayyuka masu dangantaka.

NewOCR na goyan bayan harsuna 106 kuma yana iya daidaitawa ko da takardun rubutu mara kyau. Zai yiwu a zaɓi yankin don fahimtar rubutu a kan fayil ɗin fayil.

Sabis na kan layi na NewOCR

  1. Saboda haka, zaku iya fara aiki tare da hanya nan da nan, ba tare da buƙatar yin aikin da ba dole ba.

    A tsaye a kan babban shafi akwai nau'i don sayo daftarin aiki zuwa shafin. Don ajiye fayil zuwa NewOCR, yi amfani da maballin "Zaɓi fayil" a cikin sashe "Zaɓi fayil naka". Sa'an nan kuma a filin "Harshe mai ladabi" (s) " zaɓa ɗaya ko fiye harsuna daga cikin rubutun tushe, sa'an nan kuma danna "Sanya + OCR".
  2. Saita saitunan da aka fi so, zaɓi shafin da ake so don cire rubutun, kuma danna maballin. "OCR".
  3. Gungura ƙasa da bit kuma sami maɓallin. Saukewa.

    Danna kan shi kuma a cikin jerin zaɓuɓɓuka zaɓi tsarin buƙatar da ake bukata don saukewa. Bayan haka, za a sauke fayil ɗin da aka kammala tare da rubutun da aka samo zuwa kwamfutarka.

Kayan aiki yana dacewa kuma yana gane duk haruffa a cikin inganci sosai. Duk da haka, dole ne a kaddamar da aikin kowane shafi na takardun PDF ɗin da aka shigo da shi kuma a nuna shi a cikin fayil din. Kuna iya, ba shakka, nan da nan ka kwafa sakamakon binciken a cikin allo ɗin allo kuma ka haɗa su da wasu.

Duk da haka, an ba da nuance na sama, yawancin rubutu ta amfani da NewOCR suna da wuyar cirewa. Tare da wannan nau'in fayiloli na kananan fayiloli yana "tare da bang."

Hanyar 4: OCRSpace

Wata hanya mai sauƙi da fahimta don rubutun rubutu yana ba ka damar gane takardun PDF da kuma samar da sakamakon a cikin fayil na TXT. Babu iyaka akan yawan shafuka. Ƙuntataccen kawai shi ne girman girman rubutun shigarwa bai kamata ya wuce 5 megabytes ba.

Sabis ɗin yanar gizo na OCRSpace

  1. Rijista don aiki tare da kayan aiki bai zama dole ba.

    Kawai danna kan mahaɗin da ke sama da kuma aika da rubutun PDF ɗin zuwa shafin yanar gizo daga kwamfutarka ta amfani da maballin "Zaɓi fayil" ko daga cibiyar sadarwa - ta hanyar tunani.
  2. A cikin jerin zaɓuka "Zaɓi harshen OCR" zaɓi harshen da aka shigo da shi.

    Sa'an nan kuma fara tsarin shigar da rubutu ta danna kan maballin. "Fara OCR!".
  3. A karshen aiki na fayil, duba sakamakon a cikin "Sakamakon OCR" kuma danna Saukewadon sauke daftarin aikin TXT.

Idan kawai kuna buƙatar cire rubutun daga PDF kuma tsari na ƙarshe bai da muhimmanci ba, OCRSpace yana da kyau. Kundin takardun kawai dole ne ya kasance "ƙaura", tun da yake ba a samar da harsuna biyu ko fiye a lokaci ɗaya ba a cikin sabis ɗin.

Duba kuma: Analogues analogues FineReader

Ana nazarin kayan aiki na kan layi wanda aka gabatar a cikin labarin, ya kamata a lura cewa FineReader Online daga ABBYY yana aiki da OCR mafi dacewa da kuma daidai. Idan matsakaicin daidaito na fahimtar rubutu yana da mahimmanci a gare ku, yana da kyau a yi la'akari da wannan zaɓi. Amma don biyan kuɗin, mafi mahimmanci, ma yana da.

Idan kana buƙatar digiti ƙananan takardun kuma kana shirye don gyara kurakurai a sabis naka, yana da kyau don amfani da NewOCR, OCRSpace ko Free OCR na Intanit.