Kā izvilkt atlasīto tekstu no PDF kā vienkārša teksta failu?

How Extract Highlighted Text From Pdf



Runājot par teksta izvilkšanu no PDF failiem, varat izmantot dažas dažādas metodes. Atkarībā no jūsu vajadzībām, iespējams, vēlēsities izmantot PDF uz tekstu pārveidotāju vai arī PDF redaktoru. Šajā rakstā mēs parādīsim, kā izvilkt tekstu no PDF failiem, izmantojot abas metodes.



startcomponentcleanup

Ja jums vienkārši jāizņem daži teksta fragmenti no PDF, ātrs un vienkāršs veids, kā to izdarīt, ir izmantot PDF uz tekstu pārveidotāju. Tiešsaistē ir pieejami daudzi bezmaksas PDF uz tekstu pārveidotāji, piemēram, PDF uz tekstu, PDF2Go un PDF uz Word. Vienkārši augšupielādējiet savu PDF failu un izvēlieties, kuras lapas vēlaties konvertēt. Teksts tiks izvilkts un saglabāts kā TXT fails.





Ja jums ir jāizņem teksts no PDF faila turpmākai rediģēšanai, jums būs jāizmanto PDF redaktors. Adobe Acrobat ir vispopulārākais PDF redaktors, taču tas nav bezmaksas. Tomēr ir pieejami daudzi bezmaksas un atvērtā koda PDF redaktori, piemēram, PDFsam Basic, PDF XChange Editor un LibreOffice Draw. Vienkārši atveriet savu PDF failu PDF redaktorā un atlasiet tekstu, kuru vēlaties izvilkt. Pēc tam tekstu var saglabāt kā TXT vai DOCX failu.





Neatkarīgi no tā, vai jums ir jāizņem teksts no PDF faila turpmākai rediģēšanai vai vienkārši ātri jāizņem teksts no PDF, ir jūsu vajadzībām piemērota metode. Izmēģiniet PDF uz tekstu pārveidotāju, lai ātri un viegli izvilktu tekstu, vai izmantojiet PDF redaktoru, ja jums ir nepieciešama lielāka kontrole pār procesu.



Teksta izcelšana PDF dokumentā ir ērta, lai atzīmētu svarīgus apgabalus, kuriem vēlāk varēsiet ātri piekļūt. tu vari izmantot Microsoft Edge, lai izceltu PDF vai jebkura cita programmatūra ar PDF izcelšanas funkciju. Dažreiz jums var būt nepieciešams tikai atlasītais teksts, lai PDF kopsavilkums saturētu visu pamattekstu. Ja meklējat veidus, kā saglabāt tikai atlasīto tekstu no PDF kā TXT failu, šī ziņa varētu jums noderēt.

Izvilkt atlasīto tekstu no PDF

Ir vairākas bezmaksas programmas un pakalpojumi, lai izvilktu atlasīto tekstu no PDF faila un saglabātu to kā teksta failu:



  • PDF izcelšanas ekstraktors
  • Foxit lasītājs
  • sumnotes.net
  • DyAnnotationExtractor.

Apskatīsim šīs PDF Highlight Extractor programmas pa vienai.

1] PDF izcelšanas ekstrakts

PDF izcelšanas ekstrakts

PDF Highlight Extractor ir viens no vienkāršākajiem veidiem, kā izvilkt izcelto tekstu no PDF faila. Šis atvērtais avots PDF teksta atlases ekstraktors ir divas iezīmes, kas piesaista uzmanību. Jūs varat atlasītā teksta priekšskatījums PDF programmatūras saskarnē.

Otra iezīme ir tā, ka jūs varat iestatiet sākuma vai beigu lapu vai lappušu diapazonu teksta izvilkšanai . Tātad, tā vietā, lai skenētu visu PDF failu, varat noteikt lappušu numurus, lai iegūtu izcelto tekstu.

atjaunināt grafiskos draiverus Windows 10

Vēl viena laba īpašība – jums ir iespēja saglabāt tekstu kā vienkāršu tekstu vai Excel fails .

Savā saskarnē pievienojiet PDF failu, izmantojot šo opciju, un pēc tam noklikšķiniet uz pogas Ekstrakts pogu. Noņemiet atzīmi Visas lapas opciju, ja vēlaties iestatīt lapu diapazonu vai atstāt to tādu, kāds tas ir. Pēc teksta saņemšanas varat to apskatīt. Visbeidzot noklikšķiniet Teksts vai Excel pogu, lai saglabātu atlasīto tekstu.

Jūs varat lejupielādēt šo programmatūru no Šeit . Lai izmantotu šo programmatūru, ir nepieciešama arī Java. Tātad, instalējiet Java (ja vēl nav) un palaidiet šo programmatūru, lai to izmantotu.

2] Foxit Reader

Izvilkt atlasīto tekstu no PDF

Foxit Reader ir viens no Labākie bezmaksas pdf lasītāji . Varat atvērt vairākus PDF failus atsevišķās cilnēs, iezīmēt PDF failu, pievienot piezīmi, komentāru eksports , pievienot parakstus , un vēl. Starp milzīgo funkciju sarakstu ir atlasīta teksta izvilkšana no PDF. Arī šīs funkcijas labākā daļa ir saglabā lappušu numurus kopā ar izvilkto tekstu .

Lai iegūtu atlasīto tekstu no PDF, atveriet PDF failu tā saskarnē un piekļūstiet Komentārs cilne. Šajā cilnē noklikšķiniet uz Eksportēt opcija pieejama Komentāru pārvaldība nodaļā. Tu redzēsi Atlasītais teksts opciju. Izmantojiet šo opciju, un pēc tam visu atlasīto tekstu varēsiet saglabāt kā teksta failu.

Šeit šī ir šīs programmatūras lejupielādes saite. Instalēšanas laikā atlasiet pielāgota uzstādīšana ietver tikai nepieciešamās šīs programmatūras sastāvdaļas.

3] sumnotes.net

sumnotes

Sumnotes.net ir bezmaksas pakalpojums, kas ļauj anotēt PDF failus, kā arī izvilkt iezīmēto tekstu. Viss atlasītais teksts tiek parādīts atsevišķi kreisajā sānjoslā. Izmantojot šo sānjoslu, varat arī noņemiet atlasīto tekstu, kas jums nav nepieciešams un pēc tam ielādējiet pārējo atlasīto tekstu.

meklēt facen

Pirms atlasītā teksta ielādes var norādīt arī lappušu numurus un izslēgt IN izcelts teksts noteiktā krāsā .

Jums ir arī iespēja saglabāt atlasīto tekstu no pdf kā Excel vai vārdu failu. Tātad funkcijas ir labas. Varat reģistrēties bezmaksas plānam un pēc tam ekstrakts 50 izceļ vai anotācijas par lejupielādi kas vairumā gadījumu ir pietiekami.

Šeit saite uz viņa mājas lapu. Lai izvilktu atlasīto tekstu no PDF, pievienojiet PDF failu no datora vai Google disks . Kad PDF ir ielādēts, kreisajā pusē ir redzamas anotācijas un izceltais teksts. Izmantot Lejupielādēt anotācijas opciju un pēc tam varat saglabāt atlasīto tekstu tekstu , XLSX , vai DOC formatēt failu.

4] DyAnnotationExtractor

DyAnnotationExtractor komandrindas programmatūra

Programma DyAnnotationExtractor var palīdzēt iegūt atlasīto tekstu un komentāri no PDF dokumenta. Šis komandrinda programmatūra, bet ļoti viegli lietojama. Tikai viena komanda izvilks ievades PDF failā atlasīto tekstu.

Jūs varat iegūt šo programmatūru, izmantojot šo saiti . Lejupielādējiet tā ZIP failu un pēc tam izvelciet to. Lai atvieglotu komandas palaišanu, arī PDF fails jāievieto tajā pašā mapē, kurā esat izvilcis šo programmatūru. Pēc tam atveriet Komandrinda logs šajā mapē. To var izdarīt, ierakstot cmd šīs mapes adreses laukā un pēc tam noklikšķiniet uz Lai ienāktu taustiņu.

Windows powershell pārtrauca darboties

Kad tiek atvērts CMD logs, pievienojiet šīs programmatūras BAT failu, ievades komandu, tostarp ievades PDF faila ceļu, izvades komandu un izvades faila nosaukumu, kā arī paplašinājumu “.txt”. Pilna komanda būs -

|_+_|

Izpildi komandu. Uzgaidiet dažas sekundes, un būs gatavs vienkāršs teksta fails, kurā ir viss atlasītais teksts un komentāri, kas iegūti no šī PDF. Izvades fails tiek saglabāts tajā pašā ievades mapē.

Lejupielādējiet datora labošanas rīku, lai ātri atrastu un automātiski labotu Windows kļūdas

Tātad, šeit ir dažas iespējas, kuras varat izmantot, lai izvilktu atlasīto tekstu no PDF un pēc tam saglabātu izvadi kā teksta failu. Ceru, ka šī palīdzība.

Populārākas Posts