Hoe gemarkeerde tekst uit PDF als tekstbestand extraheren?

Het markeren van tekst in een PDF - document is handig om de belangrijke gebieden te markeren die u later snel kunt openen. U kunt Microsoft Edge gebruiken om PDF(Microsoft Edge to highlight PDF)  of andere software te markeren die wordt geleverd met de functie voor het markeren van PDF 's. Soms had u ook de behoefte om alleen de gemarkeerde tekst te hebben, zodat u de samenvatting van de PDF kunt hebben die alle essentiële tekst bevat. Als u op zoek bent naar manieren om alleen gemarkeerde tekst uit een PDF op te slaan als een TXT -bestand, dan kan dit bericht nuttig zijn.

Gemarkeerde tekst uit PDF extraheren

Er is een aantal gratis software en een service om gemarkeerde tekst uit een PDF -bestand te extraheren en op te slaan als een tekstbestand:

  • PDF-markeringsextractor
  • Foxit Reader
  • Sumnotes.net
  • DyAnnotationExtractor.

Laten we deze PDF Highlight Extractor -software een voor een bekijken.

1] PDF-markeringsextractor

PDF Highlight Extractor-software

PDF Highlight Extractor is een van de gemakkelijkste opties om de gemarkeerde tekst uit een PDF -bestand te extraheren. Deze open-source PDF-extractor voor tekstmarkeringen(PDF text highlight extractor) heeft twee functies die de aandacht trekken. U kunt een voorbeeld van gemarkeerde tekst(preview highlighted text) van PDF bekijken op de software-interface.

De tweede functie is dat u de begin- of eindpagina of het paginabereik kunt instellen om de tekst te extraheren(set start or end page or page range to extract the text) . Dus in plaats van de hele PDF te scannen , kunt u paginanummers definiëren om de gemarkeerde tekst te krijgen.

Een andere goede eigenschap is dat je de mogelijkheid hebt om tekst op te slaan als platte tekst(save text as plain text) of Excel-bestand(Excel file) .

Voeg op de interface uw PDF -bestand toe met behulp van de gegeven optie en druk vervolgens op de knop Uitpakken(Extract) . Schakel de optie Alle pagina's(All Pages) uit als u het paginabereik wilt instellen of het wilt laten zoals het is. Zodra de tekst is opgehaald, kunt u er een voorbeeld van bekijken. Druk ten slotte op de knop Tekst(Text) of Excel om de gemarkeerde tekst op te slaan.

U kunt deze software hier(here) downloaden . Java is ook nodig om deze software te gebruiken. Installeer dus Java (indien nog niet) en voer deze software uit om te gebruiken.

2] Foxit-lezer

Gemarkeerde tekst uit PDF extraheren

Foxit Reader is een van de beste gratis PDF-lezers . U kunt meerdere PDF- bestanden openen in afzonderlijke tabbladen, (PDF)PDF markeren , een notitie toevoegen, opmerkingen exporteren(export comments) , handtekeningen toevoegen(add signatures) en meer. Onder de enorme lijst met functies is er ook het extraheren van gemarkeerde tekst uit PDF . Het beste van deze functie is dat het ook paginanummers opslaat samen met de geëxtraheerde tekst(saves page numbers along with the extracted text) .

Om gemarkeerde tekst uit PDF op te halen , opent u het PDF -bestand op de interface en opent u het tabblad Opmerking . (Comment)Klik op dat tabblad op de optie Exporteren(Export) die beschikbaar is in het gedeelte Opmerkingen beheren(Manage Comments) . U ziet de optie Gemarkeerde tekst(Highlighted Text) . Gebruik die optie en dan kunt u alle gemarkeerde tekst opslaan als een tekstbestand.

Hier(Here) is de downloadlink voor deze software. Tijdens de installatie moet u aangepaste installatie(custom installation) selecteren om alleen de vereiste componenten van deze software op te nemen.

3] Sumnotes.net

Somnoten

Sumnotes.net is een gratis service waarmee u aantekeningen kunt maken in PDF 's en de gemarkeerde tekst kunt extraheren. Alle gemarkeerde tekst is afzonderlijk zichtbaar in de linkerzijbalk. Met behulp van die zijbalk kunt u ook gemarkeerde tekst verwijderen die u niet nodig hebt(remove highlighted text that you don’t need) en vervolgens de rest van de gemarkeerde tekst downloaden.

Voordat u de gemarkeerde tekst downloadt, kunt u ook paginanummers opnemen en de gemarkeerde tekst met een specifieke kleur (highlighted text of specific color)uitsluiten(exclude) .

U hebt ook de mogelijkheid om gemarkeerde tekst uit PDF op te slaan als Excel-(save highlighted text from PDF as Excel) of Word -bestand. Dus de eigenschappen zijn goed. U kunt zich aanmelden met een gratis abonnement en vervolgens 50 hoogtepunten(extract 50 highlights) of annotaties per download extraheren , wat in de meeste gevallen voldoende is.

Hier(Here) is de link naar zijn homepage. Om gemarkeerde tekst uit PDF te extraheren , voegt u een PDF toe vanaf pc of Google Drive . Wanneer de PDF is geüpload, zijn aan de linkerkant annotaties en gemarkeerde tekst zichtbaar. Gebruik de optie Download annotaties(Download Annotations) en dan kunt u de gemarkeerde tekst opslaan in TXT- , XLSX- of DOC -formaat.

4] DyAnnotationExtractor

DyAnnotationExtractor-opdrachtregelsoftware

DyAnnotationExtractor- software kan u helpen gemarkeerde tekst en opmerkingen(comments) uit een PDF-document te extraheren. Het is een opdrachtregelsoftware(command-line) , maar het gebruik ervan is heel eenvoudig. Slechts een enkele opdracht haalt de tekst op die is gemarkeerd in het invoer - PDF -bestand.

U kunt deze software verkrijgen via deze link(this link) . Download het ZIP -bestand en pak het uit. Om het gemakkelijker te maken om de opdracht uit te voeren, moet u de PDF ook in dezelfde map plaatsen waar u deze software hebt uitgepakt. Open daarna het opdrachtpromptvenster(Command Prompt) in die map. U kunt dat doen door cmd in het adresvak van die map te typen en vervolgens op de Enter - toets te drukken.

Wanneer het CMD - venster is geopend, voegt u het BAT -bestand van deze software, de invoeropdracht inclusief het pad van de invoer - PDF , de uitvoeropdracht en de naam van het uitvoerbestand toe, samen met de extensie '.txt'. De volledige opdracht wordt-

DyAnnotationExtractor.bat -input path of input PDF -output outputfilename.txt

Voer de opdracht uit. Wacht(Wait) een paar seconden en het platte tekstbestand is klaar met alle gemarkeerde tekst en opmerkingen die uit die PDF zijn opgehaald . Het uitvoerbestand wordt in dezelfde invoermap opgeslagen.

Dit zijn dus enkele opties die u kunt gebruiken om gemarkeerde tekst uit PDF te extraheren en de uitvoer vervolgens op te slaan als een tekstbestand. Hoop(Hope) dat deze helpen.



About the author

Ik ben een computerprofessional met meer dan 10 jaar ervaring. In mijn vrije tijd help ik graag aan een bureau en leer ik kinderen internetten. Mijn vaardigheden omvatten veel dingen, maar het belangrijkste is dat ik weet hoe ik mensen kan helpen bij het oplossen van problemen. Als je iemand nodig hebt die je kan helpen met iets dringends of gewoon wat basistips wilt, neem dan contact met me op!



Related posts