5 gratis online OCR-services getest en beoordeeld

Heeft u een PDF -document of een afbeelding die u naar tekst wilt converteren? Onlangs stuurde iemand me een document per post dat ik moest bewerken en terugsturen met correcties. De persoon kon geen digitale kopie vinden, dus kreeg ik de taak om al die tekst in digitaal formaat te krijgen.

Het was onmogelijk dat ik uren zou besteden om alles weer in te typen, dus ik nam uiteindelijk een mooie foto van hoge kwaliteit van het document en bladerde me vervolgens een weg door een aantal online OCR - services om te zien welke me het beste zou geven resultaten.

In dit artikel zal ik een paar van mijn favoriete sites voor OCR doornemen die gratis zijn. Het is vermeldenswaard dat de meeste van deze sites een gratis basisservice bieden en vervolgens betaalde opties hebben als u extra functies wilt, zoals grotere afbeeldingen, PDF - documenten met meerdere pagina's, verschillende invoertalen, enz.

Het is ook goed om vooraf te weten dat de meeste van deze services niet in staat zullen zijn om de opmaak van uw originele document te evenaren. Deze zijn voornamelijk voor het extraheren van tekst en dat is alles. Als u alles in een specifieke lay-out of indeling wilt hebben, moet u dat handmatig doen zodra u alle tekst uit de OCR hebt gehaald .

Bovendien zullen de beste resultaten voor het verkrijgen van de tekst komen van documenten met een resolutie van 200 tot 400 DPI . Als u een afbeelding met een lage DPI heeft, zullen de resultaten niet zo goed zijn.

Ten slotte waren er veel sites die ik heb getest die gewoon niet werkten. Als u Google gratis online OCR gebruikt, ziet u een heleboel sites, maar verschillende sites in de top 10 resultaten hebben de conversie niet eens voltooid. Sommige hadden een time-out, andere gaven fouten en sommige bleven gewoon hangen op de "converterende" pagina, dus ik nam niet eens de moeite om die sites te noemen.

Voor elke site heb ik twee documenten getest om te zien hoe goed de uitvoer zou zijn. Voor mijn tests heb ik gewoon mijn iPhone 5S gebruikt om een ​​foto van beide documenten te maken en deze vervolgens rechtstreeks naar de websites te uploaden voor conversie.

Als je wilt zien hoe de afbeeldingen eruit zagen die ik voor mijn test heb gebruikt, heb ik ze hier bijgevoegd: Test1 en Test2 . Houd er rekening mee dat dit niet de versies met volledige resolutie zijn van de afbeeldingen die met de telefoon zijn gemaakt. Ik heb de afbeelding met volledige resolutie gebruikt bij het uploaden naar de sites.

OnlineOCR

OnlineOCR.net is een schone en eenvoudige site die zeer goede resultaten opleverde in mijn test. Het belangrijkste dat ik er leuk aan vind, is dat het niet overal massa's advertenties heeft, wat meestal het geval is met dit soort nicheservicesites.

gratis online ocr

Selecteer om te beginnen uw bestand en wacht tot het uploaden is voltooid. De maximale uploadgrootte voor deze site is 100 MB. Als u zich registreert voor een gratis account, krijgt u een paar extra functies zoals de grotere uploadgrootte, PDF's met meerdere pagina's , verschillende invoertalen, meer conversies per uur, enz.

Kies vervolgens uw invoertaal en kies vervolgens het uitvoerformaat. U kunt kiezen uit Word , Excel of Platte tekst(Plain Text) . Klik(Click) op de knop Converteren(Convert) en u ziet de tekst onderaan in een vak samen met een downloadlink.

ocr-uitvoer

Als u alleen de tekst wilt, kopieert en plakt u deze uit het vak. Ik stel echter voor dat u het Word -document downloadt, omdat het verrassend goed werk levert om de lay-out van het originele document te behouden.

Toen ik bijvoorbeeld het Word -document voor mijn tweede test opende, was ik verrast dat het document een tabel met drie kolommen bevatte, net als in de afbeelding.

online ocr-uitvoer

Van alle sites was deze veruit de beste. Het is absoluut de moeite waard om je voor te registreren als je veel conversies moet doen.

Voor de volledigheid ga ik ook een koppeling maken naar de uitvoerbestanden die door elke service zijn gemaakt, zodat u de resultaten zelf kunt zien. Hier zijn de resultaten van OnlineOCR : Test1 Doc en Test2 Doc .

Houd er rekening mee dat wanneer u deze Word - documenten op uw computer opent, u een bericht in Word krijgt waarin staat dat het van internet is en dat bewerken is uitgeschakeld. Dat is prima, want Word vertrouwt geen documenten van internet en je hoeft echt geen bewerking aan te zetten als je het document alleen wilt bekijken.

i2OCR

Een andere site die behoorlijk goede resultaten opleverde, was i2OCR . Het proces is vergelijkbaar: kies uw taal, bestand en druk vervolgens op Tekst extraheren(Extract Text) .

i2ocr

Je zult hier een minuut of twee moeten wachten omdat deze site wat langer duurt. Zorg er in stap 2(Step 2) ook voor dat uw afbeelding met de goede kant naar boven wordt weergegeven in het voorbeeld, anders krijgt u een hoop gebrabbel als uitvoer. Om de een of andere reden werden de afbeeldingen van mijn iPhone in staande modus weergegeven op mijn computer, maar liggend toen ik ze naar deze site uploadde.

i2ocr-uitgang

Ik moest de afbeelding handmatig openen in een app voor het bewerken van foto's, deze 90 graden draaien, vervolgens terugdraaien naar portret en vervolgens opnieuw opslaan. Eenmaal(Once) voltooid, scrolt u naar beneden en ziet u een voorbeeld van de tekst samen met een downloadknop.

Deze site deed het redelijk goed met de uitvoer voor de eerste test, maar deed het niet zo goed met de tweede test met de kolomlay-out. Hier zijn de resultaten van i2OCR: Test1 Doc en Test2 Doc .

gratisOCR

Free-OCR.com neemt uw afbeeldingen en zet ze om in platte tekst. Het heeft geen optie om te exporteren naar Word -formaat. Kies uw bestand, selecteer een taal en klik vervolgens op Start .

De site is snel en je krijgt de output vrij snel. Klik gewoon(Just) op de link om het tekstbestand naar uw computer te downloaden.

freeocr

Zoals met NewOCR hieronder vermeld, zet deze site alle T's in het document in hoofdletters. Ik heb geen idee waarom het dat zou doen, maar om de een of andere vreemde reden deden deze site en NewOCR dit allebei. Het is niet erg om het te veranderen, maar het is een vervelend proces dat je eigenlijk niet zou moeten doen.

Hier zijn de resultaten van FreeOCR: Test1 Doc en Test2 Doc .

ABBYY FineReader Online

Om FineReader Online te gebruiken , moet u zich registreren voor een account, waarmee u een gratis proefperiode van 15 dagen krijgt voor OCR tot 10 pagina's gratis. Als u slechts een eenmalige OCR voor een paar pagina's hoeft uit te voeren, kunt u deze service gebruiken. Zorg(Make) ervoor dat u op de verificatielink in de bevestigingsmail klikt nadat u zich hebt geregistreerd.

finereader online

Klik bovenaan op Herkennen en klik vervolgens op (Recognize)Uploaden(Upload) om je bestand te selecteren. Kies je taal, uitvoerformaat en klik vervolgens op Herkennen(Recognize) onderaan. Deze site heeft een schone interface en ook geen advertenties.

In mijn tests kon deze site de tekst uit het eerste testdocument halen, maar het was absoluut enorm toen ik het Word - document opende, dus ik deed het uiteindelijk opnieuw en koos Platte tekst(Plain Text) als het uitvoerformaat.

Voor de tweede test met de kolommen was het Word - document leeg en kon ik de tekst niet eens vinden. Ik weet niet zeker wat daar gebeurde, maar het lijkt niets anders aan te kunnen dan eenvoudige alinea's. Hier zijn de resultaten van FineReader: Test1 Doc en Test2 Doc .

NieuwOCR

De volgende site, NewOCR.com , was OK, maar lang niet zo goed als de eerste site. Ten eerste heeft het advertenties, maar gelukkig geen ton. U selecteert eerst uw bestand en klikt vervolgens op de knop Voorbeeld(Preview) .

afbeelding uploaden

Vervolgens kunt u de afbeelding draaien en het gebied aanpassen waar u naar tekst wilt scannen. Het lijkt een beetje op hoe het scanproces werkt op een computer met een aangesloten scanner.

ocr afbeelding

Als het document meerdere kolommen heeft, kunt u de knop Analyse pagina-indeling( Page layout analysis) aanvinken en zal proberen de tekst in kolommen op te splitsen. Klik(Click) op de OCR -knop, wacht een paar seconden totdat deze is voltooid en scrol vervolgens naar beneden wanneer de pagina wordt vernieuwd.

In de eerste test kreeg het alle tekst correct, maar om de een of andere reden werd elke T in het document met een hoofdletter geschreven! Geen idee waarom het dat zou doen, maar het deed het. In de tweede test met pagina-analyse ingeschakeld, kreeg het de meeste tekst, maar de lay-out was volledig uitgeschakeld.

Hier zijn de resultaten van NewOCR: Test1 Doc  en Test2 Doc .

Conclusie

Zoals je kunt zien, geeft gratis je helaas meestal niet echt goede resultaten. De eerstgenoemde site is verreweg de beste omdat deze niet alleen uitstekend alle tekst herkende, maar ook het formaat van het originele document wist te behouden.

Als u echter alleen tekst nodig heeft, zouden de meeste van de bovenstaande websites dat voor u moeten kunnen doen. Als je vragen hebt, voel je vrij om commentaar te geven. Genieten van!



About the author

Hallo daar! Ik ben een computerprogrammeur met meer dan 10 jaar ervaring in het veld. Ik ben gespecialiseerd in het ontwikkelen en onderhouden van software voor smartphones en windows updates. Daarnaast bied ik mijn diensten aan als een maandelijkse ondersteuningsmedewerker voor e-mailclients.



Related posts