OCR combineren met AI en RPA voor geavanceerde gegevensanalyse

Dit bericht is mede geschreven door Cosmin Nicolae. Nicolae is een productmanager bij UiPath.

Ongestructureerde gegevens zijn overal, verstopt op plaatsen zoals documenten, audiobestanden, video's, e-mails, afbeeldingen en logbestanden - de lijst gaat maar door. In feite zijn ongestructureerde gegevens nu goed voor ongeveer 80 tot 90% van alle gegevens. Ondanks de overvloed en waarde blijven ongestructureerde gegevens een van de meest verspilde middelen voor ondernemingen, omdat bedrijven niet over de nodige tools beschikken om ze te extraheren en te analyseren.

Dit is aan het veranderen, aangezien de vraag naar big data-analyse en workflowautomatisering toeneemt, die beide gestructureerde gegevens vereisen. Een groeiend aantal bedrijven maakt gebruik van een technologie genaamd optische tekenherkenning (OCR), die het mogelijk maakt gedrukte of handgeschreven tekst om te zetten in machinegecodeerde tekst. Als op zichzelf staande technologie is OCR enigszins beperkt (daarover hieronder meer). Maar dankzij de trifecta OCR, Robotic Process Automation (RPA) en kunstmatige intelligentie (AI) kunnen bedrijven zeer geavanceerde niveaus van gegevensverwerking en automatisering mogelijk maken.

OCR is een van de belangrijkste componenten binnen twee UiPath-oplossingen:

UiPath Document Understanding maakt geautomatiseerde verwerking van een breed scala aan documenten mogelijk
UiPath AI Computer Vision waarmee ontwikkelaars kunnen automatiseren via virtuele desktops en in dynamische interfaces

Deze blog geeft een overzicht van OCR en onderzoekt hoe UiPath de technologie gebruikt om gegevensverwerking en -analyse van de volgende generatie mogelijk te maken.

Ten eerste is hier een korte introductie over OCR.

OCR:een overzicht

In termen van leken is OCR een proces dat tekst van afbeeldingen omzet in bewerkbare documenten.

OCR kan handmatige arbeid voor bepaalde taken verminderen en zelfs elimineren. Als gevolg hiervan kan het backend-workflows versnellen en werknemers de vrijheid geven om belangrijkere verantwoordelijkheden op zich te nemen.

Hier volgen enkele veelvoorkomende manieren waarop bedrijven OCR gebruiken.

1. Gegevensinvoer automatiseren

Handmatige gegevensinvoer is tijdrovend en foutgevoelig. Door OCR te gebruiken, kunnen bedrijven papierwerk digitaliseren, terwijl de noodzaak voor menselijke tussenkomst wordt geminimaliseerd en de integriteit van hun gegevens wordt vergroot.

2. Documenten bewerken (gescand of pdf)

Werknemers ontvangen vaak gescande documenten en faxmeldingen die niet in een bewerkbaar formaat zijn. Dit is gebruikelijk bij afdelingen als financiën, voorraadbeheer, personeelszaken, juridische zaken en naleving. Traditionele scanners kunnen alleen documenten exporteren als afbeeldingen of PDF's. U kunt bijvoorbeeld geen contract of inkooporder scannen en deze vervolgens bewerken in Microsoft Word of Google Docs. Met behulp van een OCR-engine is het echter mogelijk om de tekst te herkennen en te exporteren naar een machineleesbaar formaat voor verdere bewerking en verwerking.

3. Medewerkers met een visuele beperking in staat stellen

Werknemers met een visuele beperking moeten vaak papieren documenten omzetten naar digitale formaten. OCR kan helpen door geschreven tekst om te zetten in tekst-naar-spraak, waardoor het proces wordt gestroomlijnd.

4. Documenten ordenen

OCR kan automatisch verschillende stapels documenten sorteren en ordenen volgens specifieke regels. Een klassiek voorbeeld is het organiseren van facturen op basis van type of leverancier. Of in kritieke processen zoals het gebruik van multiline OCR (MLOCR) in een postsorteermachine die adressen scant en bepaalt hoe post door het postsysteem moet worden gerouteerd.

5. Tekst begrijpen via interfaces

OCR maakt het mogelijk om gegevens via externe interfaces te verwerken, waardoor teams op afstand sneller en gemakkelijker kunnen samenwerken.

De beperkingen van OCR

Hoewel OCR erg krachtig is, heeft het verschillende beperkingen wanneer het als zelfstandige technologie wordt gebruikt.

Hier zijn enkele van de belangrijkste beperkingen van OCR.

1. OCR kan op zichzelf geen gegevens begrijpen

Eerst en vooral kan OCR alleen tekst uit documenten digitaliseren en machineleesbaar maken. OCR kan gegevens niet begrijpen of interpreteren zonder een aanvullend mechanisme. Als zodanig wordt OCR vaak gebruikt als onderdeel van een grotere, intelligentere oplossing. Om echte procesautomatisering op grote schaal mogelijk te maken, worden OCR en RPA gecombineerd met AI.

2. OCR mist context

OCR-systemen missen ook context. Een OCR-systeem kan bijvoorbeeld een woord transcriberen als bail wanneer het eigenlijke woord bal is. Een OCR-engine heeft op zichzelf niet het cognitieve vermogen dat nodig is om de rest van de zin te scannen om te zien welk woord moet worden gebruikt. Om deze reden is OCR als op zichzelf staande technologie zeer foutgevoelig. Het vereist een mens-in-the-loop-component om de invoer op juistheid te controleren. Als gevolg hiervan heeft OCR op zichzelf geen optimale waarde als automatiseringstool.

3. OCR kan geen variabiliteit aan

Bovendien kan OCR de variabiliteit in de tekst of lay-out van een document niet aan, wat een groot probleem is bij het verwerken van documenten met een verschillende structuur.

4. OCR kan geen documenten scheiden

Er kunnen zich nog meer problemen voordoen als bestanden moeten worden opgesplitst in documenten voordat ze in een automatiseringsproces worden opgenomen of als er herhalingen zijn in de indexvelden of sleutelwaarden van een workflow.

5. OCR is niet nauwkeurig of schaalbaar

Uiteindelijk is pure OCR niet nauwkeurig of schaalbaar genoeg voor complexe en cognitieve processen. Bedrijven hebben oplossingen nodig die volwassen en flexibel zijn, in tegenstelling tot componenten die beperkt en foutgevoelig zijn.

Zoals u kunt zien, is OCR als een op zichzelf staande technologie niet geavanceerd genoeg om de geavanceerde zakelijke workflows van vandaag te ondersteunen. Maar in combinatie met RPA-software en AI kan OCR een uiterst nuttig hulpmiddel zijn. In het volgende gedeelte wordt onderzocht hoe UiPath OCR gebruikt om zeer nauwkeurige automatisering mogelijk te maken.

Use Case:OCR in UiPath Document Understanding

UiPath Document Understanding gebruikt RPA en AI om gegevens uit documenten te digitaliseren, zodat deze kunnen worden verwerkt en geanalyseerd. Document Understanding kan zowel gestructureerde als ongestructureerde gegevens verwerken en werkt met een verscheidenheid aan objecten, zoals handschrift, tabellen, selectievakjes en handtekeningen.

Document Understanding biedt vele voordelen, zoals nauwkeurige en flexibele documentverwerking, verhoogde operationele efficiëntie, verminderd risico op menselijke fouten en de end-to-end automatisering van complexe processen.

Opgemerkt moet worden dat technologie voor het begrijpen van documenten geen OCR is. Het feit dat de twee één in hetzelfde zijn, is een veel voorkomende misvatting. Documentbegrip is eerder een geavanceerde technologie die OCR gebruikt om tekst in niet-digitale documenten te digitaliseren.

Een opmerkelijk onderscheid is dat UiPath OCR loskoppelt van gegevensextractie. Veel bedrijven in deze ruimte gebruiken OCR met extractie. Door de twee te ontkoppelen, biedt UiPath meer keuze, flexibiliteit en nauwkeurigheid, omdat het mogelijk wordt om indien nodig een andere OCR-engine te selecteren zonder te verstoren wat er aan de extractiezijde gebeurt. Het is ook mogelijk om UiPath OCR-overheidscontracten te gebruiken om desgewenst uw eigen OCR-engine in te zetten.

Hoe Document Understanding OCR gebruikt

OCR komt al vroeg in het proces van het begrijpen van documenten van pas - onmiddellijk nadat de taxonomie in de workflow is geladen en alle bestanden en gegevens zijn gedefinieerd voor extractie.

Document Understanding maakt gebruik van OCR-engines om tekst te detecteren en te digitaliseren, zodat deze leesbaar is voor een robot. Van daaruit worden documenten geclassificeerd uit gespecificeerde lijsten, gegevens worden geëxtraheerd en - indien nodig - kan een mens de geëxtraheerde gegevens bevestigen voordat deze naar de relevante repository worden geëxporteerd.

UiPath Document Understanding kan zowel eigen UiPath Document OCR als OCR-engines van derden gebruiken om tekst te digitaliseren. Klanten kunnen de engine kiezen die het meest nauwkeurig werkt voor hun gebruik.

Zoals deze afbeelding laat zien, maakt OCR deel uit van het UiPath Document Understanding-raamwerk. Het enige doel is om tekst machine leesbaar te maken.

Gebruiksvoorbeeld:OCR in UiPath AI Computer Vision

UiPath AI Computer Vision lost een van de grootste uitdagingen in RPA op, namelijk het automatiseren van virtuele desktopinfrastructuur (VDI) zoals Citrix, VMware en Microsoft Windows Remote Desktop.

AI Computer Vision stelt softwarerobots in staat om alle elementen op een computerscherm te zien en te begrijpen, in plaats van te vertrouwen op verborgen eigenschappen om beslissingen te nemen. Met behulp van AI Computer Vision kunnen bedrijven en RPA-ontwikkelaars automatisering voor VDI's mogelijk maken, ongeacht het framework of het besturingssysteem.

AI Computer Vision maakt automatisering mogelijk met dynamische gebruikersinterface-elementen (UI), zoals vervolgkeuzemenu's en selectievakjes; ondersteunt een breed scala aan interfacetypes. Deze oplossing kan de implementatietijd bij het automatiseren van virtuele machines verkorten en tegelijkertijd de veerkracht en betrouwbaarheid van automatiseringen vergroten.

Hoewel AI Computer Vision wel gebruik maakt van OCR, wordt het niet gebruikt om documenten te digitaliseren. Dit is een subtiele, maar veel voorkomende misvatting.

Hoe UiPath AI Computer Vision OCR gebruikt

Het is onmogelijk om in virtuele omgevingen te automatiseren met behulp van standaard OCR en RPA, omdat een extern bureaublad uiteindelijk slechts een videofeed is. Er zijn geavanceerde oplossingen nodig om tekst te interpreteren en, nog belangrijker, om het type en het doel ervan binnen een interface te begrijpen.

AI Computer Vision maakt gebruik van een geavanceerd neuraal netwerk met een aangepaste scherm-OCR die de afgelopen jaren bij UiPath is ontwikkeld om een gebruikersinterface via een virtuele desktopfeed te analyseren en te begrijpen, zoals een mens zou doen. Deze oplossing kan gemakkelijk door elke beschikbare interface navigeren, op knoppen klikken, maar ook complexe interacties uitvoeren, zoals het extraheren van hele tabellen en interactie met vervolgkeuzemenu's.

Voor elementidentificatie gebruikt AI Computer Vision een tekstinterpretatietechniek die fuzzy matching wordt genoemd. Met deze techniek kan UiPath Robots elke keer het juiste element identificeren, zelfs als de OCR-resultaten inconsistent zijn, waardoor de betrouwbaarheid van de resulterende automatiseringen wordt verbeterd en de ontwikkelingstijd wordt verkort.

Breng OCR naar een hoger niveau met UiPath

Zoals u kunt zien, is het gebruik van een op AI gebaseerde oplossing met OCR enorm waardevol. UiPath Document Understanding en UiPath Computer Vision-tools gaan veel verder dan basis OCR, waardoor snelle en betrouwbare automatisering mogelijk is met schaalbaarheid voor ondernemingen, waardoor u de volledige waarde van uw gegevens kunt ontsluiten, inclusief wat ongestructureerd is of achter een VDI is vergrendeld.

Hier is een tabel om u te helpen beslissen of Document Understanding of Computer Vision geschikt is voor uw behoeften:

Klaar om uw documentgegevens en VDI-systemen aan het werk te zetten?

Registreer u om te beginnen voor de UiPath Automation Cloud, waar u vandaag nog kunt beginnen met het gebruik van UiPath Document Understanding en UiPath AI Computer Vision.

Start uw gratis UiPath Automation Cloud-proefversie om erachter te komen hoe eenvoudig het is om uw ongestructureerde gegevens te gebruiken om meer structuur en efficiëntie in uw bedrijfsprocessen te brengen.

De geschiedenis van AI:van futuristische fictie tot de toekomst van ondernemingen UiPath reageert op de raadpleging van de Europese Commissie over kunstmatige intelligentie

Automatisering Besturingssysteem

Productieproces

3d printen

Automatisering Besturingssysteem

Industriële technologie